arrow_back 강의
calendar_month 여름 학기

기계 인식과 추적

센서, 검출, 보정, 칼만 필터 및 다중 객체 추적.

센서검출보정칼만 필터추적
기계 인식과 추적

강의 개요

flag 학습 목표

  • check_circle 차량 인식용 센서 시스템(카메라, LiDAR, 레이더) 모델링 및 보정
  • check_circle 고전 및 딥러닝 기반 객체 탐지 방법 적용
  • check_circle 확률론적 필터(칼만, 파티클) 처음부터 구현
  • check_circle 완전한 다중 객체 추적 시스템 설계 및 프로젝트 시연

calendar_month 수업 정보

시간

Mo 09:15 – 12:30

강의실

11.3.002

학기

여름 학기

평가 방식

프로젝트 작업

주차별 계획

주차 1

머신 퍼셉션 소개

인식 시스템 개요, ADAS 응용 분야, 시스템 아키텍처.

주차 2

센서 시스템

카메라, LiDAR, 레이더 모델, 특성, 장단점.

주차 3

고전적 객체 탐지

Viola-Jones 검출기, HOG+SVM, 슬라이딩 윈도우 방법.

주차 4

딥러닝 기반 탐지

YOLO 종단 간 탐지, 3D 포인트 클라우드용 PointNet.

주차 5

좌표계 및 보정

핀홀 카메라 모델, Zhang 보정 방법, 센서 융합 기하학.

주차 6

확률론적 기초

베이즈 추론, 마르코프 체인, 은닉 마르코프 모델, 최소 분산 추정.

주차 7

칼만 필터

예측-보정 순환, 최소 분산 추정, 선형 시스템.

주차 8

확장 및 무향 칼만 필터

EKF 선형화, UKF 시그마 포인트 변환, 비선형 시스템.

주차 9

파티클 필터

순차적 몬테 카를로 방법, 리샘플링 전략, 비모수 추정.

주차 10

IMM 및 기동 인식

상호 작용 다중 모델, 모드 전환, 기동 인식.

주차 11

데이터 연관

최근접 이웃, 확률적 데이터 연관(PDA), JPDA, 헝가리안 알고리즘.

주차 12

다중 객체 추적 및 프로젝트 발표

트랙 관리, 시스템 통합, 최종 프로젝트 발표.

강의 노트

1. Überblick

Die Vorlesung führt in die vollständige Wahrnehmungs- und Tracking-Pipeline für technische Systeme ein und verbindet klassische Computer Vision, Sensorik, probabilistische Modellierung, Kalman-Filter und Multi-Target-Tracking. Typische Anwendungsdomänen umfassen autonomes Fahren, Luftraumüberwachung, Robotik, Videoanalyse und medizinische Technik.

Die Vorlesung ist in drei Phasen gegliedert: Wahrnehmung, Probabilistik und Tracking.


2. Prüfungsformat und Semesterstruktur

Die Veranstaltung nutzt ein Portfolio-Assessment mit einem semesterlangen Teamprojekt (DFB-Videoanalyse) sowie drei Moodle-Quizzes:

  • Wahrnehmungs-Quiz,
  • Wahrscheinlichkeits-/Stochastik-Quiz,
  • Tracking-Quiz.

3. Einführung: Maschinelle Wahrnehmung

Maschinelle Wahrnehmung bezeichnet den Prozess, durch den Maschinen ihre Umgebung erfassen und mögliche Aktionen ableiten. Historische Entwicklung von früher Bildverarbeitung zu modernem Deep Learning, Multi-Object-Tracking, CNNs, GANs und Transformern.


4. Sensortechnologien

4.1 Kamerasensoren

Kameras als passive optische Sensoren. CCD- und CMOS-Sensoren, Farbfilterarrays (RGGB-Bayer-Muster), Aberrationen und Linsenverzerrung.

Bildverarbeitungsoperationen:

  • Kantendetektion: Sobel-Gradienten, Morphologie, Hysterese-Schwellenwert,
  • Eckendetektion: Moravec-Detektor, Harris-Detektor, Nicht-Maximum-Unterdrückung,
  • Optischer Fluss: Lucas-Kanade-Methode für pixelweise Bewegungsschätzung.

4.2 LiDAR

Aktiver Sensor mit Laser-Laufzeitmessungen (ToF). Rotierende Spiegel für weites Sichtfeld. Typische Wellenlängen 900 nm und 1550 nm.

Verarbeitungsstufen der Punktwolke: Filterung, Extraktion von Interesse-Punkten, Segmentierung, Klassifikation, Posenschätzung.

4.3 Radar

Aktiver elektromagnetischer Sensor. Impulsradar und Dauerwellenradar. Doppler-Frequenz und Radialgeschwindigkeit. FMCW-Radar für gleichzeitige Entfernungs- und Geschwindigkeitsmessung. Vergleich von LiDAR und Radar nach Wellenlänge, Auflösung und Wetterfestigkeit.


5. Objektdetektion

5.1 Metriken für Objektdetektoren

Konfusionsmatrix, Präzision, Recall, Intersection over Union (IoU), Precision-Recall-Kurven, Average Precision (AP), mean Average Precision (mAP).

5.2 Viola-Jones-Gesichtsdetektion

Haar-Wavelet-Merkmale, Integralbilder zur effizienten Merkmalsauswertung, AdaBoost zur Merkmalsauswahl, Kaskaden-Klassifikatoren und Bildpyramiden für Skalierungsinvarianz.

5.3 Dalal-Triggs HOG + SVM

Fußgängerdetektion durch: Kontrastkorrektur, Gradientenberechnung, Histogramme of Oriented Gradients (HOG), Blocknormalisierung und lineare SVM-Klassifikation.

5.4 YOLO – You Only Look Once

CNN-basierter Objektdetektor mit Gitterstruktur. Jede Zelle sagt Bounding-Box-Offsets, Objektkonfidenz und Klassenwahrscheinlichkeiten voraus. Trainiert mit Verlust über Koordinaten, Konfidenz und Klassen.

5.5 PointNet für LiDAR-Punktwolken

Deep Learning auf ungeordneten Punktmengen. PointNet verarbeitet direkt 3D-Koordinaten und lernt lokale und globale Merkmale ohne Voxelisierung.


6. Koordinatensysteme, Kalibrierung und Projektion

6.1 Homogene Koordinaten

Homogene Darstellung in 2D und 3D: Punkte, Geraden, Ebenen. Punkte im Unendlichen mit w = 0. Affine Transformationen als Matrixmultiplikationen in homogenen Koordinaten.

6.2 Transformationen

Translationen, Rotationen und konkatenierte Transformationen. Rotationsmatrizen um x-, y-, z-Achsen. Reihenfolge der Matrizenmultiplikation ist entscheidend. Roll, Pitch, Yaw — Konventionen aus Luftfahrt und Automobilindustrie.

6.3 Kamerakalibrierung und Projektion

Modellierung der Kamera als System zur Abbildung von 3D-Weltkoordinaten auf 2D-Sensorkoordinaten.

  • Extrinsische Parameter: Position und Rotation der Kamera in der Welt,
  • Intrinsische Parameter: Abbildung von Bild- auf Sensor-/Pixelkoordinaten.

Themen: Perspektivprojektion, Brennweite, Kalibrierungsmatrix, Direct Linear Transformation (DLT), Pixelseitenverhältnis, Hauptpunkt, nichtlineare Linsenverzerrung mit radialen Verzerrungsparametern.


7. Stochastische Prozesse und Hidden Markov Models

Stochastische Prozesse als Folgen von Zufallsvariablen. Markov-Eigenschaft: der nächste Zustand hängt nur vom aktuellen Zustand ab.

Themen:

  • Markov-Prozesse,
  • Random Walk und Brownsche Bewegung,
  • Beispiele für Markov-Verletzungen und State-Design zur Wiederherstellung der Markov-Eigenschaft,
  • Hidden Markov Models (HMMs): echter Zustand ist nicht direkt beobachtbar,
  • Beobachtungsvariablen abhänging nur vom aktuellen verborgenen Zustand,
  • Vorwärtsalgorithmus für rekursive Zustandsinferenz aus Beobachtungen.

8. Minimale-Varianz-Fusion

Grundlage des Kalman-Filters: Fusion mehrerer Messungen mit minimaler Ergebnisvarianz.

  • Zwei Gauß’sche Messungen werden so kombiniert, dass der Schätzwert unverzerrt und varianzminimal ist,
  • Zuverlässigere Sensoren werden stärker gewichtet,
  • Erweiterung auf mehrere unkorrelierte Messungen,
  • Sonderfall: wiederholte Messungen gleicher Varianz ergeben das arithmetische Mittel.

9. Kalman-Filter

9.1 Linearer Kalman-Filter

Zustandsraumodell mit Transitionsmatrix, Beobachtungsmatrix und Rauschmodellen. Zwei Phasen:

  1. Prädiktionsschritt: Zustand und Kovarianz aus dem Systemmodell voraussagen,
  2. Aktualisierungsschritt: Kalman-Gain berechnen, Innovation einfügen, Kovarianz aktualisieren.

Der Kalman-Gain ist die optimale Gewichtung zwischen Systemprädition und Messung.

9.2 Erweiterter Kalman-Filter (EKF)

Linearisierung nichtlinearer Systemfunktionen über Jacobi-Matrizen. Anwendbar für kurvenlineare Bewegungsmodelle und nichtlineare Sensoren.

9.3 Unscented Kalman-Filter (UKF)

Sigma-Punkt-Methode für bessere Approximation nichtlinearer Transformationen ohne Jacobi-Ableitung.

9.4 Partikel-Filter

Monte-Carlo-basierter Filter für allgemeine nichtlineare Zustandsraummodelle. Gewichtete Partikel repräsentieren die Zustandsverteilung. Resampling zur Vermeidung von Partikeldegeneration. Genauer als Kalman-Filter für stark nichtlineare Probleme.

9.5 Interacting Multiple Models (IMM)

Kombination mehrerer Bewegungsmodelle in parallelen Filtern mit Modellwahrscheinlichkeiten für adaptive Modellauswahl.


10. Datenassoziation

Zuordnung von Messungen zu bekannten Tracks (Spuren). Behandelte Methoden:

  • Nearest-Neighbor (NN): einfachste Methode — jeder Messung wird der nächste Track zugeordnet,
  • Probabilistische Datenzuordnung (PDA): mehrere Messhypothesen werden gewichtet kombiniert,
  • Joint PDA (JPDA): berücksichtigt alle Messung-Track-Kombinationen gleichzeitig,
  • Hungarian Algorithm / Optimal Assignment: optimale globale Zuordnung über Kostenfunktionen,
  • Gating: Ablehnung unplausibler Messungen über Mahalanobis-Distanz vor der Zuordnung.

11. Track-Management und Multi-Target-Tracking

Track-Lebenszyklus: Initialisierung neuer Tracks (tentativ), Bestätigung durch Akkumulation von Evidenz, Löschung bei fehlendem Nachweis.

Tracking-by-Detection-Paradigma: Detektor liefert Messungen pro Frame, Tracker verwaltet Zustand und Identität über Zeit.

Themen:

  • Multiple Hypothesis Tracking (MHT) für robuste Zuordnung bei Okklusionen,
  • Spurwechsel, Okklusionen, Spurinitialisierung und -beendigung,
  • Bewertungsmetriken für Multi-Target-Tracking (CLEAR MOT: MOTA, MOTP, ID Switches).

12. Themenübersicht

BlockHauptthemen
SensorenKamera (CCD/CMOS), LiDAR, Radar, FMCW
BildverarbeitungSobel, Morphologie, Harris-Ecken, optischer Fluss
ObjektdetektionViola-Jones, HOG+SVM, YOLO, PointNet
GeometrieHomogene Koordinaten, Rotation/Translation, Kamerakalibrierung, Projektion
StochastikMarkov-Prozesse, HMMs, Vorwärtsalgorithmus
SensorfusionMinimale-Varianz-Fusion
FilterungKalman-Filter, EKF, UKF, IMM, Partikelfilter
TrackingDatenassoziation, Hungarian Method, PDA/JPDA, Track-Management