Steuerungstasten

nächste Folie (auch Enter oder Spacebar).
vorherige Folie
 d  schaltet das Zeichnen auf Folien ein/aus
 p  wechselt zwischen Druck- und Präsentationsansicht
CTRL  +  vergrößert die Folien
CTRL  -  verkleinert die Folien
CTRL  0  setzt die Größenänderung zurück

Das Weiterschalten der Folien kann ebenfalls durch das Klicken auf den rechten bzw. linken Folienrand erfolgen.

Notation

Typ Schriftart Beispiele
Variablen (Skalare) kursiv $a, b, x, y$
Funktionen aufrecht $\mathrm{f}, \mathrm{g}(x), \mathrm{max}(x), \mathrm{h}[n]$
Vektoren fett, Elemente zeilenweise $\mathbf{a}, \mathbf{b}= \begin{pmatrix}x\\y\end{pmatrix} = (x, y)^\top,$ $\mathbf{B}=(x, y, z)^\top$
Matrizen Schreibmaschine $\mathtt{A}, \mathtt{B}= \begin{bmatrix}a & b\\c & d\end{bmatrix}$
Mengen kalligrafisch $\mathcal{A}, B=\{a, b\}, b \in \mathcal{B}$
Zahlenbereiche, Koordinatenräume doppelt gestrichen $\mathbb{N}, \mathbb{Z}, \mathbb{R}^2, \mathbb{R}^3$

Licht

  • Licht ist eine gequantelte, elektromagnetische Welle
  • Lichtgeschwindigkeit im Vakuum $c = 299\,792\,458 \frac{\mathrm{m}}{\mathrm{s}}$
  • Der sichtbarer Bereich liegt zwischen 380 bis 770 $\mathrm{nm}$
  • Sichtbares Licht einer bestimmten Wellenlänge entspricht einer Spektralfarbe
light_wavelength

Licht

  • Lichtquellen senden häufig ein breites Spektrum verschiedener Wellenlängen aus
  • Weißes Licht entsteht aus der Überlagerung vieler Wellenlängen (z.B. Tageslicht)
daylight
Spektrale Leistungsdichte von Tageslicht (CIE illuminant D65)
Wellenlänge $\lambda$
Rel.  spektrale  Leistung
Datenquelle für Abbildung: CIE D65 Reference Spectrum,

Lichtstrahlen

lightpaths
  • Licht wird von eine Lichtquelle emittiert
  • Einige Lichtstrahlen treffen evt. direkt ins Auge andere werden zunächst an einer Objektoberfläche reflektiert
  • Bei der Reflexion an der Objektoberfläche wird typischerweise ein Teil des Lichts absorbiert, d.h. das Licht verändert seine Farbe
  • Treffen die Lichtstrahlen ins Auge, werden Rezeptoren auf der Netzhaut aktiviert und im Gehirn formt sich ein Bild

Lochkamera

  • Eine Lochkamera besteht aus einem Kameragehäuse mit einem sehr kleinen Loch durch das das Licht eindringen kann
  • Das Bild formt sich an der Rückseite des Kameragehäuses und steht auf dem Kopf
  • Ein größeres Loch hat den Vorteil, dass mehr Licht in die Kamera eindringen kann, was zu kürzeren Belichtungszeiten führt
  • Der Nachteil ist, dass sich die Projektionen überlagern und das Bild unscharf wird
pinhole1
Objekt
Kamera
Loch
Abbildung
des Objekts
Größeres Loch

Hinzufügen einer Linse

Für dünne Linsen: $\frac{1}{d_o} + \frac{1}{d_i} = \frac{1}{f}$       

$f$ = , $d_o$ = , $d_i$ =

Brennweite $f$, Objektabstand $d_o$, Bildabstand $d_i$

Kamera-Objektiv

  • Ziel des Kamera Objektivs ist die Bündelung des Lichts auf die Bildebene der Kamera
  • Die Bündelung des Lichts kann aber nur perfekt für eine bestimmte Schärfenebene erfolgen, die parallel zur Bildebene im Raum liegt
  • Je größer die Entfernung von der Schärfenebene, desto unschärfer die Darstellung (d.h. größerer Unschärfekreis auf der Bildebene)
  • Das Hauptmerkmal eines Objektivs ist seine Brennweite $f$
    • Große Brennweite: Teleobjektiv
    • Kleine Brennweite: Weitwinkelobjektiv

Kamera-Objektiv

  • Mit nur einer Linse gibt es u.a. Probleme mit der chromatischen Aberration
  • Daher enthält ein Objektiv typischerweise eine Vielzahl von Linsen, um Störungen aufzuheben
chromatic_aberration

Kamera-Objektiv

  • Durch die Vielzahl an Linsen und deren Position und Form gibt es viele Freiheitsgrade, um das Design des Kamera-Objektivs zu optimieren
cooke_triplet
Cooke Triplet
Double Gauss Lens

Blende

  • Mechanische Regelung des Lichteinfalls durch kreisförmig angeordnete Lamellen
  • Je größer die Öffnung, desto mehr Licht
  • Je kleiner die Öffnung, desto größer die Schärfentiefe
aperture_animation

Blendenzahl (F-Stop)

  • Die Blendenzahl $k$ ist das Verhältnis der Brennweite $f$ zum Durchmesser $D$ der Blende
    $k = \frac{f}{D}$
  • Typische Blendenreihe:
    $k = $   1,4     2,0     2,8     4     5,6     8     11     16     22
  • Beispiel für ein Objektiv mit 50 mm Brennweite:
    $D = \frac{50{\small \,\mbox{mm}}}{1,4} = 35,7\,\mbox{mm}$    Kreisfläche: $\pi \, r^2= \pi \, \left(\frac{35,7{\small \,\mbox{mm}}}{2}\right)^2 \approx 100\,\mbox{mm}^2$
    $D = \frac{50{\small \,\mbox{mm}}}{2,0} = 25\,\mbox{mm}$         Kreisfläche: $\pi \, r^2= \pi \, \left(\frac{25{\small \,\mbox{mm}}}{2}\right)^2 \,\,\,\approx 50\,\mbox{mm}^2$
  • Die Kreisfläche halbiert sich mit jedem Schritt der Blendenreihe
  • Je größer die Blendenzahl, desto kleiner die Öffnung
  • Je größer die Blendenzahl, desto großer die Schärfentiefe

Blendenzahl (F-Stop)

aperture
1,4
2,0
2,8
4
5,6
8
11
16

Filmempfindlichkeit (ISO)

  • Empfindlichkeit des analogen Films
  • Der analoge Film besteht aus Silberhalogenid-Kristallen, die in Gel eingelagert sind
  • Je größer die Kristalle sind, desto lichtempfindlicher ist der Film
  • Je kleiner die Kristalle sind, desto höher ist die optische Auflösung
  • Die ISO-Zahl dient als Standard:
    • ISO 100 (für Sonnenschein)
    • ISO 200 (für bewölktes Wetter)
    • ISO 400 (für Innenräume, Dämmerung)
  • Eine Verdopplung der ISO-Zahl halbiert die Belichtungszeit
  • Je höher die ISO-Zahl, desto stärker das Bildrauschen
  • Digital cameras:
    • Photonenrauschen und elektronisches Rauschen
    • Digitalkameras haben auch eine ISO-Einstellung, die das Signal (und das Rauschen) verstärkt
    • Größere digitale Sensoren haben in der Regel ein besseres Signal-Rausch-Verhältnis (SNR)

Das Belichtungsdreieck

exposure_triangle
heller
heller
heller
Belichtungszeit
mehr
Bewegungsunschärfe
weniger
Bewegungsunschärfe
ISO
weniger
Rauschen
mehr
Rauschen
Blende
weniger
Schärfentiefe
mehr
Schärfentiefe

RGB-Farbmosaik

  • Um RGB-Werte mit einem einzelnen CCD- oder CMOS-Chip zu erfassen, werden die Pixel mit Farbfiltern bedeckt
  • Eine beliebte Anordnung ist die Bayer-Matrix
bayer_pattern

Farbwahrnehmung: Dreifarbentheorie

Beim Menschen gibt es zwei Systeme von Lichtsinneszellen:

  • System 1: Stäbchen, die ausschließlich auf Hell-Dunkel-Kontraste reagieren
  • System 2: Drei Arten von Farbrezeptoren
    • L-Zapfen
      wavelength_human_eye
      Wellenlänge $\lambda$
      Normalisierte Absorption
    • M-Zapfen
    • S-Zapfen
Datenquelle für Abbildung: J. K. Bowmaker, H. J. A. Dartnall: Visual pigments of rods and cones in a human retina., The Journal of Physiology, Volume 298, Issue 1, Jan. 1980

RGB-Farbraum

rgb_add rgb_interp
  • Additive Mischung von drei Grundfarben (Rot, Grün, Blau)
(Rot, Grün, Blau) Farbe
(1.0, 0.0, 0.0)
(0.0, 1.0, 0.0)
(0.0, 0.0, 1.0)
(1.0, 1.0, 0.0)
(1.0, 0.0, 1.0)
(0.0, 1.0, 1.0)
(0.0, 0.0, 0.0)
(0.5, 0.5, 0.5)
(1.0, 1.0, 1.0)
(0.2, 0.4, 0.0)
(0.8, 0.2, 0.3)

CIE RGB Farbraum

CIE_1931_chromaticity_diagram_CIERGB
alle wahrnehmbaren Farben
CIE RGB mit
positiven $R$, $G$, $B$
$x$
$y$

  • 1931 vom CIE entwickelter Farbraum basierend auf Tests mit Probanden
  • Drei Strahler: 700 nm (rot), 546,1 nm (grün), 435,8 nm (blau)
  • Frage: Können alle wahrnehmbaren Farben aus diesen drei Grundfarben gemischt werden?
  • Ergebnis: Ja, aber nicht alle Koeffizienten positiv
CIE1931_RGBCMF
$\bar{r}(\lambda)$
$\bar{g}(\lambda)$
$\bar{b}(\lambda)$
  • Eine beliebige spektrale Leistungsdichte $S(\lambda)$ kann wie folgt repräsentiert werden:
    ${\small R = \int\limits_0^\infty S(\lambda) \,\bar{r}(\lambda) \,d\lambda \quad\quad G = \int\limits_0^\infty S(\lambda) \,\bar{g}(\lambda) \,d\lambda \quad\quad B = \int\limits_0^\infty S(\lambda) \,\bar{b}(\lambda) \,d\lambda \quad\quad }$

CIE XYZ Farbraum

  • Lineare Transformation des CIE-RGB-Farbraums, so dass alle Farbabgleichsfunktionen nicht im negativen Bereich liegen
    $\small \begin{pmatrix} X \\ Y \\ Z \end{pmatrix} = \begin{bmatrix}0.49000 & 0.31000 & 0.20000\\ 0.17697 & 0.81240 & 0.01063 \\ 0.00000 & 0.010000 & 0.99000\end{bmatrix} \begin{pmatrix} R \\ G \\ B \end{pmatrix}$
  • Der Parameter $Y$ ist ein Maß für die Luminanz
  • Weißpunkt (energetischer Äquivalenzpunkt) liegt bei $X$ = $Y$ = $Z$ = $\frac{1}{3}$
CIE1931_XYZCMF
$\bar{x}(\lambda)$
$\bar{y}(\lambda)$
$\bar{z}(\lambda)$
  • Eine beliebige spektrale Leistungsdichte $S(\lambda)$ kann wie folgt repräsentiert werden:
    ${\small X = \int\limits_0^\infty S(\lambda) \,\bar{x}(\lambda) \,d\lambda \quad\quad Y = \int\limits_0^\infty S(\lambda) \,\bar{y}(\lambda) \,d\lambda \quad\quad Z = \int\limits_0^\infty S(\lambda) \,\bar{z}(\lambda) \,d\lambda \quad\quad }$
Datenquelle für Abbildung: cie.15.2004.tables.xls

CIE xy Chromatizitätsdiagramm

CIE_1931_chromaticity_diagram_CIERGB
alle wahrnehmbaren Farben
CIE RGB mit
positiven $R$, $G$, $B$
$x$
$y$
  • Projektion der CIE XYZ-Werte auf die folgende xy-Ebene
    $x = \frac{X}{X+Y+Z}$
    $y = \frac{Y}{X+Y+Z}$
  • Das Diagramm enthält die chromatischen Anteile aller wahrnehmbaren Farben
  • Die Luminanz ist für die Position im Diagramm nicht relevant

sRGB Farbraum

CIE_1931_chromaticity_diagram_sRGB
  • Aktueller Standard für Monitore, Webseiten, Bilder ohne explizites Farbprofil
  • RGB-Werte liegen im Bereich [0.0, 1.0]
  • Bereich der darstellbaren Farben ist kleiner als bei CIE RGB
  • Lineare Transformation zu CIE RGB und CIE XYZ, wenn vorher Gamma-Korrektur durchgeführt wird
    $\begin{pmatrix} X \\ Y \\ Z \end{pmatrix} = \begin{bmatrix}0.4124 & 0.3576 & 0.1805\\ 0.2126 & 0.7152 & 0.0722 \\ 0.0193 & 0.1192 & 0.9505\end{bmatrix} \begin{pmatrix} R_\mathrm{linear} \\ G_\mathrm{linear} \\ B_\mathrm{linear} \end{pmatrix}$

sRGB Gamma

sRGB_gamma
sRGB Gamma
2.2 Gamma
  • Digitale Bilder verwenden häufig nur 8-Bit (256 Werte) pro Farbkanal
  • Weil das menschliche Sehsystem bei der Unterscheidung von dunkleren Intensitäten besser ist als bei helleren, soll der wahrgenommene Quantisierungsfehler (Rundungsfehler) durch die nicht-lineare Gamma-Funktion verringert werden
  • sRGB-Werte sind näherungsweise linear in der Wahrnehmung aber nicht linear in gemessenen radiometrischen Werten
  • Die Funktion zur Dekodierung eines Farbkanals $C$ von sRGB in den radiometrisch linearen Farbraum lautet:
    ${\small C_\mathrm{linear}= \begin{cases}\dfrac{C_\mathrm{srgb}}{12.92}, & C_\mathrm{srgb}\le0.04045 \\[5mu] \left(\dfrac{C_\mathrm{srgb}+0.055}{1.055}\right)^{\!2.4}, & C_\mathrm{srgb}>0.04045 \end{cases}}$

Raw to sRGB

raw_pipeline
Raw Sensor Data
Linearization
Linearization Table
Black Subtraction
Black Level
Normalization
logical 0.0 to 1.0 range
Clipping
0.0 to 1.0 range
Demosaicing
Camera Color Space to XYZ
XYZ to sRGB
sRGB

YCbCr Farbraum

  • Der YCbCr-Farbraum wird häufig für digitale Bilder und Videos verwendet
  • ITU-R BT.709 Konvertierung
    $\begin{pmatrix} Y' \\ C_b \\ C_r \end{pmatrix} = \begin{bmatrix}0.2126 & 0.7152 & 0.0722\\ -0.11468 & -0.3854 & 0.5 \\ 0.5 & -0.4542 & -0.0458\end{bmatrix} \begin{pmatrix} R'\\ G'\\ B' \end{pmatrix}$
  • $Y$ ist die Luminanz (nicht-linear kodiert)
  • $C_b$ und $C_r$ sind die Chrominanz-Komponenten
  • $R'$, $G'$, $B'$ sind RGB-Werte (nichtlinear kodiert)
game pieces    game pieces    game pieces
Eingabebild
Luminanz
Chrominanz
Quelle: Eingabebild von Alexas_Fotos, Pixabay

YCbCr Farbunterabtastung

  • Im menschlichen Sehsystem sind die Stäbchen (für die Luminanz) dichter als die Zapfen (für die Chrominanz)
  • Daher kann, um Datenraten zu sparen, die Chrominanz im YCbCr-Farbraum mit einer niedrigeren Auflösung abgetastet werden
    chroma_subsampling2
    $Y$
    $C_b$
    $C_r$
  • Notation a : b : c
    • a ist die zu berücksichtigende Pixelbreite (normalerweise 4 Pixel)
    • b Anzahl der Abtastwerte für die Chrominanz in der ersten Reihe
    • c Anzahl der Abtastwerte für die Chrominanz in der zweiten Reihe

Formate für digitales Fernsehen

FormatSD (PAL / NTSC)HDUHD-1UHD-2
ITU-R Rec.BT.601BT.709BT.2020BT.2020
Bildzeilen576 / 480108021604320
Pixel pro Zeile720192038407680
Seitenverhältnis4:316:916:916:9
Bildfrequenz (FPS)50i / 60i24p - 60p24p - 120p24p - 120p
tv_formats

Formate für digitales Fernsehen

  • Digitale Video Formate werden typischerweise mit drei Parametern identifiziert:
  • Beispiele:
    • 576i50 bedeutet 576 Bildzeilen im Zeilensprungverfahren mit 25 Vollbildern (50 Halbbildern) pro Sekunde
    • 1080p30 bedeutet 1080 Bildzeilen mit 30 Vollbildern pro Sekunde

To be continued...

Gibt es Fragen?

questions

Anregungen oder Verbesserungsvorschläge können auch gerne per E-mail an mich gesendet werden: Kontakt

Weitere Vorlesungsfolien

Folien auf Englisch (Slides in English)