Steuerungstasten

nächste Folie (auch Enter oder Spacebar).
vorherige Folie
 d  schaltet das Zeichnen auf Folien ein/aus
 p  wechselt zwischen Druck- und Präsentationsansicht
CTRL  +  vergrößert die Folien
CTRL  -  verkleinert die Folien
CTRL  0  setzt die Größenänderung zurück

Das Weiterschalten der Folien kann ebenfalls durch das Klicken auf den rechten bzw. linken Folienrand erfolgen.

Notation

Typ Schriftart Beispiele
Variablen (Skalare) kursiv $a, b, x, y$
Funktionen aufrecht $\mathrm{f}, \mathrm{g}(x), \mathrm{max}(x), \mathrm{h}[n]$
Vektoren fett, Elemente zeilenweise $\mathbf{a}, \mathbf{b}= \begin{pmatrix}x\\y\end{pmatrix} = (x, y)^\top,$ $\mathbf{B}=(x, y, z)^\top$
Matrizen Schreibmaschine $\mathtt{A}, \mathtt{B}= \begin{bmatrix}a & b\\c & d\end{bmatrix}$
Mengen kalligrafisch $\mathcal{A}, B=\{a, b\}, b \in \mathcal{B}$
Zahlenbereiche, Koordinatenräume doppelt gestrichen $\mathbb{N}, \mathbb{Z}, \mathbb{R}^2, \mathbb{R}^3$

Digitalisierung von Audio

audio_interface_tascam

Schallausbreitung

  • Eine Schallquelle (wie unsere Stimme, ein Instrument, oder ein vorbeifahrendes Auto) versetzt ein elastischen Medium (wie Luft oder Wasser) in Bewegung
  • Dies verursacht eine Wellenausbreitung, bei der die Schwingungsrichtung der Ausbreitungsrichtung entspricht (Longitudinalwelle)
  • Analogie: Stein fällt ins Wasser
  • Die Ausbreitunsgeschwindigkeit der Schallwelle (Schallgeschwindigkeit) in Luft ist 343,2 m/s bzw. 1236 km/h
  • Es treten Absorption, Reflektion, Streuung, Beugung, usw. auf

Das menschliche Ohr

anatomy_ear
Steigbügel
Amboss
Hammer
Bogengänge
Hörnerv
Hörschnecke
Äußerer Gehörgang
Ohrmuschel
Trommelfell
16 kHz
6 kHz
0.5 kHz

Das menschliche Ohr

  • Die Schallwelle trifft auf das Trommelfell und wird über Amboss, Hammer und Steigbügel mechanisch verstärkt und in die Hörschnecke weitergeleitet
  • In den mit Flüssigkeit gefüllten Kammern des Schneckenkanals bildet sich abhängig von der Frequenz der Schallwelle eine Resonanz in einem bestimmten Bereich (hohe Frequenzen am Anfang und niedrige Frequenzen am Ende des Kanals)
  • Die Haarzellen auf der Basilarmembran entlang des Schneckenkanals werden mechanisch angeregt und geben die Information über den Hörnerv an den auditiven Cortex im Gehirn weiter
  • Das Ohr führt also eine Art Frequenztransformation durch
  • Der hörbare Frequenzbereich ist etwas 20 Hz bis 20 kHz (altersabhängig)
  • Bei großem Schallstress (Amplitude und Dauer der Belastung) und können die Haarzellen irreparabel geschädigt werden

Schalldruckpegel

  • Der Schalldruckpegel ist gebräuchlich, um die Lautstärke bestimmter Geräusche messtechnisch anzugeben
  • Dabei ergibt sich der Schalldruckpegel $L_p$ aus dem logarithmierten Verhältnis des Effektivwerts der Schalldruckwellen $\bar{p}_{\mathrm{rms}}$ und dem Referenzwert der Hörschwelle $\bar{p}_0$ des menschlichen Gehörs bei der Frequenz 1 kHz:
    $L_p = 20 \log\left(\frac{\bar{p}_{\mathrm{rms}}}{\bar{p}_0}\right) \mathrm{dB}$
  • Der Schalldruckpegel verwendet die Pseudoeinheit Dezibel (dB)
  • Schädigungen am Ohr ergeben sich ab ca. 120 dB bei kurzfristigen und ab ca. 85 dB bei langfristigen Beschallungen
Geräusch: Gewehr Trompete Diskothek Fernseher Unterhaltung Blätterrauschen
Abstand: 1 m 0.5 m 1 m 1 m 1 m am Ohr
Schalldruckpegel:170 dB130 dB 100 dB 60 dB 40-60 dB10 dB
Quelle: Wikipedia

Bezugsgröße für Dezibel-Angaben

audiolevel
  • In Audio-Systemen wird die Pseudoeinheit Dezibel für verschiedene Dinge verwendet. Es kommt immer auf die Bezugsgröße. Einige Beispiele:
    • Bei Signal-Rausch-Abstand (Signal-To-Noise-Ratio) werden Signal- und Rauschleistung ins Verhältnis gesetzt:
      $\mathrm{SNR} = 20 \log\left(\frac{\bar{p}_{\mathrm{signal}}}{\bar{p}_{\mathrm{noise}}}\right) \mathrm{dB}$
    • dBFS: Verhältnis der aktuellen Amplitude zur maximalen Amplitude (Decibels relative to full scale). Bei einem digitalem 16-Bit-Audiosignal sind maximal Amplituden von +32767 bis −32768 möglich:
      $20 \log\left(\frac{|A|}{32768}\right) \mathrm{dBFS}$
      0 dBFS wäre also die maximale Amplitude und -6 dBFS die halbe maximale Amplitude, -12 dBFS ein Viertel der maximalen Amplitude usw.

      Bei Signalpegeln über 0 dBFS kommt es bei digitalen Audiosignalen zum Clipping (Begrenzung auf den Maximalwert). Daher sollte 0 dBFS nicht überschritten werden.

Mikrofone

  • Ein Mikrofon setzt Schalldruckwellen in eine analoge elektrische Spannung um
  • Tpischerweise wird dazu die Bewegung einer dünnen Membrane gemessen, die durch die Schalldruckwelle angeregt wird
  • Wichtige Eigenschaften eines Mikrofons sind Frequenzgang und Richtcharakteristik
frequency_response_shure_sm58

Dynamische Mikrofone

dynamic_microphone
Tauchspulenmikrofon
  • Bei dynamische Mikrofonen wird nicht die Auslenkung der Membrane gemessen, sondern deren Positionsveränderung (Geschwindigkeit)
  • Eine weitverbreitete, robuste und kostengünstige Bauform ist das Tauchspulenmikrofon (siehe Bild)
  • Die Bewegung der Spule in dem Magnetfeld eines Permanentmagneten verursacht eine Induktionsspannung
  • Eine externe Spannungsversorgung wird nicht benötigt
  • Da die Membrane mit der Spule verbunden ist, müssen beide durch die Schalldruckwellen in Schwingung gebracht werden, weshalb Tauchspulenmikrofone hohen Frequenzen nicht so gut wiedergeben
  • Besonders geeignet für laute Schallquellen (wie Live-Gesang oder Bläser)

Kondensatormikrofone

condenser_microphone
Kondensatormikrofon
  • Beim Kondensatormikrofon wird eine dünne leitfähige Membrane als eine Plattenseite eines Plattenkondensator verwendet
  • Durch die Position der Membrane verändert sich die Kapazität des Kondensator
  • Durch Anschließen einer Spannungsquelle und eines parallelen hoch-ohmigen Widerstands kann die Kapazitätsänderung des Kondensators in Spannungänderung umgesetzt werden
  • Allerdings ist die Ausgangsspannung nicht direkt nutzbar. Es wird noch ein nachgeschalteten Impedanz-Umsetzer (Verstärker-Schaltung) innerhalb des Mikrofons benötigt
  • Da Kondensatormikrofone eine Spannungsquelle brauchen, müssen sie entweder mit Batterien oder einer 48-Volt-Phantomspeisung des Mischpults/Audio-Interface betrieben werden
  • Durch die geringe Masse der Membran sind Kondensatormikrofone sehr empfindich (gut für hochfrequente Anteile und weiter entferne Schallquellen)
  • Aufgrund Ihres guten Klangs sind sie besonders bei Studioaufnahmen beliebt (da hier externe Störgeräusche vermieden werden können)

Unsymmetrische und symmetrische Signalübertragung

  • Bei der Verkabelung von Instrumenten und Mikrofonen zum Mischpult oder zum Audio-Interface kommen oft lange Kabel zum Einsatz. Diese sind empfindlich gegenüber Einstreuungen.
  • Bei unsymetrischer Übertragung eines Mono-Audiosignals werden nur zwei Leitungen (Masse u. Signal) benötigt
  • Da die Massen aller Geräte verbunden sind, ist sie der gemeinsamer Potential-Bezugspunkt. Gibt es jetzt Einstreuungen auf einer Leitung oder Unterschiede beim Massepotential der Geräte (Masseschleife) wird die Störungen eventuell hörbar.
  • Bei symmetrischer Übertragung eines Mono-Audiosignals werden drei Leitungen (Hot, Cold u.  Masse) verwendet
  • Für die Cold-Leitung verwendet die Quelle das invertierte Hot-Signal
  • Beim Empfänger wird die Differenz gebildet und damit Einstreuungen eliminiert
symmetric audio
Signal
Masse
Hot
Cold
Masse
unsymmetrisch
symmetrisch
Differenzverstärker

Audiokabel

anatomy_ear
XLR Buchse
XLR Stecker
Klinkenstecker, 1⁄4 Zoll
Miniklinke, 3,5 mm (Stereo)
Cinch-Stecker

Audiokabel

  • Für die symmetrische Audioübertragung werden häufig XLR-Stecker und -Buchsen verwendet
  • Klinkenstecker gibt es in verschieden Größen:
    • 6,3 mm ("Grosse Klinke")
    • 3,5 mm (Miniklinke, "Kleine Klinke")
    • 2.5 mm (Micro-Klinke)
  • Klinkenstecker gibt es in Mono- (Masse u. Signal) oder Stereo-Varianten (Masse, linker und rechter Kanal)
  • Klinkenstecker und -buchsen werden typischerweise für unsymmetrische Audioübertragung eingesetzt
  • Aber Achtung: Stereoklinken bei einigen wenigen Audiogeräten auch für symmetrische Mono-Audioübertragung
  • Cinch-Stecker und -Buchsen bei werden für unsymmetrische Audioübertragung eingesetzt (typischerweise Line-Pegel)

Audiokabel und Signalpegel

  • Mikrofon-Pegel: schächstes Signal mit Amplituden von einigen Millivolt
    • Es wird typischerweise mit XLR-Kabeln symmetrische zum Audio-Interface/Mischpult übertragen
  • Instrumenten-Pegel: liegt zwischen Mikrofon- und Line-Pegel
    • Z.B. das Ausgangssignal einer E-Gitarre
    • Signal wird typischerweise unsymmetrisch per Klinkenkabel übertragen
  • Line-Pegel: Amplituden von ca. 0.5 bis maximal 2.0 Volt:
    • Dieser Pegel wird typischerweise von den Audiosystemen erwartet
    • Mikrophone-Level und Instrumenten-Pegel müssen durch einen Vorverstärker angehoben werden
    • dBu: Hier ist der Referenzwert ein Effektivwert von 0.775 V, d.h.
      $0 \,\mathrm{dBu}\, \mapsto 0.775\, \mathrm{V} $
    • dbV: Hier ist der Referenzwert ein Effektivwert von 1 V, d.h.
      $0 \,\mathrm{dBV}\, \mapsto 1.0\, \mathrm{V} $

Analog-Digital-Wandlung in einem Audio-Interface

adc
analoges Signal
digitales Signal
Vorverstärker
Anti-Aliasing-Filter
Sample & Hold
Quantisierer
sampling
Signal
digitalisiertes Signal
Zeit

Vorverstärker

  • Aufgabe des Vorverstärkers ist, die Amplitude des Eingangssignals anzupassen, sodass der mögliche Ampliutdenbereich des digitalen Signals möglichst gut ausgeschöpft wird
  • Das "Einpegeln" des Vorverstärkers wird im professionellen Bereich meist manuell durchgeführt, da automatische Verfahren nicht wissen, welche Signalpegel zu erwarten sind
  • Zu hoher Pegel: Oberhalb 0 dbFS tritt Clipping auf
  • Zu niedriger Pegel: Quantisierungsrauschen macht sich bemerkbar

Anti-Aliasing-Filter

  • Um das Abtasttheorem einzuhalten, wird vor der Abtastung ein analoger Tiefpassfilter eingesetzt
  • Der Tiefpassfilter muss so gewählt werden, dass dessen Grenzfrequenz der halben Abtastfrequenz $F_a$ entspricht

Sample & Hold

  • Die Sample-and-Hold Schaltung (siehe unten) dient dazu den analogen Eingangswert während der nachfolgendes Quantisierung konstant zu halten
  • Der elektronische Schalter (Transistor) wird für kurze Zeit geschlossen, der Kondensator läd sich auf und übernimmt den aktuellen Spannungswert des Eingangssignals (sample). Dann wird der Schalter wieder geöffnet.
  • Ist der Schalter geöffnet, ist es die Aufgabe des Kondensators den Spannungswert konstant zu halten (hold)
  • Dieser Vorgang wiederholt sich mit der Abtastfrequenz $F_a$
sampling
Operationsverstärker
(Impedanzwandler)
Schalter (Transistor)
F_a
C
Operationsverstärker
Eingangsssignal
Ausgangssignal

Quantisierer

  • Bei der Audioverarbeitung werden typischerweise Quantisierer mit ≥ 16 Bit Auflösung verwendet
  • Bei Audiosignalverarbeitung kommt daher heutzutage fast ausschließlich Delta-Sigma-Modulation bei der A/D-Wandlung zum Einsatz
  • Die Idee ist dabei, dass nicht viele analoge Komparatorschaltungen parallel betrieben werden (bei 16 Bit bräuchte dies 216 = 65536) sondern nur ein Komparator, der bei einem Vielfachen der Abtastfrequenz arbeitet
  • Dazu wird der Fehler des Komparators in jedem Zeitschritt aufsummiert bis dieser wieder über- bzw. unter der Entscheidungsschwelle des Komparators liegt
  • Ein nachgeschalteter digitaler Zähler, kann dann ermitteln, wie oft die Detektionsschwelle über- bzw. unterschritten wurde, um den quantisierten digitalen Wert zu bestimmen
  • Beispiel: Bei eine Abtastrate von 48000 Hz und einer 16 Bit Auflösung muss der Delta-Sigma-Modulator mit 48000 Hz · 216 = 3.15 GHz betrieben werden
  • Im folgenden wird ein Delta-Sigma-Modulator 1. Ordnung gezeigt. In der Praxis kommen Delta-Sigma-Modulatoren höherer Ordnung (d.h. mit mehreren Integrationstufen) zum Einsatz, die einen besseren Signal-Rauschabstand haben. Das Prinzip bleibt aber gleich.

Quantisierer: Delta-Sigma-Modulation

  • Der analoge Komparator ist eine Transisitorschaltung, die folgende Funktion implementiert:
    $V_{\mathrm{out}}= \begin{cases} 1 & \,\,:\,\, V_{\mathrm{in}} \ge 0.0 \\ 0 & \,\,:\,\,V_{\mathrm{in}} < 0.0 \\ \end{cases}$
    wobei $1$ für den Wert für die digitale Eins steht.
  • Das D-Flipflop (aus Technischer Informatik bekannt) realisiert einen Takt Verzögerung
  • Der 1-bit D/A-Wandler gibt aus:
    $V_{\mathrm{out}}= \begin{cases} V_{\mathrm{max}} & \,\,:\,\, V_{\mathrm{in}} \ge 0.5\\ -V_{\mathrm{max}} & \,\,:\,\,V_{\mathrm{in}} < 0.5\\ \end{cases}$
    wobei $0.5$ für den Grenzwert zwischen der digitalen Eins und der der digitalen Null steht.

Quantisierer: Delta-Sigma-Modulation Beispiel

Linear Puls Code Modulation (LPCM)

  • Augabe des Quantisierers ist eine sogenannte Puls Code Modulation (PCM), also ein Datenstrom von digitalen Einsen und Nullen
  • Bei einem 16-Bit Quantisier sind 216 = 65536 verschiedene 16-bit Binarcode-Wörter zur Verfügung, die den einzelnen Quantisierungsniveaus zugeordnet werden können
  • Häufig werden vorzeichenbehaftete Zahlen im Zweierkomplement (siehe Technische Informatik) verwendet
  • Beim 16-Bit Zweierkomplement ergibt sich damit ein Wertebereich von +32767 bis -32768

Linear Puls Code Modulation (LPCM)

  • Beispiel für 3-Bit LPCM:
pcm
Serielles
PCM Signal
Codewort
(Zweierkomplement)

Linear Puls Code Modulation (LPCM)

  • Audio-CD
    • Ein vorzeichenbehaftetes 16-Bit LPCM Signal mit eine Abtastrate von 44100 Hz wird bei einer Audio CD ("Compact Disc Digital Audio") verwendet
    • Dabei werden immer abwechselnd 16-Bits für den linken und dann 16-Bits für den rechten Kanal geschrieben
    • Die Nutzdatenrate ist somit 2 · 16 bits · 44100 1/s = 1.41 MBit/s
  • DVD-Audio
    • Verwendete ebenfalls ein vorzeichenbehaftetes LPCM Signal
    • Verschiedene Quantisierungen möglich: 16 / 20 / 24 Bit pro Sample
    • Verschiedene Samplingraten: 44.1 / 48 / 88.2 / 96 / 176.4 / 192 kHz
    • 1 Kanäle bis 6 Kanäle (maximale Datenrate: 9,6 MBit/s)
  • WAV-Audiodateien
    • Das weit verbreitete WAV-Format ("Waveform Audio File Format") ist ein Container, der verschiedene Audio-Formate beinhalten kann
    • In der Praxis enthalten WAV-Dateien meistens unkomprimierte LPCM-Audiodaten

Nicht-lineare Puls Code Modulation

  • Bei der PCM wird auch mit nicht-linearen Quantisierungsintervallen gearbeitet
  • Dazu wird dem linearen Quantisierer ein Kompressor vorgeschaltet
  • Ziel ist eine Anpassung an das menschliche Gehör, das leise Geräusche stärker wahrnimmt als laute (logarithmisch)
  • Der Amplitudenbereich wird in Segmente eingeteilt, in denen dann jeweils linear quantisiert wird
  • Beispiel: Digitale Telefonübertragung (ISDN)
    • 1 Bit Vorzeichen, 3 Bit Segment, 4 Bit Quantisierungswert
    • Abtastrate: 8 kHz
    • Datenrate: 8 Bit · 8 kHz = 64 kBit/s
  • Beim Empfänder muss dann nach der D/A-Wandlung ein entsprechender Expander angewendet werden (als Gegenstück zum Kompressor)
pcm
Anti-Aliasing-Filter
(Tiefpass)
A/D-Wandler
D/A-Wandler
Kompressor
Expander
Rekonstruktionsfilter
(Tiefpass)
Sender
Empfänger
Telefonkanal

Nicht-lineare Puls Code Modulation: Kompressor

compressor
1 Bit Vorzeichen
3 Bit Segmentcode
4 Bit pro Segment

Digital-Analog-Wandlung

pcm
Analoges Signal nach Tiefpassfilterung
Analoge Rechteckfunktion
Digitale Repräsentation
  • Wie aus Kapitel "Abtasttheorem" bekannt, müssten wir für eine Digital-Analog-Wandlung das digitale Signal in anaologe Dirac-Impulse mit ensprechender Höhe umwandeln und anschließend ein Rekonstruktionsfilter (Tiefpass) anwenden
  • Das ist in der Praxis natürlich nicht ideal realisierbar
  • Stattdessen könnte einfach eine entsprechende Rechteckfunktion mit entsprechenden vielen Spannungsniveaus ausgegeben werden, die dann mit dem Rekonstruktionsfilter geglättet wird

Digital-Analog-Wandlung

  • Eine solche Rechteckfunktion könnte z.B. mit einem R2R-Netzwerk erzeugt werden, aber für hohe Bittiefen sind die Anforderungen an die Genauigkeit der Widerstände extrem groß
  • Daher werden in der Praxis auch zu D/A-Wandlung Delta-Sigma-Modulatoren eingesetzt, die im GHz-Bereich betrieben werden können und ein sehr hochfrequentes High-Low-Analogsignal erzeugen, das bei Filterung mit einem analogen Tiefpass (Grenzfrequenz z.B. 20 kHz) das gewünschte analoge Audiosignal generiert
pcm
Ausgabe der Delta-Sigma-Modulation
Tiefpass
Analoges Signal

Gibt es Fragen?

questions

Anregungen oder Verbesserungsvorschläge können auch gerne per E-mail an mich gesendet werden: Kontakt


Weitere Vorlesungsfolien