600 likes | 796 Views
Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011. Übersicht. I Theorie Das Oszillogramm Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis. Das Oszillogramm . Oszillogramme einfacher Sinussignale.
E N D
Von Spektren und FormantenGrundlagen akustischer Analyse und ManipulationMartin Meyer/Franziskus Liem 28.03.2011
Übersicht • I Theorie • Das Oszillogramm • Fourier Transformation, Spektrum und Spektrogramme • Formanten • II Praxis
Das Oszillogramm • Oszillogramme einfacher Sinussignale
Das Oszillogramm • Oszillogramme einfacher Sinussignale
Das Oszillogramm • 2 Dimensionen • x: Zeit • y: Auslenkung (durch Schall entstandene Luftdruckschwankungen) • Was kann man daraus ablesen? • Amplitude • Ausschlag/Auslenkung des Signals • → Lautstärke • Frequenz • Anzahl der Nulldurchgänge innerhalb einer Sekunde • bzw. 1/Periodendauer • Hertz [Hz] • → Tonhöhe
Das Oszillogramm • Wie unterschiedlich sind die beiden Töne?
Übersicht • I Theorie • Das Oszillogramm • Fourier Transformation, Spektrum und Spektrogramme • Formanten • II Praxis
Fourier Transformation • Überlagerung zweier Schwingungen → Addition zu einer neuen www.germanistik.unibe.ch
Fourier Transformation • Jedes (auch noch so komplexe) periodische Signal (zB Sprache) stellt eine Addition einfacher Sinusschwingungen dar • Die FT zerlegt ein komplexes Signal in einzelne Sinusschwingungen mit unterschiedlicher Frequenz
Fourier Transformation 100 Hz 200Hz Energie (Amplitude) FT Oszillogramm Spektrum
Spektrum • 2 Dimensionen • Frequenz [Hz] • Energie - Schalldruckpegel (Sound Pressure Level - SPL) [dB/Hz] • Dezibel - dB • Logarithmische Hilfseinheit • Faustregel: +10 dB entspricht ungefähr der doppelten Lautstärke Schallereignis (Pa) Referenzdruck (Pa)
Spektrum • Welches Signal ist lauter, höher?
Spektrum 14
Spektrum 440 Hz + 1000Hz =
Spektrum • Wie sieht das Spektrum aus? 440 1000
Spektrum • Was kann aus einem Spektrum ablesen? • Verteilung der Frequenzen und ihre Intensität → Klangfarbe Klangfarbe Im Zeitbereich Im Frequenzbereich Meyer et al. (2006)
Spektrum • Abfallend oder Ansteigend?
Spektrum • Keine Aussage über Veränderungen, Trends über die Zeit • → gut geeignet, um durchschnittliche Charakteristik eines Signals bzw. eingeschwungene Signale darzustellen • Sprache, Musik… sind zeitlich sehr komplexe Signale • → Darstellung im Spektrogramm
Spektrogramm (=Sonagramm, Sonogramm) • 3 Dimensionen • x: Zeit • y: Frequenz • z (Schwärzung): Energie (Intensität)
Spektrogramm • Was kann man daraus ablesen? • Verteilung der Frequenzen und ihre Intensität • Verlauf über die Zeit
Spektrogramm • Abfallend oder Ansteigend?
Übersicht • I Theorie • Das Oszillogramm • Fourier Transformation, Spektrum und Spektrogramme • Formanten • II Praxis
Das Quelle-Filter-Modell der Vokalproduktion • Quelle-Filter-Modell • ein Filter lässt bestimmte Frequenzen passieren & dämpft andere
Resonanzfrequenz • je grösser das Objekt desto tiefer fres Quelle Filter Output Rauschen Resonator gefiltertes Rauschen
Vokaltrakt als Resonator • Vokalproduktion Quelle Filter Output Stimmlippen Vokaltrakt Sprache
Formanten Entstehung einer Lautäusserung - Quelle/Filter-Theorie supralaryngal Ansatzrohr (Mund-, Nasen-, Rachenraum (Pharynx)): Artikulation = Modulation / Filterung des Quellsignals → Ausdifferenzierung der Phoneme →Formanten Larynx (Kehlkopf): Phonation = Erzeugung eines akustischen Signals (Schwingung der Stimmbänder mit Grundfrequenz f0) - Quellsignal → Tonhöhe (f0), Stimmqualität (zB gepresst) laryngal Lunge: Luftdruck → Lautstärke sublaryngal Fitch (2000) logopaedie.rwth-aachen.de
Vokaltrakt (Ansatzrohr) als Resonator • mehrere Resonanzräume -> mehrere Resonanzfrequenzen www.ims.uni-stuttgart.de
je nach Stellung der Artikulatoren unterscheiden sich die Formantfrequenzen
Formanten • Supralaryngale Artikulatoren • Zunge • Lippen • Gaumensegel
Formanten • Quellsignal: f0 & Harmonische (ganzzahlige Vielfache von f0) • Je nach Geometrie und Stellung der Artikulatoren können bestimmte Frequenzen in Resonanz schwingen. • Es ergeben sich Amplitudenmaxima • → Formanten: Konzentration akustischer Energie in einem Frequenzband
Formanten • Konzentration akustischer Energie in einem Frequenzband • Im Spektrogramm sichtbar Filter
FormantenIm Spektrogramm Fitch (1997)
•Frequenzbereiche erhöhter Intensität heissen Formanten • Filtering by formants • (bandpass filter, Vokaltrakt Resonanzen) • • Formanten – schnelle Modifikation durch Artikulatoren (Zunge, Lippe, Gaumen, Zäpfchen) • • Formant – keinen Einfluss auf Tonhöhe, welche in der Larynx modifiziert werden. • • („Beet, Bett, beten“)
Vokalraum Englisch Deutsch
Übersicht • I Theorie • II Praxis • Praat • Darstellung akustischer Signale • Signalfilter - Hochpass, Tiefpass, Bandpass - Flüstern & Delexikalisieren • Suprasegmentale Manipulationen - Prosodie, akustische Geschlechtsumwandlung • Segmentale Manipulation - VOT • Signalvorverarbeitung - Normalisierung
Praat • Soundanalyse, -manipulation… • Für viele Plattformen (Win, OS X, Linux…) • Gratis, offen • Viele Tutorials im Internet • Gute On- und Offline Hilfe • Stapelverarbeitung via Skripten möglich • tw. etwas gewöhnungsbedürftiges Handling www.praat.org
Objects Befehle Ausgabefenster Hauptfenster
Eigene Soundfiles aufnehmen • Vokale & Konsonanten • Einen kurzen Satz (mit viel Melodie) • New -> record mono sound… -> Record -> SPRECHEN • Stop -> Save to list & close • Write -> Write to wav file
Darstellung akustischer SignaleOszillogramm • File laden • Read… → Read from file → jutta.wav • Abspielen • Play • Edit • Abspielen mit Tabulator • Zoomen • Intensity → Show Intensity • Pitch → Show Pitch (in etwa f0) (Achtung: 2. Achse) • Formant → Show Formants
Darstellung akustischer SignaleSpektrum • Spektrum erstellen • Analyse → Spectrum → To Spectrum... • Abspielen: Tabulator • Frequenzbereiche markieren und abspielen • Zeichnen • Draw...
Suprasegmentale ManipulationenAkustische Geschlechtsumwandlung • f005.wav und m005.wav • Synthesize → Convert → change gender… • Formant shift ratio • Duration factor Lattner et al. (2005)
Suprasegmentale ManipulationenFlattening • Sound 1a06 → Manipulate → To Manipulation... • Manipulation 1a06 → Extract Pitch Tier • Edit • Remove Points • Add Point • Replace Pitch Tier • Manipulation 1a06 & PitchTier untiteled gleichzeitig markieren • → Replace Pitch Tier • Flattened soundfile erstellen • Manipulation 1a06 • Play (overlapp-add) • Get resynthesis (overlapp-add) • Sound 1a06 • Write → Write to WAV file… • + weiter Melodieverläufe erstellen
Suprasegmentale ManipulationenFlattening Meyer et al. (2004)