170 likes | 338 Views
Tutorium zur Einführung in die Phonetik II - Akustik. Anmerkungen zu Teil 2. angelikaberwein@yahoo.de. Rohschallspektrum. Rohschall an der Glottis: Amplitude der Obertöne fallen um ca. 12 dB pro Oktave ab -> z. B. 200 Hz: 60 dB 400 Hz: 48 dB 800 Hz: 36 dB. Übertragungsfunktion des Filters.
E N D
Tutorium zur Einführung in die Phonetik II - Akustik Anmerkungen zu Teil 2 angelikaberwein@yahoo.de
Rohschallspektrum Rohschall an der Glottis:Amplitude der Obertöne fallen um ca. 12 dBpro Oktave ab-> z. B. 200 Hz: 60 dB 400 Hz: 48 dB 800 Hz: 36 dB Übertragungsfunktion des Filters Ansatzrohr lässt Resonanzfrequenzen desEingangssignals verstärkt durch und dämpft andere=> Vorstellung: Ansatzrohr als neutrales Rohr F3 F1 F2 Verknüpfung Quelle und Filter F1 Sprachschall: Multiplikation von Rohschallspektrum und Übertragungsfunktion=> wenn Quellsignal Linienspektrum hatte, dann auch Ausgangssignal!
zum Thema Ansatzrohr(„neutrales Rohr“) • viele vereinfachende Annahmen (Siehe Skript S. 13), u. a. „schallharte Glottis“ => totale Reflexion bei Impuls • Voraussetzung für Bildung stehender Wellen (Resonanzen):- Schwingungsbauch an Glottis (wegen totaler Reflexion- Schwingungsknoten an den Lippen (kein Reflexionswiderstand) - Stehende Welle = Überlagerung zweier gegenläufig fortschreitender Wellen gleicher Frequenz und gleicher Amplitude => konstante Positionen von Schwingungsbäuchen und Schwingungsknoten • Zur Berechnung der stehenden Wellen im neutralen Rohr suchen wir also diejenigen Wellen, die an der Glottis einen Schwingungsbauch und an Lippen Schwingungsknoten haben
- 1. Welle, die diesen Bedingungen genügt: Cosinuswelle, die zu ¼ in das Ansatzrohr passt => Wellenlänge = 4*L - 2. Welle mit diesen Eigenschaften: Cosinuswelle, die zu ¾ in das Ansatzrohr passt => Wellenlänge = 4/3*L - 3. Welle mit diesen Eigenschaften: Cosinuswelle, die zu 5/4 in das Ansatzrohr passt => Wellenlänge = 4/5*L
Formanten • In Wirklichkeit ist das menschliche Ansatzrohr nicht und die Glottis nicht zu jedem Zeitpunkt verschlossen=> keine einzelnen Resonanzfrequenzen, sondern Frequenzbänder (Formanten) • gekennzeichnet durch Frequenzlage und Bandbreite (Frequenzbereich, den der Formant bei –3dB unter seiner Spitzenamplitude in der Breite einnimmt) Bandbreite von F2
Verknüpfung von Quelle und Filter a) Im Frequenzbereich: Multiplikation Rohschallspektrum x(f) mit Übertragungsfunktion h(f) des Filters=> y(f) = x(f) * h(f) b) Im Zeitbereich: Faltung des Quellsignals x(t) mit h(t)=> vereinfachte Formel: y(t) = x(t) * h(t) steht eigentlich für: y(t) = Ausgangssignalx(t) = Druckschwankungen an Glottish(t) ist hier komplex, da die Systemantwort länger dauert als der auslösende Impuls und somit auch noch darauf folgende Impulse beeinflusst
Formantverschieber • modelliert die Form des Ansatzrohrs bei der Produktion von Schwa (Vokalsystem als Abbildung der geometrischen Veränderungen gegenüber dem neutralen Rohr) • nach oben geöffnet: Verengung • - bedeutet: Absenkung des Formanten zum Plosiv hin • + bedeutet: Erhöhung des Formanten zum Plosiv hin • bilabial: Verengung im 8. Achtel des Vokaltrakts • alveolar: Verengung im 7. Achtel des Vokaltrakts • velar: Verengung im 5. Achtel des Vokaltrakts velar alveolar bilabial
velar alveolar bilabial - Vorhersage Formantverschieber bei bilabialer Verengung: - - - => F1, F2 und F3 fallen zum Plosiv hin (steigen zum Vokal hin) - Vorhersage Formantverschieber bei alveolarer Verengung: - + + => F1, F2 und F3 fallen zum Plosiv hin (steigen zum Vokal hin) - Vorhersage Formantverschieber bei velarer Verengung: - + - => F1, F2 und F3 fallen zum Plosiv hin (steigen zum Vokal hin)
Lautklassen im Oszillogramm • wichtigste Merkmale im akustischen Zeitsignal: • Amplitude- Periodizität (-> Stimmqualität)- Nulldurchgangsdichte (Anzahl, wie oft der Signalmittelwert (Nullinie) durchlaufen wird- Extremwertdichte (Anzahl der Signalpunkte, in denen sich die Signalrichtung von positiv nach negativ (bzw. umgekehrt) ändert • Bei Vokalen: • Nulldurchgangsdichte spiegelt F1 wieder (hoch bei a, niedrig bei i und u)- Extremwertdichte spiegelt F2 wieder (niedrig bei u, hoch bei i) [u]: niedrige Nulldurchgangsdichte, niedrige Extremwertdichte [i]: niedrige Nulldurchgangsdichte, hohe Extremwertdichte
Nasale • Hauptansatzrohr: Rachen und Nasaltrakt- Nasaltrakt hat Eigenresonanz bei ca. 250 Hz => diese Frequenzen werden verstärkt, andere gedämpft- zusätzlich noch Antiresonanzen des Mundraums, die dem Sprachschall Energie entziehen
Nachtrag zum Formantverschieber (Warum sieht der Formantverschieber so aus, wie er aussieht? Warum ist F1 zweimal unterteilt, F2 viermal, F3 sechsmal? Und woher kommen überhaupt die ganzen Achtel, z. B. alveolar = Verengung im siebten Achtel?)=> http://www.phonetik.uni-muenchen.de/~reichelu/kurse/akustik/aap_2f_4p.pdf
Entsprechend den Vorzeichen der drei Empfindlichkeitsfunktionen (siehe Link) teilen Mrayati, Meyer-Eppler und Ungeheuer den Vokaltrakt in 23=8 Regionen auf. In jeder dieser Regionen verhält sich der Vokaltrakt bezüglich aller drei Formanten gleich.
Nachtrag: Nomogramm - horizontale Achse: artikulatorischer Parameter = Länge des Hinterrohrs [cm]- vertikale Achse: akustischer Output = Resonanzfrequenzen des Vokaltrakts [Hz] - F1h – F3h: Formanten des Hinterrohrs für alle möglichen Längen des Hinterrohrs- F1v – F3v: Formanten des Vorderrohrs für alle möglichen Längen des Vorderrohrs
F5 (=F3h) = 4773 Hz X X F4 (=F2h) = 3182 Hz X F3 (=F1v) = 2500 Hz X F2 (=F1h) = 1591 Hz(“F2 von 1. Formantfrequenz desHinterrohrs gebildet”) F1 (=FHELM) = 188 Hz(“F1 von Helmholz-Resonator”) X Interpretation Lv (cm) 13.5 11.5 9.5 7.5 5.5 3.5 1.5 0 0 5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7 8 9 11 13 15 Lh (cm) Quelle: http://www.phonetik.uni-muenchen.de/~jmh/lehre/sem/ws0607/hsaws06/vok2.ppt
Erinnerung: Area-Funktion: • “Die Querschnittsfläche des Vokaltrakts als Funktion der Entfernung von der Glottis” • Die akustischen Eigenschaften des Vokaltrakts (Resonanzfrequenzen / Formanten) hängen allein von der Fläche ab, nicht von der Form.