250 likes | 394 Views
Stimmliche Charakteristika bei globaler und lokaler Lautstärkevariation. Christine Mooshammer & Jennifer Schneeberg Institut für Phonetik und digitale Sprachverarbeitung Christian-Albrechts- Universität Kiel Deutschland. Einführung. Globale Lautstärkeerhöhung
E N D
Stimmliche Charakteristika bei globaler und lokaler Lautstärkevariation Christine Mooshammer & Jennifer Schneeberg Institut für Phonetik und digitale Sprachverarbeitung Christian-Albrechts-Universität Kiel Deutschland
Einführung • Globale Lautstärkeerhöhung • primär: größerer subglottaler Luftdruck • Schnelleres Schließen der Stimmlippen (höhere f0) • Flacher abfallendes Quellspektrum • sekundär: supralaryngale Artikulation • Längung der Vokale • Tieferer Kiefer bei Vokalen und damit höherer F1 DAGA 2005 München
Einführung • Lokale Lautstärkeänderung: = linguistisch bedingt: Akzentuierung • Wortakzent in Sprachen mit dynamischen Akzent (z.B. „Tenor“) • Intensität als Hauptmerkmal neben Dauer und Grundfrequenz(s. Sweet 1906, Sluijter et al. 1996) • kontrolliert durch subglottalen Luftdruck • Nachweis: Änderung des spectral tilts • Gilt auch in deakzentuierter Position, d.h. ohne Grundfrequenzunterschiede DAGA 2005 München
Einführung Satzbetonung: realisiert durch melodische Unterschiede mittels Anpassung der Stimmlippenspannung Hypothesen: • Nur lexikalischer Wortakzent bewirkt ähnliche Änderungen in den stimmlichen Parametern wie globale Lautstärkeänderungen, nicht aber der Satzakzent. • Unterschiede in der Wortbetonung sind unabhängig davon, ob das Wort satzbetont ist oder nicht. DAGA 2005 München
Korpus 1. Wortakzent DAGA 2005 München
Korpus 2. Satzbetonung: Frage-Antwort Paradigma (durch Variation des Fokus + Emphase) FOCUS [+F] Q: Wolltest Du Dir Friedas Buch ausleihen? A: Nein, ich wollte Lenas Buch ausleihen. NON-FOCUS [-F] Q: Wie findest Du Lena? A: Ich hasse Lena und ihre Schusseligkeit. DAGA 2005 München
Korpus 3. Globale Lautstärkevariation Sätze mit wortbetonten, fokussierten Testsequenzen wurden in drei Lautstärkebedingungen gesprochen: • Normal (N) • laut: „Sprich laut ohne zu schreien“ (L) • leise: „Sprich leise ohne zu flüstern“ (S) 8 bis 9 Wiederholungen DAGA 2005 München
Aufnahmen • 6Sprecher aus Norddeutschland (20-30 Jahre alt, Nichtraucher, männlich) • Akustik und Glottissignal (Lx) mittels Laryngographie (Glottal Enterprises) • Die erste Ableitung des Lx-Signals (DEGG) wurde mittels Differenzierung berechnet. • Akustische Etikettierung mit Praat DAGA 2005 München
Messungen Lx • Halbautomatische Etikettierung mittels EMU/R • Alle Perioden während des Vokals /e/ Analysierte Parameter: a) f0 basierend auf dem DEGG Signal b) RMS basierend auf dem Audio-Signal c) Open Quotient OQ d) Speed Quotient SQ e) Steigungen der Öffnungs- und Schließungsbewegungen (Oslope, Cslope) DAGA 2005 München
T top2 1. Negativer Gipfel der ersten Ableitung = top1 2. 4/7 Schwellwert (Howard‘s method) = top2 top1 Messungen • Open Quotient: 100*top/T • Problem: Festlegung des Zeitpunkts der Öffnung: DAGA 2005 München
Schließung Öffnung Oslope Cslope • Cslope • Oslope tcl top Messungen • Speed Quotient: 100*tcl/top (10% Schwellwert) DAGA 2005 München
Problem: Trennung der Einflüsse des subglottalen Luftdrucks und der Stimmlippenspannung auf die EGG Parameter Vorhersagen(basierend auf Marasek (1997), Zwei-Massen-Modell -> Lx-Signal aus Glottisfläche) DAGA 2005 München
Intensität Grundfrequenz • Bei lautem Sprechen: höhere f0 und größerer Bereich • Signifikant tiefere f0 bei leisem Sprechen • Für alle Sprecher signifikante Unterschiede zwischen den Lautstärkeniveaus Stimmparameter: globale Lautstärke DAGA 2005 München
Open Quotient Steigung der Öffnungsbewegung • OQ vergrößert sich von laut und normal nach leise • Konsistent für alle Sprecher • Signifikant steilere Steigungen für lautes Sprechen • Konsistent für laut-normal • Nur 3 Spr. für normal-leise Stimmparameter: globale Lautstärke DAGA 2005 München
Grundfrequenz Intensität Fokus Non-Fokus Fokus Non-Fokus • /l/: Wortakzent bewirkt höhere Intensität bei +F und –F • /z/: höhere Intensität bei –F nur bei 3 Sprechern Stimmparameter: Prominenz • Konsonanteneffekt bei [-F]: • /l/: F0 unterscheidet sich für Wortakzent (aufgrund von 2 Sprechern)f0_stress.jpg • /z/: F0 Neutralisation DAGA 2005 München
Fokus Non-Fokus Stimmparameter: Prominenz Open Quotient • Vorhersagen: • Wortakzent: [+S]<[-S] • Fokus: [+F]>[-F] • Wortakzent: • niedrigerer OQ für [+S] • ähnlich laut-normal • Fokus: • meist niedriger für [+F] • entgegen Vorhersage DAGA 2005 München
Steigung der Öffnungsbewegung • Vorhersagen: • Wortakzent: [+S]>[-S] • Fokus: [+F]=[-F] Non-Fokus Fokus Stimmparameter: Prominenz • Wortakzent: • [+F]: vier Sprecher zeigen steilere Steigungen für [+S] • [-F]: 4 Sprecher /l/, nur 1 Sprecher /z/ • Fokus: • In beiden Bedingungen meist signifikanter Anstieg der Steigung für [+F] DAGA 2005 München
Zsf.: Stimmparameter • Lautes Sprechen: erhöhter subglottaler Luftdruck • Leises Sprechen: weniger konsistente Druckunterschiede Änderung der Stimmqualität zu behaucht? • Wortakzent: Evidenz für höheren subglottalen Luftdruck nur bei fokussierten Wörter und hauptsächlich nach /l/ • Fokus: kaum Hinweise auf geänderte Stimmlippen-spannung, dafür Evidenz für erhöhten Luftdruck Tentative Erklärung: • Bestimmung des Zeitpunkts der glottalen Öffnung • Verwendete Parameter könnten abhängig von der Grundfrequenz sein (z.B. Steigungen). DAGA 2005 München
2. Formanalyse Alternativer holistischer Ansatz: gesamte Wellenform bildet die Basis, z.B. PCA (Mokhtari et al. 2003) oder Functional Data Analysis (FDA, z.B. Ramsay) • Input: • Mittlere zwei Perioden • Zeit- und amplituden- normalisiert • 317 Items • Verarbeitung: • Berechnung von Spline Funktionen DAGA 2005 München
Hauptkomponente (64.3 %) Lautstärke X Lenor X Lena X Hauptkomponentenanalyse: Positiv: längere Geschlossenphase, steile Verschließbewegung, linksschief Negativ: lange Offenphase, langsamere Verschließbewegung, symmetrischer Impuls • Faktorscores • Lautstärke: • Laut: pos. Werte • Normal: Werte um null • Leise: neg. Werte • Wortakzent: • „Lena“: positive Werte • „Lenor“: negative Werte • Fokus: kein Unterschied DAGA 2005 München
Lautstärke Signifikant für 5 Sprecher X X X X X Lena Lenor Lena Lenor Prominenz: keine signifikanten Effekte DAGA 2005 München
Lautstärke: signifikante Effekte bei 5 Sprechern Prominenz:signifikanten Effekte bei DP Sehnen Senat Sehnen Senat DAGA 2005 München
Schlussfolgerungen • Globale Lautstärkeveränderung: verändert die Form des glottalen Pulses • Wortakzent: • Sehr inkonsistente Effekte • Nur für einen Sprecher in die erwartete Richtung • Nachdem f0- und Amplitudenunterschiede entfernt wurden, ergeben sich keine Effekte für Wortakzent DAGA 2005 München
Schlussfolgerungen (cont.) • Warum keine Effekte bei Prominenz? • Unterschiede könnten zu subtil sein, um sich signifikant niederzuschlagen. Keine klare Tendenz erkennbar • Unterschiede zeigen sich nicht im Lx Signal aufgrund der bekannten Probleme Lautstärkeeffekte sind sehr konsistent 3. Wortakzent wird nicht durch Änderung des subglottalen Luftdrucks realisiert Neue Hypothese: Flacherer Abfall bei wortbetonten Vokalen ist eine Folge der laryngalen und/oder supralaryngalen Artikulation DAGA 2005 München
Ausblick • Parameter des spektralen Abfalls • spectral balance, spectral tilt und spectral emphasis ??? Abhängig von Grundfrequenz ??? • Systematischer Vergleich zwischen verschiedenen Maßen mittels Synthese • Supralaryngale Artikulation: Parameter wie Dauern und Formanten • Vorläufige Ergebnisse: • große Unterschiede bei Wortakzent, aber nicht in Richtung lautes Sprechen • nur selten konsistente Unterschiede für Fokus • Erhebung von artikulatorischen Daten DAGA 2005 München