610 likes | 1.23k Views
Fonetika a fonologie SRE #01. Honza Černocký. Plán. Jazykov á komunikace Fonetika Abecedy Mluvní orgány Artikulace samohlásek a souhlásek. Fonologie Fonémy a fóny Distinktivní rysy. Čtení spektrogramu Na co je to dobré. . Sources.
E N D
Fonetika a fonologieSRE #01 Honza Černocký
Plán • Jazyková komunikace • Fonetika • Abecedy • Mluvní orgány • Artikulace samohlásek a souhlásek. • Fonologie • Fonémy a fóny • Distinktivní rysy. • Čtení spektrogramu • Na co je to dobré.
Sources • M. Krčmová: Fonetika a fonologie, zvuková stavba současné češtiny, FF MU 1990. • G. J. Tortora, S. R. Grabowski: Principles of Anatomy and Physiology, Wiley & Sons, 1999. • J. Psutka: Komunikace s počítačem mluvenouy řečí, Academia Praha 1995
Jazyková komunikace „Přenos informace mezi lidmi pomocí jazykových prostředků“ • Fonetika • Fonologie • Morfologie • Syntax • Stylistika ? • Sémantika • Pragmatika
skutečnost Vztah mezi významem slova a jeho zvukovou podobou Je vždy dán konvencí – „kódem“ skutečnost? zvuk zvuk kódovánít Přenosový kanál dekódování Skutečnost a „Skutečnost?“ jsou ekvivalentní pouze pokud mluvčí i posluchač mají stejný „kód“. Úkol: Co musí být ještě splněno ?
Gramatický Význam (7.p. j.č. muž. rod) Kmenotvorná přípona • Derivační • přípona • podstatné jméno Jednotky Minimální jednotka odlišující význam – morfém. uč i tel em Kořen Jemnější jednotky – fonémy/fóny Fonetika vs. fonologie
FONETIKA Zkoumá zvukovou podobu jazyka … „zabývá se materiální stránkou zvukových výrazových prostředků jazyka“ Psaný text • Optické vnímání • Zachovává vztah s morfologií (stavbou slov) a s tím, co je významotvorné • „Dělo“, „tělo“, „něco“, „běží“, „snězí“ – nutno přečíst celou slabiku. • Některé hlásky se neznačí (nasalisace ´n´, znělé/neznělé ´ř´, …) • Ještě horší v jiných jazycích! Zvuková podoba • Waveform • Spektrogram • Vše ostatní, co my inženýři umíme a jazykovědci ne (formanty, F0, atd.) • Fonetická transkripce • Snaha o univerzální fonetickou abecedu – IPA.
International phonetic alphabet http://www.paulmeier.com/ipa/consonants.html
Počítačově čitelné abecedy SAMPA: „Speech Assessment Methods Phonetic Alphabet“ - computer readable phonetic alphabet: http://www.phon.ucl.ac.uk/home/sampa • Normalizováno pro dost jazyků. • Po velkých bojích i čeština (podívejte se na diskuse ). f formaforma v vakvak s sensen z zubzup Q\ třitQ\i P\ řádP\a:t S šatySati Z žalZal j jasjas x chataxata h\ hadh\at CTU-bet • Made by FEL ČVUT Speech processing group • Příjemná pro české uživatele. • Pomohla v hodně DB projektech
Mluvní orgány 3 ústrojí • Dýchací [energie] • Hlasové [zdroj/source] • Modifikační [filtr] Zdroj: Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995
Plíce - zdroj Dýchání • Normální vdech/výdech 2:3 • Při řeči: zvětšení objemu a poměr 1:7-1:12 • Trvalý tlak v hrtanu – „motor“ pro hlasivky • Velká spotřeba • samohlásky, zvláště ´á´ (volná ústní dutina). • Souhlásky ´f´, ´h´, ´x´ a sykavky • Malá spotřeba – „ucpaná ústní dutina“ - ´l´.
Hlasivky – source I. Štěrbina nad hlasivkami – glottis. Základní funkce – kmitání: • 50 Hz (A. Schwarzenegger) • až 400 Hz (drobné dámy) • až 1 kHz (čínské děti) Zdroj: G. J. Tortora, S. R. Grabowski: Principles of Anatomy and Physiology, Wiley & Sons, 1999.
Hlasivky – source I. Co všechno mohou hlasivky dělat: • Klidné rozevření (běžné dýchání, ´f´,´s´,´š´,´x´). • Kmity + lehké sblížení – znělé souhlásky. • Těsné sblížení bez kmitů - ´p´, ´t´, ´ť´, ´k´. • Kmity + těsné sblížení – samohlásky • Šepot – oddálení, nekmitají (pozn. nešeptejte, když máte unavený hlas, nekecejte vůbec !) • ´h´ - sblížení v blanité části, kmitají pomaleji. • Aspirace – „přídech“ – něměcké ´p´, ´t´, ´k´. Hlasivky jsou fyzikální systém a i při kmitání vytvářejí šum (více viz kódování CELP).
Modifikační ústrojí – filter – I. Zdroj: G. J. Tortora, S. R. Grabowski: Principles of Anatomy and Physiology, Wiley & Sons, 1999.
Modifikační ústrojí – filter - II. 3 dutiny – rezonátory (objem, tvar): hrdelní ústní nosní (laryngální) (orální) (nasální) • Hrdelní – změna pohybem kořene jazyka. • Ústní – nejdůležitější pro artikulaci, změna jazykem, rty a zuby. • Otevřená – vokály • Uzavřená – konsonanty • Nasální – ovládání koncem měkkého patra – čípek (uvula): • nasální samohlásky (FR - ´an´) • V češtině nasalisace´n´, ´m´. • Pokud moc nasalisace – huhňání. • Místo, kde se jazyk nejvíce blíží patru – předěl mezi dutinou hrdelní a ústní – místo artikulace.
Samohlásky - vokály Otevřená ústní dutina: • Poloha jazyka <-> • Poloha jazyka ^ a v • Zaokrouhlování – např. ´i´ vs. ´ü´. Úkoly: • Zkoušejte artikulovat hlásky a uvědomujte si polohu jazyka a okrouhlost. • Co je schwa a kde se v češtině používá ?
Souhlásky – konsonanty – I. Způsob artikulace • Okluze – závěr – okluzívy, plozívy. • Konstrikce – úžina – konstriktivy, frikativy. • Semi-okluzívy – afrikáty – úžina + částečný uzávěr – afrikáty. • Vibrace – kmity – vibranty, trill. • Hlásky klouzavé – glides, aproximanty. • Laterální aproximanty ´l´.
Souhlásky – konsonanty – II. Místo artikulace • Bilabiální • Labiodentální • Dentální • Dentální • Alveolární (dásně ~ 1. stoličky). • Post-alveolární • Retroflexní („jazyk nastojato“ – Hindi ´t´). • Palatální • Velární • Uvulární • Laryngální (glotální). Zdroj: G. J. Tortora, S. R. Grabowski: Principles of Anatomy and Physiology, Wiley & Sons, 1999.
Souhlásky – konsonanty – III. • Párové: • Znělé • Neznělé • Nepárové Úkoly: • Napište české hlásky k IPA symbolům tak, že vyzkoušíte artikulaci. • Kam zařadíte afrikáty ´c´, ´č´, ´dz´, ´dž´ ? • Najdete anglické ´th´, ´dh´, ´w´ a francouzské ´r´ ? • Zkuste artikulovat hlásky, které nejsou v češtině ani ve Vám známých jazycích. • Zkuste něco šedého
FONOLOGIE • Nauka o použití zvukového materiálu v jazyce. • Zkoumá pouze to, co má distinktivní funkci – rozlišení významu. Foném: • Zvukový jazykový prostředek sloužící k odlišení morfémů, slov a tvarů téhož jazyka s různým významem. • Liší se od ostatních nejméně jednou fonologickou distinktivní vlastností – distinctive features. • Počet fonémů je omezený – 12-60: • čeština 36 • ruština 40 • angličtina 42 • maďarština 60.
Fonémy a fóny Fonologicky relevantní zvukové jevy: • Lineární – segmentální fonémy – řada. • Suprasegmentální – delší celek – slabika, slovo – např. přízvuk – realizuje se prosodicky a není poznat z 1 fonému. • Realizace segmentálních fonémů – fóny (hlásky). • Alofony – různé zvukové realizace 1 fonému: ´Hana´ - ´banka´ - ´utne´ - ´puntík´ Fón, Hláska Foném Abstraktní pojem, posice v systému … Konkrétní zvuková realizace
Systém fonémů Jak poznat foném ? • Metoda minimálních párů. • Slova lišící se pouze v jedné posici, pokud rozdílný význam => foném: ´pes´ - ´bes´, ´sen´ - ´sin´, ´šít´ - ´žít´. • Hodně oposic – centrum inventáře fonémů. • Málo oposic – periférie – např. ´f´ má pouze jednu oposici ´zouvat´ - ´zoufat´, přesto relevantní foném !
Opozice fonémů Nejméně jeden diferenciační příznak: • Privativní oposice – jedna hláska příznak má, druhá ne: ´p´ - ´b´ bilabiální okluzíva orální, příznak znělosti. • Graduální (stupňovitá) oposice: jedna hláska má něčeho více, např. kvantita: ´a´ - ´á´. • Ekvipotentní (rovnomocný) každá má vlastní příznak – např. ´s´ frikativa, ´t´ okluziva. Korelační pár – hlásky se liší pouze jedním příznakem – např. ´p´ - ´b´ znělostí Korelační řada – korelační páry, které se liší stejným příznakem: ´p´ - ´b´, ´t´ - ´d´, ´k´ - ´g´, …
Distinktivní rysy – I. Diferenciační příznaky, distinctive features: • Jacobson, Halle, Fant (50.-60. léta): 12 features, binární oposice – přítomný vs. nepřítomný. • Subfonematická fonologie – rysy jsou základní jednotky jazyka. • V češtině některé z 12ti bezvýznamné a některé navíc. Vokály
I. Vokálnost/Nevokálnost • Přítomnost formantových pruhů ve spektru • Otevřenost nadhrtanových prostorů • + Vokály a sonory (kromě ´j´) • - šumové konsonanty, ´j´, ´w´. Kuk na spektra (u dalších také) !
II. Konsonantnost/Nekonsonantnost Konsonanty: • Malá celková energie, překážky v modifikačním ústrojí • + šumové konsonanty a sonory • - vokály, ´j´, ´w´. Kuk na spektra (u dalších také) !
III. Kompaktnost/Nekompaktnost Kompaktní • soustředění zvukové energie ve středu spektra. • Artikulace konsonantů – zadní část ústní dutiny (od post-alveol dozadu). • Artikulace vokálů – jazyk v ústech co nejníže. • Vokály ´a´, ´á´, konsonanty postalveolární, palatální, velární, laryngální. Nekompaktní • zvuková energie na okrajích spektra. • Ostatní fonémy Kuk na spektra (u dalších také) !
IIIa. Difúznost • Typické postavení formantů na okraji spektra. • Pouze pro vokály • Rozdíl ve vertikálním posunu jazyka • + vysoké vokály • - středové vokály ´o´, ´ó´, ´e´, ´é´. IV. Napjatost/Nenapjatost • Ostré ohraničení složek spektra. • V češtině ne – rozlišení francouzských ´e´.
V. Znělost/Neznělost Přítomnost základního tónu F0: • + znělé konsonanty • - neznělé Kuk na spektra (u dalších také) !
VI. Nasálnost/Nenasálnost • Typická změna formantové struktury – dodatkový „nosní“ formant, redukce normálních formantů. • Zapojení dodatkového „nosního rezonátoru“. • + ´m´, ´n´, ´ň´ • V jiných jazycích i vokály (francouzština). Kuk na spektra (u dalších také) !
VII. Kontinuálnost/Nekontinuálnost Kontinuální: • spojitost spektra s realizacemi ostatních fonémů • Přehrada při artikulaci neexistuje, nebo je jen částečná. Nekontinuální: • Krátké přerušení spektra, zvýšení energie. • - okluzívy a semiokluzívy • + ostatní Kuk na spektra (u dalších také) !
VIII. Drsnost/Matnost Drnost (stridens) • Nepravidelné spektrum • Změna charakteru překážky. • Semiokluzívy – rozlišení ´t´ - ´c´, ´d´ - ´dz´. Matnost (hladkost - mellows) IX. Přerušovanost/Nepřerušovanost • Ostré ukončení spektra. • V češtině ne.
X. Gravisovost/Negravisovost Tato i další distinktivní vlastnost jsou „tónické“ Gravisovost (tupost) • Nízké frekvence spektra • Velký prostor v ústní dutině, hlásky s artikulací na okraji ústrojí • ´u´, ´ú´, ´o´, ´ó´, labiály, veláry, laryngály. Negravisovost (akutovost, ostrost) • Vysoké složky ve spektru • „plná pusa“ Kuk na spektra (u dalších také) !
XI. Mollovost/Nemollovost • Sníženost/nesníženost • Snížení spektra celé hlásky dolů • V češtině ne. XII. Durovost/Nedurovost • Posun spektra výše – F2. • V češtině ne – ruské ´m´, ´s´, atd.
XIII. Kvantita (vokálů) • Není standardní feature • Dobré pro rozlišení dlouhých a krátkých vokálů.
XIV. Vibrantnost/nevibrantnost • Není standardní feature • Nutné pro zařazení ´ř´ do systému. • Kolísání charakteristik ve spektru (vibrace). • Rozlišení ´ž´ - ´ř´, dobré také pro ´l´ - ´r´. Kuk na spektra (u dalších také) !
Vokály – I. + - + - + - + - + - + - + - + -
Vokály – II. Typické délky „Formantový trojúhelník“
Vokály – III. A E I O U
+ - + - + - + - + - + - + - + - + - + - Konsonanty + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + -
Slabika Minimální seskupení fonémů podle jazykových zákonitostí: • Iniciála (onset) • Jádro (nukleus) • Kóda Poznámky: • Mezi jádrem a svahy musí být kontrast • Jádro vždy, svahy mohou být neobsazeny. Při „inženýrském“ určování slabik se na přesné určení hranic dost kašle … Demo:transc a syllabifikátor z ČVUT. Super slabika: „K vzpřímenému“ – kolik má konsonantů ? Svahy slabiky
Co je ještě ve fonetice Na FF MU celosemestrální kurs … • Slovní přízvuk – v češtině na 1. slabice kromě jednoslabičných předložek. • Intonace – „intoném“, „melodém“ – v SRE nebudeme potřebovat, ale pozor na TTS! • Ráz – zvláštní foném - ´s uchem´, atd. • Koartikulace – změna fonémů v plynulé řeči: • ´kratší´ - ´kračí´ • ´podšívka´ - ´počífka´ • ´nachystat žehlení´ - ´nachystadžehlení´ • Spontánní řeč – totální guláš
Čtení spektrogramu 2 názvy českých filmů.
Na co je to dobré… • Obecný přehled o tom, co se při mluvení děje v puse a jaké to má dopady na řečový signál a spektrum. • Rozpoznávání řeči a fonémů pomocí distinctive features K. Kirchhoff: Robust Speech Recognition Using Articulatory Information, Ph.D. thesis, TU Bielefeld, 1999.
Na co je to hlavně dobré • Kladení otázek při štěpení stavů v kontextově závislých skrytých Markovových modelech (CD-HMM). Zdroj: HTK Book, http://htk.eng.cam.ac.uk/
… příklad • CZ_Fortis p t k f s S t_s c P_ x • CZ_Lenis b d g v z Z d_Z P_ J_ d_z h_ J j N F m n l r • CZ_Coronal n J l r j t d c J_ t_s d_z t_S d_Z s z S Z P_ • CZ_NonCoronal m N p k g f v x h_ • CZ_Anterior m n l r p b t d t_s d_z f v s z • CZ_NonAnterior J N j t_s J_ k g t_S d_Z S Z x • CZ_Continuent s S z Z f v x h_ j t_s t_S d_z d_Z l r P_ • CZ_NonContinuent p b t t_s d J_ k g • CZ_Strident t_s d_z t_S d_Z P_ • CZ_NonStrident f v h_ • CZ_UnStrident m n J N l r j p b t d J_ t_s k g x • CZ_Glide j l h_ • CZ_Syllabic m l r • CZ_High i i: u u: • CZ_Medium e e: o o: • CZ_Low a a: • CZ_Rounded o o: u u: • CZ_Unrounded a a: e e: i i: • CZ_NonAffricate s S z Z • CZ_IVowel i i: • CZ_EVowel e e: • CZ_AVowel a a: • CZ_OVowel o o: • CZ_UVowel u u: • CZ_Front-Stop p b • CZ_Central-Stop t d t_s J_ • CZ_Back-Stop k g • CZ_Front-Fric f v • CZ_Central-Fric s S z Z j • CZ_Back-Fric x h_ • CZ_Vibraty r P_ • CZ_Sonory m n N J l r j • CZ_Kontinualy l r j f v s z S Z x h_ P_ • CZ_Short Vowels i e a o u • CZ_Long Vowels i: e: a: o: u: • CZ_Diphthongs a_u e_u o_u • CZ_Explosives p b t d k g c J_ • CZ_Affricates t_s d_z t_S d_Z • CZ_Fricatives f v s z P_ S Z j x h_ r l • CZ_Liquids r l j • CZ_Nasal F N m n J • CZ_Vowels i e a o u i: e: a: o: u: • CZ_Consonant p b t d k g c J_ t_s d_z t_S d_Z f v s z P_ S Z j x h_ r l F N mn J e: i • CZ_Voiced_Explosives F N m n J b d g J_ • CZ_Voiced_Affricates d_z d_Z • CZ_Voiced_Fricatives r l v z P_ Z j h_ • CZ_Unvoiced_Explosives p t k c • CZ_Unvoiced_Affricates t_s t_S • CZ_Unvoiced_Fricatives f s S x • CZ_Voiced F N m n J b d g J_ d_z d_Z r l v z P_ Z j h_ • CZ_Unvoiced p t k c t_s t_S f s S x • CZ_Pair b d g J_ d_z d_Z v z Z h_ p t k c t_s t_S f s S x • CZ_Unpair F N m n J j l P_ r • CZ_Vibrants r P_ • CZ_V-Front i i: e e: • CZ_V-Central a a: • CZ_V-Back o o: u u: • CZ_C-Front k g N x h • CZ_C-Central t d n t_s d_z s z l r P_ t_S S Z j c J_ J • CZ_C-Back k g N x h • CZ_Front p b m F f v x h_ j ii: e e: • CZ_Central t d n t_s d_z s z l r P_ t_S d_Z S Z j c J_ J a a: • CZ_Back k g N x h_ o o: u u:
K dalšímu čtení a hraní Čtení: • Marie Krčmová: Fonetika a fonologie, zvuková stavba současné češtiny, FF MU 1990 (+asi další vydání). • Gussenhoven, J. and Jacobs, H.: Understanding Phonology, Oxford University Press, 1998, ISBN: 0-340-69218-9. Hraní: • Wavesurfer http://www.speech.kth.se/wavesurfer/, CoolEdit, GoldWave, atd jsou také OK, ale WS je lepší pro naše hraní (MLF files, atd.). • Fonémový rozpoznávač Speech@FIT – US EN, CZ, HU, RU: http://www.fit.vutbr.cz/research/groups/speech/index.php?id=phnrec • I bez počítače – uvědomujte si, co Vám pusa dělá, když mluvíte