200 likes | 372 Views
Puhesignaalin analysointi = akustinen fonetiikka. Diskreetti signaalinkäsittely (Analoginen) todellisuus Puhesynteesi Fyysinen puheentuotto parametrisointi Yksinkertaistettu malli
E N D
Puhesignaalin analysointi = akustinen fonetiikka Diskreetti signaalinkäsittely (Analoginen) todellisuus Puhesynteesi Fyysinen puheentuotto parametrisointi Yksinkertaistettu malli Y(z) = H(z)*X(z) todellisuudesta, joka on mahdollista muotoilla matemaattisesti Fysiikka&Matematiikka
Akustinen fonetiikka • Akustisesti ääni ja siten myös puhe on ilmanpaineen vaihtelua • Akustinen fonetiikka tutkii puheen akustisia ominaisuuksia ja sitä miten ne seuraavat puheentuottomekanismin toiminnasta Pitkittäinen aaltoliike: http://www.kettering.edu/physics/drussell/Demos/waves/wavemotion.html
Formantit eli ääniväylän resonanssit • Tärkein ääntöväylän ominaisuus on siinä esiintyvät resonanssit eli formantit • Syntyvät värähtelevän ilmapatsaan seisovina aaltoina • Formantit (F1, F2, ...) voidaan yleensä nähdä spektrissä vahvistuneina osavärähtelyalueina • Taajuuden lisäksi formanttia kuvaavat sen intensiteetti ja kaistanleveys • Eri ääntöväyläkonfiguraatioilla on eroavat formanttitaajuudet -> formanttien avulla voidaan luokitella kaikki vokaalit /a/-äänteen spektri
Muita tapoja muodostaa äänteitä • TAPA 1: Kapeikko ääntöväylässä muuttaa läpi kulkevan ilmavirran pyörteiseksi • Ero kuiskaukseen: nyt pyörteinen ilmavirta syntyy ääntöväylässä, kuiskauksessa se syntyi glottiksessa • TAPA 2: Sulkemalla ja avaamalla ääntöväyläkokonaan joltain kohtaa ilmavirta ’poksahtaa’ ulos
Ääntöväylän matemaattinen mallintaminen • Ääntöväylän resonanssien laskeminen ääntöväylän muodon perusteella on analyyttisesti ratkeamaton ongelma (numeerisia ratkaisuja on) - Pitäisi ottaa huomioon • erilaiset kurkunpään herätteet, • ajalliset ja paikasta riippuvat muutokset ääntöväylän muodossa, • nenäväylän kytkeytyminen, • huulten kohdalla tapahtuva ääniaallon leviäminen ympäristöön, • energiahäviöt, • pyörteiset ilmavirtaukset • jne. • Yksinkertaistettuja malleja tarkastelemalla päästään kuitenkin melko pitkälle äänentuoton ymmärryksessä
MRI (Magnetic Resonance Imaging) -kuvia ääntöväylästä http://en.akihabaranews.com/101359/robot/robotech-2011-professor-sawada%E2%80%99s-talking-robot http://personal.ee.surrey.ac.uk/Personal/P.Jackson/Nephthys/jaleel.html /aa/ /ii/
Ääniväylän mallintaminen tasapaksujen putkien avulla • Ääniväylä suoristetaan ja mallinnetaan vakiopituisina viipaleina
Äänipaineaallon heijastuminen • Liitettäessä kaksi tasapaksua putkea yhteen liitoskohdassa tapahtuu heijastumista • Heijastuskerroin knilmaisee,kuinka suuri osa putkesta toiseen liikkuvasta tilavuusnopeusaallosta heijastuu takaisin (putkien pinta-alat Sn ja Sn+1 ):
Äänipaineaallon heijastumisesta • Pinta-alat ovat positiivisia, joten -1 < kn < 1 • kun = 0 , niin kn = 1 , ja aalto heijastuu sellaisenaan takaisin • kun on suuri, niin kn ≈ -1 , ja aalto heijastuu kokonaan, mutta vastakkaisessa vaiheessa • Mikäli Sn =Sn+1 , heijastumista ei tapahdu http://www.kettering.edu/physics/drussell/Demos/reflect/reflect.html (huomaa, että paineaalto käyttäytyy päinvastoin kuin poikittaisaalto narussa)
Aaltoheijastusten mallintaminen z-tasossa – ristikkorakenne eli Kelly-Lochbaum -rakenne • fn on putkessa n eteenpäin kulkeva ääniaalto ja bn taaksepäin kulkeva ääniaalto • Mallinnetaan aaltojen etenemistä ja heijastumisia viereisen kuvan Kelly-Lochbaum ristikkorakenteella • Näytteistetään järjestelmän toiminta siten, että aalto viivästyy yhden hetken () kulkiessaan putkenpätkän päästä toiseen
Kelly-Lochbaum -yhtälöt • Aaltojen käyttäytyminen voidaan esittää seuraavien yhtälöiden avulla. • Kuvasta saadaan:
Kelly-Lochbaum -yhtälöt • Aaltojen käyttäytyminen voidaan esittää seuraavien yhtälöiden avulla. • Kuvasta saadaan: • Ratkaistaan näistä ja , :n ja :n funktioina
Kelly-Lochbaum -yhtälöt • Aaltojen käyttäytyminen voidaan esittää seuraavien yhtälöiden avulla. • Kuvasta saadaan: • Ratkaistaan näistä ja , :n ja :n funktioina ja laitetaan matriisimuotoon:
Ääntöväylämalli ristikkorakenteella • Ääntöväylän putkimallille saadaan diskreettiaikainen esitys liittämällä ristikko-elementtejä peräkkäin. b0 ja bN jätetään vain pois.
Ristikkorakenne • Ristikkorakenteen siirtoyhtälö saadaan seuraavasti:
Ristikkorakenne • Ristikkorakenteen siirtoyhtälö saadaan seuraavasti:
Ristikkorakenne • Ristikkorakenteen siirtoyhtälö saadaan seuraavasti:
Ristikkorakenne on all-pole(IIR)-suodin Todetaan, että edellisen kalvon suodin on all-pole –tyyppinen: • Muodostetaan FIR-tyyppinen käänteissuodin, jolloin alkuperäisen suotimen on oltava all-pole –tyyppinen. Tätä varten ratkaistaan Kelly-Lochbaum –yhtälöistä fn(z)ja bn(z) fn+1(z):n ja bn+1(z):n avulla: • Ristikkorakenne, johon liitettynä käänteinen lohko:
Ääntöväylä suotimena • Ääntöväylää mallinnetaan edellä esitetyllä all-pole-rakenteella eli AR-mallilla, eli systeemillä, jonka siirtofunktio on muotoa • Millainen on sitten kurkunpäästä tuleva ’heräte’-ääniX(z) ? (sourcefiltrdemo.m)