170 likes | 334 Views
FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO 2000 Maribor, Smetanova ul. 17. Razpoznava govora z usmerjeno nevronsko mrežo. Interdisciplinarna študijska smer Mehatronika. Avtorja: Aleš Tetičkovič Simon Klančnik Mentor: izr. prof. dr. Riko Šafarič Somentor: Gregor Pačnik.
E N D
FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO 2000 Maribor, Smetanova ul. 17 Razpoznava govora z usmerjeno nevronsko mrežo Interdisciplinarna študijska smer Mehatronika Avtorja: Aleš Tetičkovič Simon Klančnik Mentor: izr. prof. dr. Riko Šafarič Somentor: Gregor Pačnik
Uvod • Na področju prepoznave govora so se v preteklosti oblikovale številne metode. • Prepoznava govora z usmerjeno nevronsko mrežo. • Primarni cilj prepoznave govora je vodenje invalidskega vozička primernega za invalide, ki so hromi od vratu navzdol (tetraplegiki). • Bistven problem pri prepoznavi povzročajo motnje iz okolice.
Izolacija besede • Izolacija besede po metodi izračuna tekočega povprečja in primerjavi z pragovno vrednostjo. • Izolacija besede po metodi izračuna števila prehodov čez nič signala (“zero crossing” metoda).
Primerjava rezultatov obeh metod Metoda izračuna tekočega povprečja “Zero crossing” metoda
LPC kepstralna analiza • Količina podatkov je za prepoznavo z usmerjeno nevronsko mrežo preobsežna. • Metoda temelji na aproksimaciji zvočnega signala kot linearne kombinacije predhodnih zvočnih vzorcev. • Rezultat analize je pretvorba besede v zaporedje točk, kjer vsaka točka pripada 12 dimenzionalnemu LPC kepstralnemu prostoru.
Samoorganizirajoča nevronska mreža (SOM) • Primerna za reduciranje dimenzij vhodnega signala. • Spada med nevronske mreže s tekmovalnim načinom učenja. • Izhode iz SOM mreže predstavljajo pozicije zmagovalnih nevronov. • Na kakovost reduciranja dimenzij vpliva konfiguracija SOM mreže. • Dosežemo dodatno zmanjševanje količine podatkov za prepoznavalnik govora.
Postopek učenja SOM mreže 1. Iskanje zmagovalnega nevrona: 2. Korekcija uteži nevronov se izvede z naslednjo enačbo:
Prikaz rezultatov učenja SOM mreže Besedi LEVO Besedi DESNO Besedi STOP
Usmerjena nevronska mreža • Predstavlja naš prepoznavalnik govora. • Spadajo med nevronske mreže z nadzorovanim postopkom učenja. • Osnovni element usmerjene nevronske mreže predstavlja umetni nevron. • Sestavljena iz vhodnega nivoja, enega ali več skritih nivojev, ter izhodnega nivoja, ki predstavlja rezultate prepoznave. • Za učenje usmerjene nevronske mreže je uporabljeno posplošeno delta pravilo.
Umetni nevron Izračun izhoda iz umetnega nevrona: o = σ(∑iiwi + b)
Postopek učenja usmerjene nevronske mreže • Normalizacija dobljenih SOM izhodov na fiksno dolžino (200 koeficientov). • Izračun izhodov posameznega nivoja usmerjene nevronske mreže. • Primerjava izhodov izhodnega nivoja nevronske mreže z vektorjem tarče za posamezni ukaz. • Spreminjanje uteži posameznih nevronov v usmerjeni nevronski mreži. • Postopek ponavljamo dokler ne dobimo želenih rezultatov.
Rezultati učenja usmerjene nevronske mreže • Učenje nevronske mreže na ukaze LEVO, DESNO, NAPREJ in STOP • Trenutno izbrano 15 nevronov v skritem nivoju. Rezultati razpoznave ukazov
Zaključek • Prepoznava z usmerjeno nevronsko mrežo primerna za vodenje sistemov z majhnim naborom ukazov. • V okolju brez motenj je prepoznava zanesljiva. • Problemi pri prepoznavi govora v okolju z naključnimi motnjami. • Implementacija obeh nevronskih mrež na DSP kartici.