Frekvencijska svojstva ljudskog uha

Frekvencijska svojstva ljudskog uha Nina Marević & Branimir Dropuljić

Kako čujemo? • Nakon što su podražene osjetne slušne stanice dolazi do pretvaranja mehaničke energije zvuka u električni impuls koji se provodi putem slušnog živca i slušnog puta do moždane kore gdje nastaje svjesna percepcija zvuka.

Kako napraviti aproksimaciju ljudskog sluha na računalu? • Zvuk kojeg ljudsko uho čuje se kreće od 20-tak Hz do 20kHz. • Frekvencije ispod 20 ili iznad 20 kHz ne primjećujemo u prirodi i nije ih potrebno propuštati u programskom modelu. • Karakteristično je za ljudsko uho da ne čuje sve frekvencije jednako. • Selektivnost na najnižim je frekvencijama oko 100 Hz, ali na onim višim iznosi i više od 4 kHz

Kako napraviti aproksimaciju ljudskog sluha na računalu? • IDEJA: raspon frekvencija koje čovjek čuje razdijeliti u 30-ak pojaseva preko 30-ak filtara • Samo tu frekvencijsku skalu nećemo podijeliti linearno - nego prema mel-skali, jer ona više odgovara prirodnim karakteristikama ljudskog uha. • Veza mel skale s frekvencijskomse definira kao: Mel= 1127.01048 loge(1+f/700)

Kako smo osmislili sklop? Algoritam: • projektiranje filtara • logatiram anvelope energija svakog kanala • primjena brzog kepstra na svaki uzorak zasebno • decimiranje signala

Kako smo pisali kod? • prvi korak je projektiranje filtara • u mel skali svi su filtri jednaki • u frekvencijskoj skali vidimo da suselektivinijiza niže frekvencije, a manje selektivni za više • baš takva je i karakteristika ljudskog uha

Filtri • Svaki pojedini filtar konvoluiramo s istim Blackmannovim otvorom - da bi dobili glađi impulsni odziv jednake duljine za svaki filtar • Također ćemo y-os prikazati i u logaritamskom mjerilu

Filtri • U idealnom slučaju kad zbrojimo sve filtre po y-osi bi trebali dobiti svepropusni filtar iznosa jednakog koeficijentu preklapanja filtara. • Ali prvi i zadnji filtar imaju centre na samim rubovima, oni i nekoliko njima najbližih trokutastih filtara s kojima se preklapaju, nemaju potpun obllik trokuta, nego su “prekinuti” • Zato se javljaju propadi napočetku i na kraju prikaza odstupanja.

Impulsni odzivi • Svi impulsni odzivi flitara zbrojeni bi trebali davati jedinični impulsni odziv, odnosno dirach u nuli. • Desna slika prikazuje koliko smo pogriješili, tj. razliku Diracha i onoga što smo mi dobili.

Impulsni odzivi • Prvi filtar ima najširi i najniži impulsni odziv, te kao takav propušta niže frekvencije. • Zadnji filtar ima najuži i najviši impulsni odziv, te kao takav propušta više frekvencije.

Signal kojeg smo obrađivali • izgovor 6 samoglasnika "a", "e", "i", "o", "u", "з“ • Frekvencija otipkavanja je 44 kHz

Izlaz pojedinih filtara

Izlaz sklopa • kada pozbrojimo izlaze svih kanala - dobijemo opet izgovor gotovoidentičan ulaznom signalu • ulazni signal zamislitikao onošto nam neko kaže,a sumu, tj.izlazni signal -kao ono što naše uho čuje • preslušavajući sumu izlaza kanala primjećujemo da je razumljivost zadovoljavajuća

Izlaz sklopa • Za prikaz najpogodnija anvelopa od logaritma energije. • Signal se prvo kvadrira ikroz filtar (impulsni odzivveličine 1000 uzoraka, gladak) • Nakon konvolucije, signal se logaritmira,i množi s 10 • Cilj je dodatno naglasiti niže frekvencijske komponente

Prikaz rezultata • Spektrogram - prikaz promjene frekvencijskih karakteristika signala u vremenu. • Visina (boja) je treća dimenzija spektrograma-koja prikazuje kolko je jako izražena pojedina frekvencija za pojedini uzorak. • smetnja gradske mreže • niže frekvencije bolje pokrivene

Dotjerivanje rezultata • promatramo jedan uzorak kakvim ga vide svaki od 31-og kanala • krivulja je izlomljena • to nam ne odgovara – uzrokuje grube prelaze u spektrogramu u smjeru y- osi. • glađenje primjenom kepstara

razlika log-en-spektara prije i nakon zaglađivanja – možemo uočiti da tamo gdje su bile najveće promjene, skokovi, na razlici slika su maksimumi • to znači da je zaglađivanje bilo uspješno

Nulti kepstar predstavlja DC-komponentu spektra, odnosno srednju vrijednost (energiju uzorka signala) • energije u trenutcima izgovora su znatno veće od energija u trenutcima tišine, stoga nam nulti kepstar može dobro poslužiti za detekciju govora • vrši se decimacija izlaznih signala po vremenu, (faktor decimacije takav da na kraju nemamo više od 10000 uzoraka)

Hvala na pažnji !!!

Frekvencijska svojstva ljudskog uha

Frekvencijska svojstva ljudskog uha

Presentation Transcript

SVOJSTVA I PRIMJENA VODLJIVIH MATERIJALA

SVOJSTVA DRVA

Svojstva tekucina

Svojstva za uređivanje teksta

Ugljikove nanocijevi: Svojstva i primjene

Fotokatalitička svojstva dopiranog TiO 2

KEMIJSKI ELEMENTI LJUDSKOG TIJELA

Valno-čestična svojstva zračenja

PEDOLOGIJA - definicija, uloge i svojstva tla -

Vrste i svojstva materijala

UHA Staff

SVOJSTVA I PRIMJENA DIELEKTRIČNIH MATERIJALA

Osnovna svojstva

TALASNA SVOJSTVA ČESTICA

MEHANIČKA SVOJSTVA STIJENA

FIZIKA LJUDSKOG ORGANIZMA

Svojstva i vrijednost informacije Informacijska sigurnost

SVOJSTVA RAČUNALA

Atmosfera, sastav i fizička svojstva

Atmosfera, sastav i fizička svojstva

POLUDOVIČI - SVOJSTVA I PRIMJENA

POLUPROVODNICI (POLUVODIČI) - SVOJSTVA I PRIMJENA