410 likes | 589 Views
Bandwidth Expansion of Narrow band Speech using Linear Prediction. Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann. Group 742 Institute of Electronic Systems Department of Communications Technology
E N D
Bandwidth Expansion of Narrow band Speech using Linear Prediction Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann Group 742 Institute of Electronic Systems Department of Communications Technology Aalborg University, 2004
Præsentation fra Semcon conference Poster præsentation Abstract Arbejdsmetodik og arbejdsblade Envelope Excitation Artikel Agenda
Todays Narrow band telephone systems • Bandwidth of speech is more than 8 kHz • Limited bandwidth of todays system • Too expensive to expand current telephone systems. • Expansion at the receiving end of the telephoneline
Envelope Estimation System overview LSF transform Codebook mapping Inv. LSF Transform • Transforms the LPC coefficients into LSF (Line Spectrum Frequency) • Codebook used for prediction of upper frequencies
Excitation Estimation • Modulation moves the frequency • Pitch detection estimates the fundamental frequency
The result At the user Public telephone system Telephone switch Telephone switch Bandwidth Expansion
Poster præsentation Frederik
Bygget op omkring IMRaD-modellen Centralt placerede figurer Selvforklarende figurer Kortfattet tekst Tekst underbygges af figurer Kommunikative virkemidler
Abstract Peter
Titel IMRaD Introduktion Metoder Resultater Diskussion AbstractOversigt Titel Introduktion Metoder Resultater Diskussion
Beskrive rapporten så præcist som muligt Skal ikke være for lang Skal præsentere ”key words”. Bandwidth Expansion of Narrowband Speech using Linear Prediction Abstract Oversigt Titel Introduktion Metoder Resultater Diskussion
Beskrivelse af problemstillingen Uddybelse af problem, så læseren ikke er i tvivl om hvad projektet handler om Kan bruges som en ”appetitvækker” ”...,thus making the speech sound more realistic and pleasant” AbstractOversigt Titel Introduktion Metoder Resultater Diskussion
Forklaring af brugte metoder Forklaring af løsningsforslag Inddrag ikke resultater i Metoder Signal split into two parts.... LP coefficient → LSFcoefficient LSF codebook AbstractOversigt Titel Introduktion Metoder Resultater Diskussion
Forklaring af testmetode Præsentation af relevante resultater, evt. Ikke alle resultater fra projektet. ”Spectrograms of the reconstructed wideband signal verified.....” ”Convergence measurements ranging.....” Listening test AbstractOversigt Titel Introduktion Metoder Resultater Diskussion
Opsummerer de mest relevante resultater Diskuterer resultaterne Diskuterer fremtidigt arbejde ”The algorithm for wideband expansion proved to work...” ”However, unwanted artefacts developed in the reconstruction af the wideband signal” AbstractOversigt Titel Introduktion Metoder Resultater Diskussion
Projektet blev delt op i flere mindre dele Hver del blev undersøgt og behandlet af 1-3 personer Dele og grupper blev løbende revideret Alle undersøgelser og behandlinger blev beskrevet i arbejdsblade Arbejdsmetoder
Codebook LP Envelope analysis extension LP synthesis LP Excitation estimation extension Arbejdsblade • Excitation extension • Cepstral signal analysis for pitch detection • Pitch detection • Vector Quantization • Codebook training • Generating the codebook for speech enhancement • The K-means Clustering Algorithm • Overview of the human speech system • Framing and deframing • LPC modeling of vocal tract • Envelope and excitation evaluation • Listening test • Reflection Coefficients • Telephone filter • Line Spectrum Pairs
Envelope Brian
Vocal tract model Line Spectrum Frequency Codebook Spectral distortion Envelope
Spectral distortion Mål : Spectral distortion < 1dB
Excitation Jakob
Excitation Extension • Ønsket funktionalitet • Filtrering og opsampling • Rekonstruktion af residualsignal
Ønsket funktionalitet • Rekonstrueret residualsignal lig originalt • Genskabe amplitudespektrum • Karakteristika • Filtreringsproblem
Filtrering og opsampling • Telefilter • -HP-filter: fp = 300 Hz fs = 250 Hz • -LP-filter: fp = 3400 Hz fs = 3450 Hz • Residualfilter • -HP-filter: fp = 350 Hz fs = 300 Hz • -LP-filter: fp = 3350 Hz fs = 3400 Hz
Rekonstruktion • Modulation • Addition af hvid støj
Rekonstruktion • Addering af pitchfrekvens • Tilpasning af fase • Problem ved segmentoverlap • Forbedringer • Midling af pitch • Kalman-filter • Pitchdetektion af svage signaler
Gennemgang af artikel Bjarke
Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Gennemgang • IMRaD • Indhold og opbygning af afsnit • Videnskabelig fremgangsmetode(r) • Særlig fokus på resultater / konklusion
Problemstilling Valg af løsnings-metode Videnskabelig gen-nemgang af metoder Vurdering af resultater Undersøgelse af løsnings-metoder Anvendelse af nye / kombination af eksisterende metoder Test metoder og resultater af tests Konklusion Gennemgang af artikel Artiklens opbygning
Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Indhold • Kort beskrivelse af problemstilling • Anvendte metoder i løsning • Resultat
Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Problemstilling • Telefonsystem båndbrede begrænset (300-3400 Hz) • Mål: Båndbrede på 80-8000 Hz • Løsning • Undersøgt eksisterende løsninger / ideer • - Problemstilling ikke løst • Arbejde videre med eksisterende idé • Mål: Finde / forbedre metoder til implementering af idé
Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Eksisterende metoder • Anvendelse af metoder • Kombination af metoder • Nye ideer • LPC LSF koefficienter • Anvendelse af kodebog • Modulation af residual signal
Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Test metoder • Matematisk - Talstørrelse for godhed • Visuelt - Identificering af mangler • Lyttetest - Overordnet resultat • Mål med test • Sammenligne resultater • Identificering af problemer i metoder • Brugeres vurdering af metoder
Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Vurdering af resultater • Matematiske resultater • Visuelle resultater • Lyttetest resultater • Konklusion • Båndbredeudvidelse opnået • Metoder mangler videre udvikling • Spectral Distortion • - 5,3 < μ < 7,0 dB • - 2,4 < σ2 < 7,4 dB2 • - Ingen spectral transparency (1,0 dB) • Forklaringer • - Kodebog er mangelfuld • - Sammenhæng mellem bånd utilstrækkelig • Spectrogrammer • - Tilføjet komponenter til øvre bånd • - Unvoiced lyd gengives ultilstrækkeligt i øvre bånd • - Sinus element tilføjet upræcist i nedre bånd • Forklaringer • - Envelope extension virker utilstrækkelig i øvre bånd • - Excitation extension virker utilstrækkelig i nedre bånd • A/B test • - Original telefon signal fortrukket • Forklaringer • - Artefakter introduceret i signal • - Utiltrækkelig gengivelse af unvoiced lyd