1 / 40

Bandwidth Expansion of Narrow band Speech using Linear Prediction

Bandwidth Expansion of Narrow band Speech using Linear Prediction. Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann. Group 742 Institute of Electronic Systems Department of Communications Technology

Download Presentation

Bandwidth Expansion of Narrow band Speech using Linear Prediction

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Bandwidth Expansion of Narrow band Speech using Linear Prediction Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann Group 742 Institute of Electronic Systems Department of Communications Technology Aalborg University, 2004

  2. Præsentation fra Semcon conference Poster præsentation Abstract Arbejdsmetodik og arbejdsblade Envelope Excitation Artikel Agenda

  3. Todays Narrow band telephone systems • Bandwidth of speech is more than 8 kHz • Limited bandwidth of todays system • Too expensive to expand current telephone systems. • Expansion at the receiving end of the telephoneline

  4. Envelope Estimation System overview LSF transform Codebook mapping Inv. LSF Transform • Transforms the LPC coefficients into LSF (Line Spectrum Frequency) • Codebook used for prediction of upper frequencies

  5. Excitation Estimation • Modulation moves the frequency • Pitch detection estimates the fundamental frequency

  6. The result At the user Public telephone system Telephone switch Telephone switch Bandwidth Expansion

  7. Poster præsentation Frederik

  8. Bygget op omkring IMRaD-modellen Centralt placerede figurer Selvforklarende figurer Kortfattet tekst Tekst underbygges af figurer Kommunikative virkemidler

  9. Abstract Peter

  10. Titel IMRaD Introduktion Metoder Resultater Diskussion AbstractOversigt Titel Introduktion Metoder Resultater Diskussion

  11. Beskrive rapporten så præcist som muligt Skal ikke være for lang Skal præsentere ”key words”. Bandwidth Expansion of Narrowband Speech using Linear Prediction Abstract Oversigt Titel Introduktion Metoder Resultater Diskussion

  12. Beskrivelse af problemstillingen Uddybelse af problem, så læseren ikke er i tvivl om hvad projektet handler om Kan bruges som en ”appetitvækker” ”...,thus making the speech sound more realistic and pleasant” AbstractOversigt Titel Introduktion Metoder Resultater Diskussion

  13. Forklaring af brugte metoder Forklaring af løsningsforslag Inddrag ikke resultater i Metoder Signal split into two parts.... LP coefficient → LSFcoefficient LSF codebook AbstractOversigt Titel Introduktion Metoder Resultater Diskussion

  14. Forklaring af testmetode Præsentation af relevante resultater, evt. Ikke alle resultater fra projektet. ”Spectrograms of the reconstructed wideband signal verified.....” ”Convergence measurements ranging.....” Listening test AbstractOversigt Titel Introduktion Metoder Resultater Diskussion

  15. Opsummerer de mest relevante resultater Diskuterer resultaterne Diskuterer fremtidigt arbejde ”The algorithm for wideband expansion proved to work...” ”However, unwanted artefacts developed in the reconstruction af the wideband signal” AbstractOversigt Titel Introduktion Metoder Resultater Diskussion

  16. Arbejdsmetodik og arbejdsblade Ole

  17. Projektet blev delt op i flere mindre dele Hver del blev undersøgt og behandlet af 1-3 personer Dele og grupper blev løbende revideret Alle undersøgelser og behandlinger blev beskrevet i arbejdsblade Arbejdsmetoder

  18. Codebook LP Envelope analysis extension LP synthesis LP Excitation estimation extension Arbejdsblade • Excitation extension • Cepstral signal analysis for pitch detection • Pitch detection • Vector Quantization • Codebook training • Generating the codebook for speech enhancement • The K-means Clustering Algorithm • Overview of the human speech system • Framing and deframing • LPC modeling of vocal tract • Envelope and excitation evaluation • Listening test • Reflection Coefficients • Telephone filter • Line Spectrum Pairs

  19. Envelope Brian

  20. Vocal tract model Line Spectrum Frequency Codebook Spectral distortion Envelope

  21. Vocal tract model

  22. Line Spectrum Frequency

  23. Codebook

  24. Spectral distortion Mål : Spectral distortion < 1dB

  25. Excitation Jakob

  26. Excitation Extension • Ønsket funktionalitet • Filtrering og opsampling • Rekonstruktion af residualsignal

  27. Ønsket funktionalitet • Rekonstrueret residualsignal lig originalt • Genskabe amplitudespektrum • Karakteristika • Filtreringsproblem

  28. Filtrering og opsampling • Telefilter • -HP-filter: fp = 300 Hz fs = 250 Hz • -LP-filter: fp = 3400 Hz fs = 3450 Hz • Residualfilter • -HP-filter: fp = 350 Hz fs = 300 Hz • -LP-filter: fp = 3350 Hz fs = 3400 Hz

  29. Rekonstruktion • Modulation • Addition af hvid støj

  30. Rekonstruktion • Addering af pitchfrekvens • Tilpasning af fase • Problem ved segmentoverlap • Forbedringer • Midling af pitch • Kalman-filter • Pitchdetektion af svage signaler

  31. Gennemgang af artikel Bjarke

  32. Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Gennemgang • IMRaD • Indhold og opbygning af afsnit • Videnskabelig fremgangsmetode(r) • Særlig fokus på resultater / konklusion

  33. Problemstilling Valg af løsnings-metode Videnskabelig gen-nemgang af metoder Vurdering af resultater Undersøgelse af løsnings-metoder Anvendelse af nye / kombination af eksisterende metoder Test metoder og resultater af tests Konklusion Gennemgang af artikel Artiklens opbygning

  34. Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Indhold • Kort beskrivelse af problemstilling • Anvendte metoder i løsning • Resultat

  35. Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Problemstilling • Telefonsystem båndbrede begrænset (300-3400 Hz) • Mål: Båndbrede på 80-8000 Hz • Løsning • Undersøgt eksisterende løsninger / ideer • - Problemstilling ikke løst • Arbejde videre med eksisterende idé • Mål: Finde / forbedre metoder til implementering af idé

  36. Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Eksisterende metoder • Anvendelse af metoder • Kombination af metoder • Nye ideer • LPC  LSF koefficienter • Anvendelse af kodebog • Modulation af residual signal

  37. Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Test metoder • Matematisk - Talstørrelse for godhed • Visuelt - Identificering af mangler • Lyttetest - Overordnet resultat • Mål med test • Sammenligne resultater • Identificering af problemer i metoder • Brugeres vurdering af metoder

  38. Gennemgang af artikel Abstract Introduktion Metoder Resultater Diskussion / konklusion • Vurdering af resultater • Matematiske resultater • Visuelle resultater • Lyttetest resultater • Konklusion • Båndbredeudvidelse opnået • Metoder mangler videre udvikling • Spectral Distortion • - 5,3 < μ < 7,0 dB • - 2,4 < σ2 < 7,4 dB2 • - Ingen spectral transparency (1,0 dB) • Forklaringer • - Kodebog er mangelfuld • - Sammenhæng mellem bånd utilstrækkelig • Spectrogrammer • - Tilføjet komponenter til øvre bånd • - Unvoiced lyd gengives ultilstrækkeligt i øvre bånd • - Sinus element tilføjet upræcist i nedre bånd • Forklaringer • - Envelope extension virker utilstrækkelig i øvre bånd • - Excitation extension virker utilstrækkelig i nedre bånd • A/B test • - Original telefon signal fortrukket • Forklaringer • - Artefakter introduceret i signal • - Utiltrækkelig gengivelse af unvoiced lyd

More Related