1 / 53

Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC

IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC. Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC. Diana Bindrich, diana13th@yahoo.de Stephan Lehmann, uni@stephanlehmann.net.

kedem
Download Presentation

Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, diana13th@yahoo.de Stephan Lehmann, uni@stephanlehmann.net

  2. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  3. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  4. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen

  5. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei

  6. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen stimmhafter Laut

  7. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Laut stimmloser Laut

  8. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut

  9. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n)

  10. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz

  11. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz Grundfrequenz 50 bis 400 Hz

  12. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz

  13. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz zulässig stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz

  14. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  15. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung

  16. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung

  17. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung Stimmbänder Rachenraum Luftstrom aus der Lunge

  18. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung

  19. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Parameter ändern sich beim Sprechen Modell mit einem festen Parametersatz nur zur Beschreibung sehr kurzer Sprachstücke geeignet ca. 20 ms

  20. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  21. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz 8 Bit/sample 8000 samples/s x 8 Bit/sample = 64 kBit/s

  22. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms

  23. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms

  24. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms 8 Bit/sample 1280 Bit pro 20 ms

  25. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  26. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Stimmlose Laute: • niedrige Energie • Viele Nulldurchgänge • Stimmhafte Laute: • hohe Energie • weniger Nulldurchgänge da Frequenzbereich niedriger Frequenzbereich: 2400 bis 3200 Hz Frequenzbereich: 800 bis 1600 Hz

  27. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 598 Nulldurchgänge: 83

  28. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 88844 Nulldurchgänge: 14

  29. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 2690 Nulldurchgänge 8

  30. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie 4677 Nulldurchgänge 102

  31. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  32. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Die Aufgaben des Octave- Skripts detect.m • Sprachsignal einlesen und in 160 samples lange frames aufteilen • frame an den dsPIC senden • LPC- Parameter vom dsPIC empfangen • Mittels empfangenem Gain und Pitch Eingangssignal erzeugen • Eingangssignal durch das Filter modulieren lassen • Punkt 2-5 mit allen frames wiederholen • Alle so neu erzeugten frames zusammenfügen und in Wave- Datei abspeichern Kompression durch den dsPIC

  33. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen Autokorrelation LevinsonDurbin AMDF getPitch findMin

  34. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation Octave Pausenerkennung LevinsonDurbin ak AMDF getPitch findMin

  35. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Gleichungssystem zur Bestimmung der Filterkoeffizienten mit

  36. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation LevinsonDurbin ak AMDF getPitch findMin

  37. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin

  38. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin

  39. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin

  40. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin

  41. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin

  42. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC

  43. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin

  44. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin

  45. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Zurücksenden von Koeffizienten, Gain, Pitch Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin

  46. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

  47. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Kompression 12 Werte (Koeffs, Gain, Pitch) statt 160 Parameterkompression 160/12 = 13,3 • ABER: • Parameter haben andere Wertebereiche • Gleitkommazahlen für LPC-Parameter haben 32 Bit • Samples des Signals 8 Bit • 1280Bit/384 Bit Kompression 3,3

  48. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierung • Durch geeignete Kodierung der Parameter runter bis 48 Bit mgl -> k=26,6

  49. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierungsmöglichkeiten • Verfahren funktioniert, hat aber Schwächen: • Qualität • Laufzeit • Also: • Andere Koeffizientenverfahren • Weitere Sicherheitsmechanismen • Erweiterungen z.B. CELP (Optimierung über anderes Filtereingangssignal)

  50. IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel

More Related