530 likes | 642 Views
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC. Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC. Diana Bindrich, diana13th@yahoo.de Stephan Lehmann, uni@stephanlehmann.net.
E N D
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, diana13th@yahoo.de Stephan Lehmann, uni@stephanlehmann.net
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen stimmhafter Laut
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Laut stimmloser Laut
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n)
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz Grundfrequenz 50 bis 400 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz zulässig stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung Stimmbänder Rachenraum Luftstrom aus der Lunge
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Periodische Impulse stimmhaft Verstärkung LPC- Filter H(z) Sprachsignal G stimmlos Rauschen Vereinfachtes Modell zur Spracherzeugung
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Parameter ändern sich beim Sprechen Modell mit einem festen Parametersatz nur zur Beschreibung sehr kurzer Sprachstücke geeignet ca. 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz 8 Bit/sample 8000 samples/s x 8 Bit/sample = 64 kBit/s
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms 8 Bit/sample 1280 Bit pro 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Stimmlose Laute: • niedrige Energie • Viele Nulldurchgänge • Stimmhafte Laute: • hohe Energie • weniger Nulldurchgänge da Frequenzbereich niedriger Frequenzbereich: 2400 bis 3200 Hz Frequenzbereich: 800 bis 1600 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 598 Nulldurchgänge: 83
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 88844 Nulldurchgänge: 14
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 2690 Nulldurchgänge 8
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie 4677 Nulldurchgänge 102
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Die Aufgaben des Octave- Skripts detect.m • Sprachsignal einlesen und in 160 samples lange frames aufteilen • frame an den dsPIC senden • LPC- Parameter vom dsPIC empfangen • Mittels empfangenem Gain und Pitch Eingangssignal erzeugen • Eingangssignal durch das Filter modulieren lassen • Punkt 2-5 mit allen frames wiederholen • Alle so neu erzeugten frames zusammenfügen und in Wave- Datei abspeichern Kompression durch den dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen Autokorrelation LevinsonDurbin AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation Octave Pausenerkennung LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Gleichungssystem zur Bestimmung der Filterkoeffizienten mit
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Zurücksenden von Koeffizienten, Gain, Pitch Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Kompression 12 Werte (Koeffs, Gain, Pitch) statt 160 Parameterkompression 160/12 = 13,3 • ABER: • Parameter haben andere Wertebereiche • Gleitkommazahlen für LPC-Parameter haben 32 Bit • Samples des Signals 8 Bit • 1280Bit/384 Bit Kompression 3,3
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierung • Durch geeignete Kodierung der Parameter runter bis 48 Bit mgl -> k=26,6
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierungsmöglichkeiten • Verfahren funktioniert, hat aber Schwächen: • Qualität • Laufzeit • Also: • Andere Koeffizientenverfahren • Weitere Sicherheitsmechanismen • Erweiterungen z.B. CELP (Optimierung über anderes Filtereingangssignal)
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC • Menschliche Sprache • Modell zur Spracherzeugung • Speicherplatz • Unterscheidung stimmhafter und stimmloser Laute • Umsetzung des Modells auf dem dsPIC • Optimierungsansätze • Beispiel