1 / 32

OTL a.D. Dipl.-Ing. Johannes Naumann

Sprachverarbeitung zur Gesprächsauswertung, eine Einführung. OTL a.D. Dipl.-Ing. Johannes Naumann. Verfahren der automatisierten Sprachverarbeitung zur Gesprächsauswertung. OTL a.D. Dipl.-Ing. Johannes Naumann. Johannes Naumann, OTL (a.D.) Dipl. Ing. 38 Jahre Deutsche Luftwaffe

justus
Download Presentation

OTL a.D. Dipl.-Ing. Johannes Naumann

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sprachverarbeitung zur Gesprächsauswertung, eine Einführung OTL a.D. Dipl.-Ing. Johannes Naumann

  2. Verfahren der automatisierten Sprachverarbeitung zur Gesprächsauswertung OTL a.D. Dipl.-Ing. Johannes Naumann

  3. Johannes Naumann, OTL (a.D.) Dipl. Ing. 38 Jahre Deutsche Luftwaffe Verwendungen EloKa Offz Luftwaffenführungsdienstkommando Leiter der Erfassung FmSkt F, Kötzting Leiter ZBA, Trier (GEWOSC) EloKa St Offz LwA, LFlKdo Leiter Lw-Anteil BwKdo US/CA Sachgebietsleiter Elo beim ANBw,Gelsdorf Streitkräfteamt, Fähigkeitsanalyse NG&A & EloKa

  4. Disclaimer Dieser Vortrag gibt ausschließlich meine eigene Meinung wieder und stützt sich auf unabhängiges Denken gestützt auf 35 Jahre Erfahrung mit fast allen Spielarten der EloKa (EK) IO und auf die Physik, allgemein zugängliches Wissen und die verfügbare wissenschaftliche Information.

  5. Gliederung Motivation (Massendaten) Sprachen - Problem Kapazitäten - Problem Automatisierte Verfahren Netzwerkaufklärung Reach Back Technische Randbedingungen Klassifikatoren Demo

  6. Warum, Wieso, Weshalb ? Massendatenproblem wegen sehr stark gestiegener Funknutzung • bisher: potentieller Gegner war bekannt • seit Bw im Einsatz: potentieller Gegner zivil • JEDER kann es sein und alle reden miteinander

  7. Moderne Aufklärungsmittel hören aber mit ! Problem: Wer hört die 50.000 Gespräche / h ab ? 24 Mio Afghanen, die jeder 2 Stunden täglich telefonieren, belegen jeder 1/10 Kanäle, also 1,2 Mio gleichzeitige Gespräche täglich, macht 50.000 gleichzeitige Gespräche je Stunde Problem: Versteht der überhaupt die Sprache ?

  8. Das Sprachenproblem

  9. Wo sind die Auswerter, die 40 Sprachen sprechen ? Problem: Kleine Kapazitäten für viel Umfang Problem: Wer findet raus, was relevant ist ? Problem: Handelt es sich überhaupt um Sprache ?

  10. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache oder Geräusch ?

  11. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache oder Geräusch ?(Sprachdetection)

  12. z.B. durch Computerprogramme: Stochastische Verfahren, die Sprachlaute von Geräusch unterscheiden können Treffgenauigkeit ist begrenzt Es gibt Verfahren, die „trainiert“ werden müssen In unterschiedlichen Scenarien unterschiedliche Treffgenauigkeit

  13. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache oder Geräusch ? 2.: Welche Sprache ist das überhaupt ?

  14. Welche Sprache ist das überhaupt ? zunächst: Lautanalyse Jede Sprache hat spezielle Lautkombinationen Sprachmelodie (Frequenzanalyse) Sprachrhythmus, Pausen Konsonanten, Vokale, Diphtonge Phoneme

  15. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache, oder Geräusch ? 2.: Welche Sprache ist das überhaupt ? 3.: Erkenne ich den Sprecher?

  16. Wie erkenne ich den Sprecher ? • Frequenzspektrum der Stimme • Sprachraum der Stimme • Eigenheiten bei den verschiedenen Lauten Explosivlaute, Vokale: Klangfarbe Tonfall, Rhythmus Verschleifungen weitere Eigenheiten

  17. Es gilt, irrelevante Gespräche zu ignorieren, um wichtige Hinweise zu finden. Stichworte können ähnlich Sprechern als Bild, Signatur abgelegt werden

  18. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache oder Geräusch ? 2.: Welche Sprache ist das überhaupt ? 3.: Erkenne ich den Sprecher ? 4.: Erkenne ich Stichworte ?

  19. Stichworterkennung durch Vergleichen Erstellen von Mustern Vergleich der Muster mit dem Sprachmaterial Aufwendig. Spezielle Software, die nur charakteristische Teilmuster verwendet ist schneller

  20. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache oder Geräusch ? 2.: Welche Sprache ist das überhaupt ? 3.: Erkenne ich den Sprecher ? 4.: Erkenne ich Stichworte ? 5.: Erkenne ich Zusammenhänge ?

  21. Wie erkenne ich Zusammenhänge ? • Zusammenhang ergibt sich aus mehreren Stichworten • Kombination aus Stichworten und Ereignissen oder Daten Keywordspotting

  22. Wie kann automatisierte Sprachverarbeitung helfen ? 1.: Ist das Sprache oder Geräusch ? 2.: Welche Sprache ist das überhaupt ? 3.: Erkenne ich den Sprecher ? 4.: Erkenne ich Stichworte ? 5.: Erkenne ich Zusammenhänge ? 6.: Erkenne ich ein geplantes Ereignis ?

  23. Erkenne ich ein geplantes Ereignis ? Sprecher, Stichworte und Zusammenhänge können zu geplanten Ereignissen führen Dabei helfen Informationen aus anderen Diensten, wie z.B. Netzwerkaufklärung

  24. Netzwerkaufklärung Wie findet man heraus, was relevant ist ? IMSI-Catcher liefert ID, Standort, und gestattet das Mithören „IMSI-Catcher für 1500 Euro im Eigenbau.“ Heise-online, 1. August 2010.

  25. IMSI-Catcher: „Das Gerät arbeitet dazu gegenüber dem Mobiltelefon wie eine Funkzelle (Basisstation) und gegenüber dem Netzwerk wie ein Mobiltelefon; alle Mobiltelefone in einem gewissen Umkreis buchen sich bei dieser Funkzelle mit dem stärksten Signal, also dem IMSI-Catcher, ein. Der IMSI-Catcher simuliert also ein Mobilfunknetzwerk.“ (Wikipedia)

  26. Netzwerkaufklärung Datenstrom Statistische Verfahren zur Massendaten-Auswertung Ich erfahre: Wer, Wann, Wo, mit Wem, Wie lange, Wie oft telefoniert (kommuniziert) hat.

  27. Erkenne ich ein geplantes Ereignis ? Sprecher, Stichworte und Zusammenhänge können zu geplanten Ereignissen führen  Dabei helfen Informationen aus anderen Aktivitäten, wie z.B. Netzüberwachung  Gewonnene Informationen dienen dem gezielten Einsatz der Linguisten

  28. Reach Back Problem: 40 versch. Sprachen im Einsatzgebiet - Aufkommen schwankt - Kapazitäts-Engpässe - Bedrohung, Streß In der Heimat Pool an (ausgeruhten) Linguisten Daten erfassen – ableiten – Ergebnisse zurückschicken

  29. Technische Randbedingungen 1.: Quelle: Funk, Mobilfunk, Glasfaser 2.: Funk: Frequenz beliebig, Zeit unsicher 3.: Mobilfunk: ständiger Datenstrom 4.: Inhalt: unbestimmt, meist wertlos 5.: Charakter: überraschend: manchmal Merkel 6.: Ernüchternd: Normalbürger stört nur

  30. Klassifikatoren Beispiel Boger Beispiel Medav Verschriftungssoftware (nicht OCR)

  31. Vielen Dank für Ihre Aufmerksamkeit

More Related