360 likes | 472 Views
Spraakverstaanbaarheid (criteria, normalisatie, subjectieve en objectieve verstaanbaarheidsmaten, toepassingen en voorspelkracht). Herman J.M. Steeneken (www.steeneken.com). Overzicht. Kwaliteit van Spraakcommunicatie Spraakverstaanbaarheidmaten Evaluatiemethoden (subjectief-objectief)
E N D
VPT 2008 Spraakverstaanbaarheid (criteria, normalisatie, subjectieve en objectieve verstaanbaarheidsmaten, toepassingen en voorspelkracht) Herman J.M. Steeneken (www.steeneken.com)
VPT 2008 Overzicht • Kwaliteit van Spraakcommunicatie • Spraakverstaanbaarheidmaten • Evaluatiemethoden (subjectief-objectief) • Voorspellingsmethoden • Samenvatting
VPT 2008 Het communicatiekanaal
VPT 2008 Het communicatiekanaal Spreker (stem, moedertaal, vocale inspanning) Transmissiepad (lawaai, akoestiek, vervorming) Luisteraar (gehoor, moedertaal)
VPT 2008 Spraakcommunicatiekwaliteit Spraakwaliteit Spraakverstaanbaarheid Vocale inspanning Objectieve voorspellingsmethoden
VPT 2008 Toepassing en criteria (ISO-9921) Toepassing bij: verst. “vocal effort” Gevaar en waarschuwing matig luid Persoon-tot-persoon (kritiek) redelijk luid Persoon-tot-persoon (algemeen) goed ontspannen Omroepinstallaties openbaar goed normaal Persoonlijke comm. systemen goed normaal
VPT 2008 Evaluatiemethoden Subjectieve evaluatie • meerdere sprekers en luisteraars • specifieke testmethoden • representatief • resultaten soms niet reproduceerbaar Objectieve evaluatie • voorspelling van verstaanbaarheid • diagnostisch • reproduceerbaar
VPT 2008 Subjectieve evaluatie • Mean Opinion Scores (korte zinnen) beoordeling op (vijfpuntsschaal), zeer veel ppn. • Speech Reception Threshold slechts voorspelling bij 50% zinsverstaanbaarheid • (Nonsens)woorden in (dragerzin) indirect, groot bereik, arbeidsintensief
VPT 2008 Objectieve evaluatiemethoden • Speech Interference Level (SIL) beperkt tot directe communicatie in lawaai • Speech Transmission Index (STI) geschikt voor alle soorten vervorming • Speech Intelligibility Index (SII) geen niet-lineaire en temporele vervorming
VPT 2008 Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten
VPT 2008 Relatie tussen subjectieve en objectieve verstaanbaarheidsmaten Kwalificatie Sent.% CVC % PB % STI LSA – LLN nonsens bestaande dB woorden woorden Uitstekend 100 >81 > 98 >0.75 21 Goed 100 70-81 93-98 0.60-0.75 15 - 21 Redelijk 100 53-70 80-93 0.45-0.60 9 - 15 Matig 70-100 31-53 60-80 0.30-0.45 3 - 9 Slecht <70 <31 <60 < 0.30 <3
VPT 2008 Demonstratie van vier kwalificaties Uitstekend SNR = 11 dB Goed SNR = 5 dB Redelijk SNR = 1 dB Matig SNR = - 4 dB Toegevoegde ruis op basis van het gemiddelde spraakspectrum
VPT 2008 Criteria ISO-9921 Toepassing Verst. SIL STI Vocale inspan. Alarm Waarschuwing matig 9 0.45 Luid Persoon-tot-persoon (kritisch) redelijk 9 0.50 Luid Persoon-tot-persoon (ontspan.) goed 15 0.60 Ontspan. Omroepinstallatie openbaar redelijk 11 0.50 Normaal Persoonlijke communicatie redelijk 11 0.50 Normaal
VPT 2008 Voorspellingsmethoden SIL, vocale inspanning, omgevingslawaai STI, vocale inspanning, geslacht spreker, omgevingslawaai, bandbreedte-beperking, maskering, nagalm, echo’s, niet-lineairiteit, (IEC 60268-16) SII, vocale inspanning, omgevingslawaai, bandbreedte-beperking, maskering, (ANSI 305.2)
VPT 2008 Demonstratie van kwalificatie “Redelijk” Redelijk SNR = 1 dB, (STI = 0,53) geen bandbreedte-beperking Redelijk SNR = 3 dB, (STI = 0,53) bandbreedte 375 - 5600 Hz Toegevoegde ruis op basis van het gemiddelde spraakspectrum
VPT 2008 Speech Transmission Index (STI) Gewogen SNR levert voorspelling spraakkwaliteit
VPT 2008 Modulatieoverdracht (lijnfrequentie)
VPT 2008 Omhullende funktie en spectrum
VPT 2008 Omhullende funktie met nagalm en ruis
VPT 2008 Modulatieoverdracht (MTF) De MTF wordt verkregen door de omhullende-spectra van het originele en ontvangen spraaksignaal te vergelijken
VPT 2008 Matrix voor zeven MTF’s 1 Hz 3 Hz 10 Hz 10 Hz X
VPT 2008 Modulatieoverdracht meten met testsignaal
VPT 2008 Berekening STI (Spraak Transmissie Index) Voor elke octaafband wordt eerst de effectieve SNR bepaald De gewogen octaaf-bijdrage levert de STI
VPT 2008 Optimale frequentieweging De bijdrage per frequentieband hangt af van het type spraak
VPT 2008 Redundante informatie is overbodig!
VPT 2008 Redundantie in het spraakspectrum
VPT 2008 Proefpersonen aan het werk
VPT 2008 Proefpersoon responsies CVC woorden, dragerzin: versta des over en nu fijs uit het woord zek einde noteer lal punt “Semi random” combinatie van: 17 beginmedeklinkers 15 klinkers 11 eindmedeklinkers
VPT 2008 Relatie tussen woordscores en STI Relatie STI/CVC-score voor mannelijke spraak en condities met ruis en bandbreedte-beperking De verticale spreiding bedraagt s.d. 4.8%
VPT 2008 STI voor Cabine-omroepinstallatie
VPT 2008 Iso STI-contouren in collegezaal
VPT 2008 Effectieve versterking van PA-systeem STI als funktie het omgevings- lawaainiveau Twee condities (met en zonder toespreekinstallatie) Verschil in lawaainiveau bij zelfde STI-waarde levert effectieve versterking van de toespreekinstallatie
VPT 2008 STI gemeten met spraaksignalen MTF via verschil van omhullendespectra van verzonden en ontvangen spraaksignalen Toepasbaar bij ruis, nagalm en echo’s maar niet bij niet-lineaire vervorming
VPT 2008 RASTI (room acoustical STI, 1980) Screening-apparaat 2 Octaafbanden Continu testsignaal Verouderd (gebruik STIPA)!
VPT 2008 STIPA (STI Public Address, 2001) Evaluatie voor Public Address Omvat: akoestische omgeving, bandbreedtebeperking, oversturingsvervorming Zeven octaafbanden (125 Hz en 250 Hz samen) Complex omhullende (2 simultane modulatie- frequenties per band) zie: IEC 60268-16
VPT 2008 Conclusies Criteria voor vele toepassingen volgens ISO-9921 Subjectieve methoden: representatief, niet diagnostisch Objectieve methoden: voorspellen, snel, diagnostisch