150 likes | 288 Views
Hergebruik van taal - en spraakdata in e-health. Remco van Veenendaal projectleider TST-Centrale Ehealth4com Nijmegen 3 oktober 2013. Onderzoek. Wie van u … Maakt of verzamelt taal - en spraakdata ? ( Bijv . teksten , spraakopnames , videomateriaal )
E N D
Hergebruik van taal- en spraakdatain e-health Remco van Veenendaal projectleider TST-Centrale Ehealth4com Nijmegen 3 oktober 2013
Onderzoek • Wievan u… • Maakt of verzamelttaal- en spraakdata? • (Bijv. teksten, spraakopnames, videomateriaal) • Deelttaal- en spraakdatamet anderen of hergebruikttaal- en spraakdata van anderen?
Waaromhergebruik? DaanRoosegaarde: “Delenis het nieuwehebben.” Neelie Kroes: “Data zijn het nieuwe goud.”
Ehealth4com en hergebruik • Symposiumwebsite: • “Ontwikkelingen in de taal- en spraaktechnologie dragen bij aan toepassingen voor de behandeling en ondersteuning van mensen met een communicatieve beperking. (…) Speciale aandacht gaat uit naar het verzamelen van taal- en spraakdata om geavanceerde e-healthtoepassingente ontwikkelen, gericht op diagnostiek en behandeling van communicatieve beperkingen.” • Anders, concreter: • U kunt door de behandeling en ondersteuning van mensen met eencommunicatievebeperkingbijdragenaanontwikkelingen in de taal- en spraaktechnologie, bijvoorbeeld door specialeaandachtteschenkenaan het verzamelen van taal- en spraakdata. • En: • De TST-Centrale kan u daarbijhelpen. Samenzorgen we erzovoordatergeavanceerdee-healthtoepassingenontwikkeldkunnenworden.
Ja, maar… • Geen Big Science • Big budgets • Big staffs • Big machines • Big laboratories • Maar “Small Science” • Beperktebudgetten • Kleineorganisaties • Geringecommerciëleinteresse • Grote diversiteitaanbehoeften
De Taalunie scheptkansen • Samenwerking Nederland, Vlaanderen en Suriname • STEVIN: onderzoeknaar en basistaalmaterialenvoortaal- en spraaktechnologie (TST) • TST-Centrale • Advisering • Beheer en onderhoud • Beschikbaarstelling en ondersteuning
Advisering • Makelen en schakelen: wat is elders (al) beschikbaar? • Welkestandaarden en (open) formaten? • Welkeafspraken met uw “leveranciers”? • Contracten, sprekerformulieren • Welkeafsprakentussen u en ons? • Samenwerkingsovereenkomst • Welkeafspraken met gebruik(ers)? • Gebruikerslicenties
Beheer en onderhoud • Beheer (medio 2013) • Voorbeeldenonderhoud • Updates van formaatversies • Verbetering(online) zoekapplicaties • Aanvulling en verbetering (‘bugfixing’) van data
Beschikbaarstelling en ondersteuning • Licenties (medio 2013) • Excl. webapplicaties • Incl. Google • Voorbeeldenondersteuning • Gastcolleges • Data op maat • Hulpbij contract met uitgever
Beschikbaarstellingook via Europese CLARIN • CLARIN werktaanmakkelijke en duurzametoegang tot digitaletaaldata en geavanceerdetaaltools, waardezezichookbevinden • Taalunie lid van CLARIN ERIC • TST-Centrale verzorgtNederlands-Vlaamsknooppuntin CLARIN-infrastructuur
Taal- en spraakdatavoore-healthtoepassingen • Corpus Gesproken Nederlands • Trainenspraakherkenning en spraaksynthese • Computerprogramma dat ondersteuning biedt bij het lezen, spreken en schrijven • Woordvoorspellerbijspreken, voormensen met eencommunicatievebeperking • Cornetto: tekst-naar-pictogram-omzetter(poster Vandeghinsteen Schuurman) • SoNaR: algoritmen uit anderetalentestenmet Nederlandstalige data • Zieookrapporten “TST en communicatievebeperkingen” (beschikbaar online en in onze stand)
Meer taal- en spraakdata (e-health) • SPACE (IWT-SBO-project Vlaanderen) • Universiteiten Leuven, Gent, Brussel en Antwerpen) • COPAS (Corpus Pathologische en Normale Spraak) • Opnames Dutch Intelligibility Assessment (DIA), voorgelezen tekstpassages, zinnen en spontane spraak. • Geannoteerde opnames van bijna 200 Vlaamse pathologische sprekers en 122 Vlaamse controlesprekers. • CHOREC (Children'sOral Reading Corpus) • 130 uur spraak afkomstig van 400 Vlaamse kinderen die teksten en woordenlijsten voorlezen voor leesvaardigheidsontwikkeling en -toetsen. • Leesstrategie en soorten leesfouten geannoteerd.
Meer taal- en spraakdata (kinderen) • JASMIN-spraakcorpus • Aanvulling op Corpus GesprokenNederlands • Jongeren, anderstaligen en senioren • Voorgelezenteksten en mens-machinedialogen • STEVIN-project van Radboud Universiteit, K.U. Leuven en TalkingHome • BasiLex– watlezenbasisschoolleerlingen? • NWO-project van universiteitenRadboud, Tilburg, Amsterdam en Leiden) • BasiScript– hoe schrijvenbasisschoolleerlingen? • NWO-project van universiteiten Radboud, Tilburg, Groningen en Amsterdam)
Samenvatting • Door bij uw werk aandacht te besteden aan het verzamelen, bewaren en delen van taal- en spraakdata … • … kan de taal- en spraaktechnologie zich blijven ontwikkelen … • … en kunnen toepassingen ontwikkeld worden die bijdragen aan de diagnostiek, behandeling en ondersteuning van mensen met een communicatieve beperking. • Wij helpen u graag, zodat u vooral ook uw werk goed kunt blijven doen.
Vragen of opmerkingen?Spreekonsgerustaan of komlangs in onze stand.Contact@tstcentrale+31 70 346 95 48http://tst-centrale.orgservicedesk@tst-centrale.org Nederland Bezoekadres Lange Voorhout 212514 EB Den Haag Postadres TST-Centralep/a NTUPostbus 105952501 HN Den Haag Nederland België Bezoekadres Universiteit Antwerpen - Stadscampus (gebouw R)Kamer R2.21Rodestraat 142000 AntwerpenPostadres TST-Centralep/a Universiteit Antwerpen CST, R2.21Prinsstraat 132000 AntwerpenBelgië