110 likes | 234 Views
D-LUCEA Database of the Longitudinal Utrecht Collection of English Accents. CLARIN-NL Call 3 Kickoff Meeting 6 maart 2012, Hilversum. U niversity C ollege Utrecht. zelfstandig onderdeel van UU bachelor college in Angelsaksische stijl drie jaar brede academische vorming
E N D
D-LUCEADatabase of the Longitudinal Utrecht Collection of English Accents CLARIN-NL Call 3 Kickoff Meeting6 maart 2012, Hilversum
University College Utrecht • zelfstandig onderdeel van UU • bachelor college in Angelsaksische stijl • drie jaar • brede academische vorming • ca 3x200 studenten • selectief, competitief, intensief • Engels als lingua franca • intensief campus-leven
UCU English Accent • moedertalen studenten: 5% EN, 60% NL, 35% anders • English-only policy • geen training in EN uitspraak • geen invloed van EN omgevingstaal • spontaan ontwikkelend, uniek accent:UCU English
LUCEA • Longitudinaal onderzoek • focus op convergentievan accenten • 3 cohorten: 2010 (N=73), 2011 (N=79), 2012 • 5 opnames longitudinaal over 3 jaar • totaal ca 900 opnames, elk ~20m (~2.5GB) • plus meta-data (vragenlijst)
LUCEA • EN voorgelezenteksten Rainbow, Wolf, prosody sentences, intelligibility test sentences, UN Declaration of Human Rights • L1 voorgelezenteksten UN Declaration of Human Rights • EN spontanemonologen informal, formal • L1 spontanemonologen • EN spontanedialoog
voorbeelden Cohort 2010, Round 1 (sept 2010) • S010 • S060 • S002
studiemarathon Engels als vreemde taal • spraak-onderzoek bijUniversity College Utrecht • English-only on campus, 24/7, Nederlandstalige omgeving • hoe verandert accent? • herhaalde opnames (3 cohorten, 3 jaar) • nu 46 Ned, 8 Eng, 16 anderstalige studenten Orr & Quené (2011)
D-LUCEA • Resource Curation Project (12m) • curatie en beschrijving van opnames, metadata, en andere materialen • i.s.m. Daan Broeder, The Language Archive, MPI, Nijmegen • meta-data: CMDI (L2 acquisition) • uitbreiding ISOCat waar nodig • Persistent IDs voor optimale ontsluiting
privacy • informed consent Copies of the recordings may be distributed anonymously to individuals and organizations engaged in linguistic research, education, and technology development. (...) Individuals and organizations that receive session recordings or transcripts will first agree to use these resources only for linguistic education, research and technology development purposes. Personal identifying information will not be distributed to individuals or organizations receiving the data. • anonimiteit en privacy naam inhoud van monoloog en dialoog
D-LUCEA • verbeterdeontsluiting en bruikbaarheid • relevant vooronderzoeknaar (convergentie van) accenten • in academia, industrie, militair • relevant vooronderwijs en ASR(i.s.m. HelmerStrikc.s., Radboud Un)