110 likes | 268 Views
Pål Hals, prosjektleder i NLB. Paal.Hals@nlb.no. Skal snakke om:. Talesyntese. Bøker som blir ”innlest” med elektronisk stemme. DAISY fulltekst bøker. Lydbøker som er synkronisert med elektronisk tekst. Hva er talesyntese?.
E N D
Pål Hals, prosjektleder i NLB. Paal.Hals@nlb.no
Skal snakke om: • Talesyntese. Bøker som blir ”innlest” med elektronisk stemme. • DAISY fulltekst bøker. Lydbøker som er synkronisert med elektronisk tekst.
Hva er talesyntese? • Hei, jeg er heter Brage. Jeg er en såkalt talesyntese. Talesyntese er en elektronisk stemme. Stemmen består av små lydklipp som settes sammen til en flytende tale. er en såkalt enhetsseleksjonssyntese. • Demonstrasjon Brage Konvertering Lyd Elektronisk Tekst
Hvorfor talesyntese? • Produksjon av studielitteratur krever raske produksjonslinjer. • Sesongartet produksjonsbehov – behov for flere produksjonslinjer • Forutsetning for å kunne gi et tilbud til nye brukergrupper • Forutsetning for å kunne øke bredden i tilbudet (ex aviser) • Muliggjør nye tilbud (tidsskrifter, offentlig informasjon) • Definisjon av ”Høy kvalitet” (høy innlesingskvalitet levert etter eksamen eller ok kvalitet før første case. • Definisjon ”Godt nok” – Situasjonsbestemt, prioritere ressurser der det er behov, bredde vs kvalitet på den enkelte bok
Hvorfor en egen norsk talesyntese? • Virksomhetskritisk teknologi. • Sikre tilgang til en norsk talesyntese • Sikre tilgang til en talesyntese som dekker NLBs behov • Tilgang til / kompetanse om teknologi. • Muliggjøre tilpasninger til egne behov basert på egne premisser. • Lisenskostnader
Forutsetninger for utviklingsprosjekt • Tett samarbeid med TPB (Talbok og Punktskriftsbiblioteket) • Kompetanse • Verktøy • Metodikk • Løpende samarbeid NLB/TPB • Tilgang til Språkbankens uttaleleksikon (729.058 ord) • Tilgang til egnet tekstkorpus (ca 110 bøker, 60 tidsskrifter, Aftenposten)(Utgjør 10 800 000 ord) • Intern kunnskap om innspilling av lyd/lydteknikk. • Stort pågangsmot og evne til å lære ny teknologi
Valg av innleser • Brage: Mann, bokmål • Vurderte egne innlesere samt andre ”kjente stemmer” • ”Stemme alle liker” • (passer til produksjonsområder, jevn/universell stemme, ingen særegenheter, tydelighet, tåler komprimering, gode allmenkunnskaper, relativt dyktig i engelsk) • Takle krav i innspillingsprosess (samarbeid, utholdenhet) • Stemmeføringsanalyser – vitenskaplig analyse av stemmer (toneleie, dynamikk, artikulasjon, rytme, tempo, volum/bæreevne, stemmen håndterer rask avspilling. • Innspillingstid: 15.nov – 10.feb (+ romjul) • Læring
Hva er DAISY • DAISY : Digital Accessible Information System • En multimediastandard for digital produksjon og avspilling av informasjon i lydformat. • Hensikten er å gi syns- og lesehemmede en økt lesefunksjonalitet ved bruk av lydbøker. • Basert på åpne standarder. • Global standard
DAISY: Kategorier • DAISY: Ren lydbok. Lydfiler i mp3-format samt navigasjonsfiler. • DAISY: Fulltekstbok: Lydfiler og teksten synkronisert. Gir mulighet til å høre og se teksten synkronisert. • DAISY: Teksten og navigasjonsfiler. Kan benyttes sammen med talesyntese på egen avspiller. (Kan sees på som en e-bok)
Hvordan produserer vi – hva ønsker vi å produsere • Produksjon med talesyntese: Alltid fulltekst • 62 % av studielitteratur, avis, tidsskrifter • Innleste lydbøker – Overveiende kun innlest. • Mål: Øke andel i fulltekst. • *Finne tekniske løsninger for mer effektiv produksjon av fulltekst. • *Definere brukerbehov