430 likes | 656 Views
Inleiding Taalkunde CKI, Blok 4, 2010/11. WELKOM!. Docenten: Hanna de Vries Anna Chernilovskaya Yoad Winter SAs: Merlijn Boogerd Maaike de Boer Marc van Zee. Inleiding op vandaag. Wat is taalkunde? Taal en communicatie. Geschiedenis van de taalkunde in vogelvlucht.
E N D
Inleiding Taalkunde CKI, Blok 4, 2010/11 WELKOM! Docenten: Hanna de Vries Anna Chernilovskaya Yoad Winter SAs: Merlijn Boogerd Maaike de Boer Marc van Zee
Inleiding op vandaag • Wat is taalkunde? • Taal en communicatie. • Geschiedenis van de taalkunde in vogelvlucht. • Taal en cognitie/taalkunde in CKI. • Indeling van het vakgebied.
Wat is taalkunde? En wat doet taalkunde in het programma van CKI?
Wat is taalkunde? • Taalkunde is de wetenschappelijke studie van de natuurlijke taal van mensen. • Zie: The sci.lang FAQ: 1 - 7 • Talen: Nederlands, Engels, Russisch, Zweeds, Chinees, Swahili, Endo, Sanskrit, Nederlandse gebarentaal,…
Dus niet: dieren Verschillen • Compositionaliteit • Conventionaliteit • Functionaliteit • Zie: semiotiek, biologie
Dus niet: kunstmatige talen • Esperanto • 1e orde predikatenlogica • Prolog, Java Zie: semiotiek, logica, informatica
Gesproken taal • Nederlands, Russisch, Engels, etc. bestonden eerder als gesproken taal dan geschreven. • Schrift: afgeleide van de primaire gesproken taal (Oud Hebreeuws/Grieks, Latijns). • Niet altijd gesproken: doventaal, b.v. Nederlandse gebarentaal, American/British sign language. • http://www.ru.nl/corpusngt/
Twee eigenschappen van taal - Complexe structuren - Complexe communicatie
Taal en taalstructuur • Structurele aspecten: Hoe zitten woorden in elkaar? Zinnen? Teksten? • Welke taalkennis zit in ons hoofd? Interactie met andere cognitive modules? • Modellering van taal in kunstmatige systemen (taal- en spraaktechnologie).
Taal en communicatie • Centrale functie van taal: communicatiesysteem. • Intentioneel: informatie overdracht. • Wat doen sprekers en hoorders met taal? • Sociale aspecten: man/vrouw verschillen, jongerentaal
Formeel model van communicatie Shannon-Weaver: the mathematical theory of communication (1949)
Spreker en hoorder Spreker Hoorder Begrip Verstaan Horen boodschap Formulering Spreken spraakklanken
Soorten Taalwetenschap • TraditioneleTaalwetenschap: Descriptive Linguistics (Typologie); Historical Linguistics • Vanaf 19e eeuwook: Anthropological Linguistics • Vanaf 20e eeuwook: Theoretical and Mathematical Linguistics Neuro- and Psycho- Linguistics (o.a. taalverwerving) Computational Linguistics/ Natural Language Processing/ Taaltechnologie
Geschiedenis van de Taalkunde in vogelvlucht • Taalkunde als wetenschapsgebied heeft een lange geschiedenis: Panini ( 500 B.C), Plato ( 400 B.C). Panini: taal als een systeem van regels en eenheden Plato: is taal natuurlijk of conventioneel?
Vroeg-moderne tijd • Eerste grammatica’s van Frans, Engels, volgens klassieke grammatica’s van Grieks, Latijn. • Arnauld & Lancelot (1660). Grammaire générale et raisonnée de Port-Royal. • Verlies van Latijn/Grieks als enige talen voor wetenschap interesse in ‘volkstaal’. • Universele, logische principes van alle natuurlijke talen
18e/19e eeuw • (1786) Sir William Jones: “sprung from some common source” • (1922) Grimm’s law, o.a. p > f (pater > father) • (1827) Wilhelm von Humboldt: oneindig gebruik van eindige modellen.
19e eeuw • Darwinistisch gedachtengoed: survival of the fittest. • Speurtocht naar het begin van taal (taalgenese) • Ontwikkeling van talen in de tijd; uitsterven van talen. • genetische verwantschap: taalfamilies. Charles Darwin
Taalfamilies • Talen binnen één familie: onderling verwant, ontwikkeld uit één voorouder. • Vaak: voorouder gereconstrueerd aan de hand van overgeleverd materiaal. • Talen die niet kunnen worden ondergebracht in een familie: geïsoleerde talen of isolaten. • http://nl.wikipedia.org/wiki/Taalfamilies
Indo-Europese taalfamilie • Indo-Europese taalfamilie
Begin 20e eeuw • Studie van inheemse Indianentalen V.S. door Boas, Whorf en Sapir. • Bewustzijn dat talen sterk verschillen. B.v. tijdssysteem Hopi vs. Engels. • Sapir-Whorf hypothese: taal bepaalt hoe je de werkelijkheid ervaart. Taal is cultureel bepaald, dus cultuur van invloed op waarneming. • http://en.wikipedia.org/wiki/Sapir-Whorf_hypothesis
Eskimo’s en sneeuw • Boas (1911): Eskimo's hebben vier verschillende woorden voor sneeuw: aput ("sneeuw op de grond"), gana ("vallende sneeuw"), piqsirpoq ("opwaaiende sneeuw") en qimuqsuq ("sneeuwjacht"), vs. Engels. • Whorf: minstens zeven woorden, sindsdien: tientallen, honderden.. Ondersteuning Sapir-Whorf hypothese?
1. apun: sneeuw 2. aput: uitgespreide sneeuw 3. nutagak: poedersneeuw 4. aniu: samengedrukte sneeuw 5. ersertok: bewegende sneeuw 6. akeirorak: nieuwe bewegende sneeuw 7. pukak: suikersneeuw 8. pokaktok: zoutachtige sneeuw 9. ayak: sneeuw op kleren 10. apun: sneeuw 11. aput: uitgespreide sneeuw 12. nutagak: poedersneeuw 13. aniu: samengedrukte sneeuw 14. ersertok: bewegende sneeuw 15. akeirorak: nieuwe bewegende sneeuw 16. pukak: suikersneeuw 17. pokaktok: zoutachtige sneeuw Pullum: “C. W. Schultz-Lorentzen's Dictionary of the West Greenlandic Eskimo Language (1927) gives just two possibly relevant roots: qanik, meaning 'snow in the air' or 'snowflake', and aput, meaning 'snow on the ground'. Then ask whether the speaker can cite any more.” Pullum: Geen wezenlijk verschil Inuit/Engels.
20e eeuw • Grondleggers van de moderne taalkunde: Ferdinand de Saussure, Noam Chomsky. Ferdinand de Saussure Noam Chomsky
Saussure ( 1920): Cours de linguistique générale. • Onderscheid diachronie – synchronie. • Diachronie: ontwikkeling van talen in de tijd (b.v. Latijn – Romaanse talen). • Synchronie: structuur van een taal op een bepaald moment. • Taal is meer dan een woordenlijst: taal als systeem. • Conventionele relatie vorm-betekenis.
Noam Chomsky (1) • 1956: Syntactic structures. • Zinnen hebben een syntax gekarakteriseerd door een formele grammatika met een wiskundige structuur. • Colorless green ideas sleep furiously • Furiously sleep ideas green colorless • Generatieve grammatica: met wiskundige mechanismen taal beschrijven.
Noam Chomsky (2) • Taal is creatief: met een beperkte verzameling grammatika regels en een eindig aantal woorden kunnen mensen een oneindig aantal zinnen produceren, ook zinnen die nooit eerder zijn uitgesproken. • Leerbaarheidsprobleem: hoe leren kinderen dit? • Aanname: kinderen hebben aangeboren kennis van de grammatikale struktuur die alle talen gemeenschappelijk hebben: universele grammatika. • Anti-behaviorisme: taalkunde is onderdeel van de pschologie.
Taalkunde anno nu • Voortzetting van generatieve grammatika, maar ook andere grammatikamodellen. • Niet alleen aandacht voor taalstructuur in nauwe zin, maar ook leren van taal door kinderen (taalontwikkeling), taal en cognitie, taalvariatie, taalevolutie, taal en logica, computationele linguistiek, taal- en spraaktechnologie.
Taalkunde binnen cki Cognitiewetenschap bestudeert natuurlijke intelligentie. KI bouwt systemen die intelligent gedrag vertonen.
Cognitie • Cognitieve processen hebben te maken met kennis, denken en waarneming. • Bewuste mentale processen: wiskunde, schaken. • Onbewuste mentale processen: herkennen van een voorwerp, een gezicht, omgaan met taal.
Maar dat weten we toch? • Kennis van taal is onbewust (1) Er werd op straat gedanst. (2) Op straat werd er gedanst. • Mag het woordje er worden weggelaten? • Representatie van taalkundige kennis in brein en computer (architecturen voor cognitie).
Taalkundige vragen • Waarin bestaat onze kennis van taal? • ‘Langue’ of competence • Hoe wordt onze kennis van taal gebruikt? • ‘Parole’ of performance • Hoe wordt kennis van taal geleerd? • taalverwerving of L1 acquisitie • Verschillen en overeenkomsten tussen talen • Taaltypologie, vergelijkende taalkunde, dialectologie
Competence • Grammatica als mentale representatie van kennis van moedertaal (‘native speaker’) • Onbewuste kennis: belang van intuïties (moedertaalsprekers) • Relatie tussen taalvermogen en andere cognitieve vermogens? Is taal ‘anders’?
Performance • Haspelen, onvolledige, ongrammaticale zinnen: ‘performance errors’. • Menselijke taalverwerking: robuust (vgl: computers). • Psycholinguïstiek: performance geeft inzicht in competence • Relatie taal en taalgebruik: soorten teksten, rhetorica, coherentie: communicatiekunde.
Taal en talen • Relatie tussen taal en talen (Nederlands, Engels, Chinees, Swahili, gebarentaal..) • Universele grammatica en taaltypologie • Taaltypologie: data! (‘bedreigde talen). • Variatie tussen talen werpt licht op universele eigenschappen van taal (en menselijke cognitie).
Taal en maatschappij • Relatie tussen taal en samenleving: man/vrouw verhouding, politiek discours, sociale klassen, murks • Sociolinguistiek • Taal en cultuur • Antropologische taalkunde
Toegepaste taalkunde • Taalonderwijs, vertalen • Computationele taalkunde: representatie, verwerking, verwerving door computers (sprekende computers, automatisch vertalen, spelcheckers, kennisssytemen, corpora/databases, natuurlijke taal interfaces, etc). • Klinische taalkunde (afasie, stotteren, sli)
Meer taalkunde in CKI programma • Natuurlijke taalverwerking (taal en logica) • Semantiek (formele betekenis) • Variatie in betekenis (typologie, taal en cognitie) • Taal- en spraaktechnologie
Inleiding Taalkunde Wat leer je in dezecursus? • Basisprincipes, methodes en belangrijkevragen van het vakgebied • Grondslagen van het bouwen van kunstmatigetaalsystemen
Literatuur • Juravsky & Martin (2008): Speech and language processing • Een hoofdstuk uit Fromkin (2000)
Website en Mailing List • http://www.phil.uu.nl/~achern/itk11/ • Mailing list: studenten moeten zelf inschrijven (van webpagina)
Tijdschema • Week 1 t/m 4: inleiding + taalstructuur (klanken, woorden, zinnen) • Week 4 t/m 5: computationele linguistiek • Week 6 t/m 8: betekenis + discourse • Week 8 t/m 9: taalverwerving + taalevolutie (gast col.) + taaltypologie (gast col.) • Week 10: vragenuurtje + eindtoets
Toetsing • 20%:Vier WCs en vier HW opdrachten – weken 3,4,6,8 • 20%: Takehometoets – week 5 • 60%: Eindtoets – week 10