170 likes | 419 Views
Valodas tehnoloģiju specseminārs Ievads vispārīgajā valodniecībā. Lauma Pretkalniņa AILab. Tēma.
E N D
Valodas tehnoloģiju specseminārsIevads vispārīgajā valodniecībā Lauma Pretkalniņa AILab
Tēma • Vispārīgā valodniecība — valodniecības apakšnozare, kurā pēta valodas būtību, funkcijas, cilmi un attīstību, valodas sociālās funkcijas, sakarus ar procesiem sabiedrībā, valodas un domāšanas sakaru, valodu uzbūves universālās iezīmes, klasificē pasaules valodas, izstrādā valodas pētīšanas metodes un paņēmienus. • Tipoloģiskā valodniecība — valodniecības nozare, kurā, salīdzinot valodas neatkarīgi no to radniecības, noskaidro kopīgās pazīmes, konstatē tipiskās parādības un valodas universālijasun izstrādā valodu tipoloģiskās klasifikācijas principus. http://termini.lza.lv/
Motivācija: atziņas • Dzimtā un dominējošā valoda ietekmē to, kā mēs domājam: • nav tā, ka valoda mums dažas idejas padarītu nepieejamas vispār, • bet ir tā, ka dzimtās valodas īpatnību dēļ dažas idejas un entīšu konceptuālo dalījumu veidi mums šķiet daudz dabiskāki. • Cilvēks nejūt dzimtās valodas ietekmi uz domāšanas procesu, ja tam īpaši nepievērš uzmanību… • bet, ja Tu spēj identificēt un apšaubīt pieņēmumus, ko rada Tava dzimtā valoda, Tu esi labāks datorlingvists!
Piemēri • Biezpiens • latviski — līdztiesīgs piena produkts pienam, sieram, sviestam • angliski (curdcheese / quark) — siera paveids • Modālie darbības vārdi • latviski — varēt, vajadzēt, spēt, utt. — «normāli» darbības vārdi, pilna formu sistēma; dažiem darb.v. var būt gan modāls, gan nemodāls lietojums — gribēt, vēlēties, • angliski — must, might, can, shall— nav pamatformas; strikts dalījums • Čomskabezkonteksta gramatikas ir lingvistiskas teorijas «blakusprodukts» • vai šādi modelēt teikumus ienāktu prātā latvietim, krievam, francūzim?
Valodu universālijas • Visu valodu lietotājiem ir līdzīgi runas orgāni un smadzenes. • Hierarhiska organizācija • Daudznozīmība • Antropomorfie nosaukumi (lietu salīdzināšana ar cilvēku — pudeles kakls, galda kāja) • Šķīrums: darbības vārdi un nomeni (lietvārdi, īpašības vārdi, vietniekvārdi) • Galīgs skaņu skaits • Skaņu šķīrums: patskaņi un līdzskaņi • Līdzskaņu šķīrums: troksneņi (p, t, s) un skaneņi (l, m, n, r) • Vietniekvārdi • Šķīrums: 1., 2., 3. persona. • Šis nav izsmeļošs saraksts, bet diez ko specifiski nesanāk…
Vispārīgas atziņas • Valodas efektivitāte • minimālisms • izteiksmes īsums, ilgtermiņā nav absolūtu sinonīmu utt. • redundanti elementi • mazā meitene ir apsēdusies — dzimte 3 reizes • daudznozīmība • elementu atkalizmantošanajaunās situācijās • Valoda ir mainīga • lietojumi mainās, bet efektivitātes vajadzība paliek • Valoda glabājas kolektīvajā apziņā • neviens nezina visu valodu • centieni mainīt valodu var neprognozējami neizdoties
Valodu atšķirības: skaņas • Cilvēka runas orgāniem ir ļoti plaša artikulācijas telpa • Izšķirt visas nianses ir grūti, tāpēc cilvēki pielāgojas klausīties tikai noteiktas diferenciālās pazīmes • Dažādās valodās diferenciālās pazīmes atšķiras • nav divu valodu ar vienādu skanisko struktūru • apmēram 10–80 fonēmu • Diferenciālo pazīmju piemēri: • garšs/īss patskatnis — latviešu ir, krievu nav • tonis —- latviešu nav, ķīniešu ir • aspirācija — latviešu nav, angļu ir (bet nešķir vārda nozīmi)
Valodu atšķirības: skaņas IIEkstrēmie piemēri • Papua Jaungvinejā ir valoda ar 6 līdzskaņiem un 5 patskaņiem (http://en.wikipedia.org/wiki/Rotokas_language) • Dienvidāfrikā ir valoda ar vismaz 87 līdzskaņiem un 20 patskaņiem (http://en.wikipedia.org/wiki/Taa_language) • Ir valodas ar skaņām, kuru veidošanai gaisu velk uz iekšu, nevis pūš uz āru • utt.
Valodu atšķirības: skaņas III • Starptautiskaisfonētiskaisalfabēts (IPA)
Valodu atšķirība: rakstību sistēmas • Ir valodas, kas nepieraksta patskaņus (arābu, ivrits) • Rakstu sistēmas pamatelements var atbilst: • skaņai (valodas, kas lieto latīņu alfabēta atvasinājumus), • zilbei (japāņu valoda — hiragana, katakana), • jēdzienam/vārdam (japāņu — kandži, ķīniešu) • Arī ne visas skaņu bāzētās rakstības balstās uz latīņu alfabētu vai izmanto salīdzināmu elementu skaitu • kirilicas atvasinājumi (bulgāru, krievu, reizēm mongoļu) • grieķu • aramiešu izcelsmes rakstības (arābu, ivrits, jidišs) • devanagari varianti (tamilu, hindu, sanskrits)
Valodu atšķirības: morfoloģija • Dalījums pēc gramatisko nozīmju izteikšanas veida • Sintētiskās valodas — ar afiksiem (piedēkļi, priedēkļi, galotnes) — apsēdināts Latviešu, krievu, čehu, somu • Polisintētiskās valodas — visa teikuma jēga tiek izteikta ar morfēmām, teikums ≈ vārds. Daļa indiāņu, eskimosu un aborigēnu tautu valodu • Analītiskās valodas — ar atsevišķiem vārdiem — ir gājis Angļu, vācu • Izolējošās valodas — nav morfēmu, visu izsaka ar atsevišķiem vārdiem Ķīniešu • Uzskata, ka tīru tipu nav.
Valodu atšķirības: morfoloģija II • Dalījums pēc morfēmu savienošanas veida • Fleksīvas valodas — morfēmu robežas izplūdušas, multifunkcionālas morfēmas Gandrīz visas indoeiropiešu valodas • Aglutinatīvas valodas — skaidri nosakāmas morfēmu robežas, katram afiksam tikai viena gramatiskā nozīme Somugru, japāņu, armēņu, persiešu
Valodu atšķirības: sintakse • Vārdu secības brīvums • saistīts ar morfoloģijas īpatnībām Latviešu valodai ir viena no visbrīvākajām secībām • Neitrālā vārdu secība S — teikuma priekšmets, V — izteicējs, O — papildinātājs • SOV (japāņu, latīņu, tamilu, basku) • SVO (latviešu, angļu, ķīniešu, svahilu) • VSO (arābu, havajiešu, īru) • VOS • OSV • OVS • Un citi… • artikulu lietojums • sintaktiskie ekspletīvi (?) — It israining.
Valodu atšķirības: dažādi • Ir valoda, kurā ir ap 20 dažādām dzimtēm (nomenu grupas). • Ir valoda, kurā ir vairāk kā 40 lietvārdu locījumu. • Ir valoda, kurā ir divi gramatiskie laiki: • «tagadne» — tam, kas jau ir noticis un tam, kas notiek šobrīd • «nākotne» — tam, kas vēl notiks, kā arī sapņiem un domām
Valodu atšķirības: tālākie līmeņi • Tā pat kā morfoloģija ir ļoti dažāda, arī jaunu vārdu darināšanas iespējas ļoti atšķiras. • Valodās ir dažāda apjoma vārdu krājumi • piemēram, valodās, ko nelieto zinātniskām publikācijām, zinātniskā stila izteiksmes līdzekļu nav • Valodās dažādi nodala jēdzienu robežas • Vārdi, kam nav tiešu tulkojumu vai kam dažādām nozīmēm ir dažādi tulkojumi • Ir valoda, kurā ir tikai trīs krāsu nosaukumi • Ir valodas, kurās lietvārdam ir gramatiskais laiks • Japāņu valodā ir dažādi skaitļa vārdi atkarībā no skaitāmajiem objektiem • Latviski — domāt, norvēģiski — (a) ticēt nepārbaudāmai lietai, (b) ticēt pārbaudāmai lietai, (c) domāt (process)
Paldies! • Jautājumi? • Secinājumi?