600 likes | 869 Views
Projektas „Lituanistika“ Mokymai socialinių ir humanitarinių mokslų studentams Mokslo darbų kokybė 2009-11-12, Kaunas. Mokslo šaltinių sampratos, pobūdis, kalbos mokslo šaltiniai ir ištekliai bei jų publikacijos doc. dr. Elena Jolanta Zabarskaitė. Paskaitos tikslai (I) supažindinti su:.
E N D
Projektas „Lituanistika“Mokymai socialinių ir humanitarinių mokslų studentams Mokslo darbų kokybė2009-11-12, Kaunas
Mokslo šaltinių sampratos, pobūdis, kalbos mokslo šaltiniai ir ištekliai bei jų publikacijos doc. dr. Elena Jolanta Zabarskaitė
Paskaitos tikslai (I) supažindinti su: • Šaltinio samprata; • mokslinio/mokslo populiarinimo šaltinių skirtumais (mokslinio šaltinio kriterijais); • šaltinių tipais; • kalbos mokslo šaltiniais ir jų naudojimosi naudojimosi galimybėmis.
Paskaitos tikslai (II) pristatyti: • Skaitmeninius Lietuvių kalbos instituto išteklius, laisvai prieinamus internetu; • supažindinti su jų atsiradimo istorija; • naudojimosi galimybėmis; • perspektyva.
HSM šaltinio samprata Dabartyje funkcionuojantis paveldas, susijęs su buvusių kartų ir dabartinės visuomenės kūryba.
HSM šaltinio ypatybės • Vienas svarbiausių HSM mokslo objektų; • Būtina HSM funkcionavimo; raidos ir plėtros sąlyga; • Mokslinių tyrimų šaltinis.
Šaltinio sampratos raida Nuo “istorinio naratyvinio pasakojimo” (J. Topolski) iki išteklių (resourses). Ištekliai - rašytinės ir sakytinės kalbos duomenys ir jų skaitmeniniai aprašai, naudojami kalbos algoritmams ir sistemoms kurti
Rūšys pagal objektą: Daiktiniai šaltiniai (ypač svarbūs archeologijai); Etnografijos ir etnologijos duomenys; Tautos žodinės kultūros kūriniai ir reiškiniai (folkloristikos); Kalbos ištekliai; Rašytiniai šaltiniai (individų kūriniai).
Rūšys pagal informacijos saugojimo būdą • Rašytiniai • Daiktiniai • Ikonografiniai • Audiovizualiniai • Landšaftiniai urbanistiniai • Kartografiniai • Skaitmeniniai Istorijos liudijimų įvairovė yra beveik begalinė. (M. Blokas)
Mokslinio šaltinio publikavimo formos: • Mokslinės istorinių rašytinių šaltinių publikacijos; • Mokslinės HSM išteklių publikacijos; • Tipologiniai ir teminiai žemėlapiai; • Leksikografiniai šaltiniai (moksliniai žodynai); • Moksliniai sisteminiai šaltinių katalogai; • Mokslo bibliografijos leidiniai (metašaltiniai).
Mokslinio HSM šaltinio požymiai (pagal FRASCATI): • Šaltinio rengimo metodikos naujumas/esamos tobulinimas: šaltinio mokslinės apyvartos sukūrimas. (Frascati 103 punktas); • Naujų duomenų mokslo apyvartai teikimas (Frascati 71 punktas); • Tyrimų duomenų skelbimas mokslo žurnaluose; mokslinių apžvalgų rengimas (Frascati 149 punktas)
Kada mokslas? Mokslas, kai šaltinis: • sprendžia HSM problemas; • turi mokslinių tyrimų priešistoriją; • mokslinį aparatą; • yra HSM raidos dalis, naujų mokslo idėjų atsiradimo pagrindas. Mokslo populiarinimas, kai: • šaltinio publikavimas skleidžia sukurtas HSM žinias; • šaltiniai rengiami esamų mokslo publikacijų pagrindu; • komentarai; įvadinis straipsnis, etc. – nesvarbūs; • publikacija į mokslinę apyvartą įvestas žinias pakartoja visuomenei.
Skaitmeniniai lietuvių kalbos ištekliai Lietuvių kalbos instituto (toliau LKI) misija yra kurti naujas žinias apie lietuvių kalbos funkcionavimą ir istoriją bei kaupti ir skaitmeninti lietuvių kalbos paveldą bei dabartinius kalbos ir tarmių išteklius
Skaitmeniniai lietuvių kalbos ištekliai Svarbiausios LKI veiklos kryptys yra patvirtintos Lietuvos Vyriausybės. Tai: • lietuvių kalbos leksikologija, leksikografija ir gramatinės sandaros tyrimai; • lietuvių kalbos istorijos, tarmių ir sociolingvistiniai tyrimai; • lietuvių kalbos funkcionavimo visuomenėje ir terminologijos tyrimai; • lietuvių onomastikos tyrimai. (plačiau LR Vyriausybės nutarimas 2002 liepos 10 d., Nr. 1102).
LKI: Nuo išteklių – prie akademinių šaltinių – iki visuomenei skirtų kalbos vartojimo paslaugų ir produktų. Internetas – jėga! Ne! ???? Internetas – oho!
Skaitmeniniai lietuvių kalbos ištekliai Skaitmeninamas, kaupiamas, tvarkomas Tarmių archyvas bei šios kalbos išteklių duomenų bazės: • akademinio ,,Lietuvių kalbos žodyno" elektroninė kartoteka su paieškos sistema, • senųjų raštų duomenų bazė, • tarmių duomenų bazė, • bendrinės kalbos duomenų bazė, • terminų sinonimų duomenų bazė, • kalbos konsultacijų bankas, • dabartinės vartosenos skaitmeninė kartoteka, • kalbos rekomendacijų kompiuterinė duomenų bazė, • vietovardžių duomenų bazė, • asmenvardžių duomenų bazė • šnekamosios kalbos tekstynas • svetimžodžių duomenų bazė
Skaitmeniniai lietuvių kalbos ištekliai Internete pateikti šie skaitmeniniai produktai, sukurti duomenų bazių ir kitų skaitmeninių išteklių pagrindu: Akademinis Lietuvių kalbos žodynas; Dabartinės lietuvių kalbos žodynas (IV versija); Vietovardžių žodynas; Kanceliarinės kalbos patarimai; Kalbos konsultacijų bankas; Eurotermbankas; Lietuvių-vengrų žodynas; etc.
Skaitmeniniai lietuvių kalbos ištekliai Svarbiausias laisvai prieinamas lietuvių kalbos ir kultūros šaltinis yra didysis akademinis Lietuvių kalbos žodynas
Skaitmeniniai lietuvių kalbos ištekliai 2002 m. išleistas paskutinis 20-asis „Lietuvių kalbos žodyno“ (toliau - LKŽ) tomas. Tai didžiausias XX amžiaus lietuvių kalbotyros veikalas. Dvidešimt LKŽ tomų apima lietuvių kalbos raštų leksiką nuo 1547 iki 2001m. ir gyvosios kalbos (tarmių) leksiką, renkamą nuo 1902 m.
Lietuvių kalbos turtai internete LKŽ yra tezauro tipo. Jame yra: apie 22 000 puslapių; apie 2 200 autorinių lankų; daugiau kaip 11 mln. žodžių; aprašyta apie 0,5 mln. antraštinių ir paantraštinių; Staripsnių apimtis įvairuoja nuo 1 eilutės iki keliasdešimties ar net 100 puslapių; žodynas parengtas naudojantis 4,5 mln. vienetų kartoteka.
Lietuvių kalbos turtai internete 2005 metų kovo – balandžio mėnesį išleidžiamas pirmasis LKŽ kompiuterinis variantas su paieška pagal antraštinį žodį. Iš pradžių planuota išleisti LKŽ kaip šaltinį, t. y. knyginį originalą atitinkančią elektroninę šio žodyno versiją, pakoregavus tik tuos formos dalykus, kurie trukdo kompiuterinei paieškai pagal antraštinį žodį, o paskui, rengiant kitus leidimus, žodyną taisyti ir papildyti. Tačiau toks projektas sukėlė labai daug diskusijų Instituto taryboje. Kadangi LKŽ buvo rengiamas net šešis dešimtmečius, per tokį ilgą laiką kalbotyroje atsirado daug naujovių. Žodynas patyrė istorinių audrų, keitėsi kolektyvas, vyriausieji redaktoriai, buvo keičiami žodyno rengimo ir redagavimo principai, įvyko rašybos ir skyrybos reforma. Tad neišvengta įvairavimų ir netikslumų. Dėl to senesniųjų tomų tekstai įvairiais atžvilgiais gerokai skiriasi nuo naujesniųjų, o tai labai neparanku rengiant vientisą visų 20-ies tomų kompiuterinį tekstą.
Lietuvių kalbos turtai internete Žodyno elektroninės versijos leidimo koncepciją rengė darbo grupė: V. Vitkauskas, J. Paulauskas, R. Šepetytė, G. Naktinienė (grupės vadovė), J. Zabarskaitė.
Žodyno kompiuterinio varianto kūrimas LKŽ kompaktinėje plokštelėje LKŽ duomenų bazėje LKŽ Internete
Skaitmeniniai lietuvių kalbos ištekliai Elektroninis adresas www.lkz.lt
Skaitmeniniai lietuvių kalbos ištekliai LKŽ pateikia: • Bendrinės lietuvių kalbos, tarmių bei senųjų raštų žodžius, kurių vartojimas gausiai iliustruojamas autentiškais, mokslui ir kultūrai vertingais sakiniais. Parodoma žodžio geografija (paplitimas tarmėse), • kilmė, • istorija, • darybiniai ryšiai, • pateikiamas kirčiavimas, • gramatinės formos, • išdėstoma semantinė struktūra, • apibūdinama vartosena, stilius. Tarmių leksika pagal fonetinius dėsnius transponuojama į bendrinę kalbą.
www.lkz.lt • Šiuo metu per dieną būna iki 800 užklausų, iš jų apie 300 užklausų iš užsienio • Svetainės www.lkz.lt administratoriaus Evaldo Ožeraičio duomenys
Ištekliai • Institute saugoma ir nuolat pildoma popierinė, didžiausia Lietuvoje, leksikos duomenų sankaupa, apimanti ne tik dabartinės kalbos raštų ir spaudos, bet ir tarmių bei senosios kalbos duomenis, pradėta kaupti nuo 1902 m. K. Būgos. Ją sudaro dvi dalys: • Pagrindinė kartoteka – 4,5 mln. leksinių vienetų su vartojimo pavyzdžiais; • Papildymų kartoteka – 0,5 mln. leksinių vienetų su vartojimo pavyzdžiais (duomenys surinkti po to, kai buvo išleisti atitinkami žodyno tomai; skiriama naujiems žodyno leidimams parengti).
Perspektyvos • Pradėti pagrindinės kartotekos duomenų bazės kūrimo darbai ją aprašant, t. y. įvedant į duomenų bazę, kartu pateikus ir kortelės paveiksliuką. Aprašymo schema yra tokia pati kaip ir LKŽ antraštinių duomenų, su papildomais parametrais. Iliustracijos yra skenuotos, nes perrinkinėti kartotekos skirtingus paveiksliukus nėra tikslinga. Papildomi aprašymo parametrai yra: • mokslinės vertės laipsnius apibūdinančios pastabos • pateikėjo pavardė • pateikimo metai (tai ypač padidina vertę).
Perspektyvos LKŽ pagrindu sukurta Nacionalinė kalbos išteklių duomenų bazė apims ir kitus institute turimus išteklius
Skaitmeniniai lietuvių kalbos ištekliai • Senieji lietuviški raštai Lietuvių kalbos institute pradėti skaitmenizuoti 1995 metais. • Senųjų raštų duomenų bazę(toliau SRB) sudaro 4 dalys: 1) tekstynas; 2) konkordancijos; 3) indeksai; 4) skaitmenizuoti vaizdai.
Skaitmeniniai lietuvių kalbos ištekliai SRB tekstynassudaromasrenkant tekstus kompiuteriu arba skenuojant iš mikrofilmų (kai Lietuvoje nėra išlikusių originalų) ir atpažįstant atpažinimo programomis. Tekstynui specialiai sukurti šaltinių grafemas atitinkantys ženklai yra PALEMONO šrifto dalis.
Skaitmeniniai lietuvių kalbos ištekliai Senųjų raštų duomenų bazės adresas www.lki.lt
Skaitmeniniai lietuvių kalbos ištekliai • Nė vienas istorinis lingvistinis tyrimas neapsieina be senųjų raštų ir tarmių duomenų. Tarmių archyvas yra didžiausia lietuvių kalbos tarmių paveldo duomenų sankaupa Lietuvoje, sudaryta iš: • tarmių garso įrašų fonotekos; • tarmių duomenų rankraštyno.
Skaitmeniniai lietuvių kalbos ištekliai Fondai pradėti kaupti tarpukario metai ir kasmet pildomi naujais duomenimis iš mokslinių ekspedicijų ir asmeninių archyvų. Per metus į Archyvą patenka apie 200 val. naujų įrašų bei apie 1000 kortelių. Garso įrašai pradėti skaitmeninti nuo 2001 metų, kartotekos – nuo 2004 metų. Tarmių archyve saugoma 3600 valandų garso įrašų, apie 400 tūkst. kortelių, 1100 kitų rankraščių.
Skaitmeniniai lietuvių kalbos ištekliai Internete pateikta Informacinė tarmių duomenų bazė, prieinama iš Instituto internetinio puslapio: www.lki.lt
Skaitmeniniai lietuvių kalbos ištekliai Taip pat institutas turi dabartinio vartojimo kalbos išteklių sankaupų. Viena svarbiausių sričių – terminologija. Terminų ištekliai kaupiami Terminologijos centro duomenų bazėje Lietuvių kalbos terminų sinonimija. Tarptautiniai ištekliai:www.eurotermbank.com
Skaitmeniniai lietuvių kalbos ištekliai LKI Kalbos kultūros skyriuje nuolat kaupiami ir sisteminami kalbos praktikos ištekliai. Šio darbo tikslas – prisidėti prie dabartinės bendrinės lietuvių kalbos būklės sekimo, vartosenos polinkių tyrimo ir norminimo. Mokslo tikslams kaupiami tokie duomenys: DABARTINĖS VARTOSENOS DUOMENŲ KARTOTEKA (IŠ DALIES PERKELTA Į SKAITMENINĘ FORMĄ); KALBOS REKOMENDACIJŲ BAZĖ (SKAITMENIZUOTA KARTU SU MATEMATIKOS IR INFORMATIKOS INSTITUTU); TEMINĖ BIBLIOGRAFINĖ KARTOTEKA (IŠ DALIES SKAITMENIZUOTA).