250 likes | 382 Views
Obohacovanie webu pre podporu učenia. Bc. Róbert Horváth Ing. Marián Šimko, PhD. Motivácia. Pri prehliadaní webu Prichádzame do styku s množstvo m textov Venujeme tomu veľa času Nevieme tento čas využiť efektívnejšie ? Učenie sa cudzích jazykov (TEL, CALL, AWBL). Existujúce prístupy.
E N D
Obohacovanie webu pre podporu učenia Bc. Róbert Horváth Ing. Marián Šimko, PhD.
Motivácia • Pri prehliadaní webu • Prichádzame do styku s množstvom textov • Venujeme tomu veľa času • Nevieme tento čas využiť efektívnejšie ? Učenie sa cudzích jazykov (TEL, CALL, AWBL)
Existujúce prístupy • Uzavreté systémy1,2 • Rozšírenia prehliadačov3 Hlavné nedostatky • náhodný výber slov • výber bez ohľadu na polohu alebo kontext slova • nezohľadňovanie vedomostí používateľa • nezohľadňovanie zapamätávania alebo zabúdania [1] STREITER, O. et al. (2005). Browsers for Autonomous and Contextualized Language Learning: Tools and Theories. [2] TANUMURA M., UTIYAMA M. (2006). Reading Materials for Learning, TOEICVocabulary Based on Corpus Data. [3] TRUSTY, A., TRUONG, K. N. (2011). Augmenting the Web for Second Language Vocabulary Learning.
Otvorené problémy • Modelovanie vedomostí používateľa • slovná zásoba • Problémy špecifické pre učenie • zapamätávanie vs zabúdanie • Výber vhodných častí textu • pochopenie významu vďaka kontextu • Vhodný spôsob obohacovania • začiatočník vs pokročilý, cieľová skupina ? • Spracovanie prirodzeného jazyka • segmentácia, lematizácia, zjednoznačňovanie významu
Ciele práce • Metóda obohacovania Webu pre podporu učenia sa cudzieho jazyka • Obohatí text stránok počas prehliadania (zamieňaním) • Zohľadní vedomosti používateľa • Zohľadní špecifiká procesu učenia ako zabúdanie • Metódu experimentálne overiť • Presnosť reprezentácie používateľových vedomostí • Úspešnosť prekladu a nahrádzania • Zefektívnenie procesu učenia sa cudzieho jazyka • Zachovanie zážitku z prehliadania
Scenár obohacovania Ak student potrebuje money, môže požiadať o zvýhodnenú pôžičku.
Scenár obohacovania Ak student potrebuje money, môže požiadať o zvýhodnenú pôžičku. Ak student potrebuje money, môže požiadať o zvýhodnenú pôžičku.
Scenár obohacovania Ak student potrebuje money, môže požiadať o zvýhodnenú pôžičku. Ak student potrebuje money, môže požiadať o zvýhodnenú pôžičku. Ak študentpotrebuje peniaze, môže požiadať o zvýhodnenú pôžičku.
Potenciál webových stránok • Koľko slov sa takto môžem naučiť ? • 600 sme.sk článkov (lematizovaných) • Koľko slov sa vyskytlo aspoň 10 krát ? počet slov s TF > 10 počet webových stránok
Hlavné kroky metódy • Inicializácia modelu používateľa 1. Predspracovanie a preklad textu 2. Personalizované obohatenie textu 3. Sledovanie používateľa a aktualizácia modelu
Inicializácia • Získanie predstavy o veľkosti slovnej zásoby • usporiadanie slovnej zásoby podľa náročnosti • vstupný test • Inicializácia modelu používateľa nastavením miery naučenia pre jednotlivé pojmy
1. Predspracovanie a preklad • Získanie čistého textu (čistenie, segmentácia, lematizácia) • Preklad pojmov zo stránky (slovník) • Mapovanie prekladov na vedomosti používateľa • Usporiadanie prekladov – kandidáti na naučenie • pojmy s vysokým výskytom na stránke • nedávno získané pojmy • pojmy, ktoré je potrebné si zopakovať • nové pojmy
2. Obohatenie stránky • Nahradenie a zvýraznenie pojmov • Nahrádzanie vhodného množstva (5%) • Rovnomerná distribúcia • Možnosť získania pôvodného znenia
3. Sledovanie používateľa a aktualizácia modelu • Implicitná spätná väzba • Čítal používateľ dokument ? • Ktoré slová potreboval preložiť ? • Ktoré slová ignoroval ? • Explicitná spätná väzba • Test slovnej zásoby
Realizácia: Nástroj (klient) • Rozšírenie webového prehliadača (Chrome) • Javascript (jQuery), HTML, CSS, WebSQL (od HTML 5) • Obohacovanie stránok a modelovanie používateľa • Zbieranie dát pre overenie • implicitne (sledovaním) • explicitne (testami slovnej zásoby) Otázka z testu slovnej zásoby Časť obohatenej stránky
Realizácia: Nástroj (server) • Webová služba pre zber dát • Java EE (JAX-RS), MySQL, Hibernate • Všetky údaje na jednom mieste • Jednoduchá analýza dát (overenie) • Do budúcnosti nie len pre zber dát, ale pre logiku • Aktualizácia metódy bez aktualizácie rozšírenia • Šírenie informácií medzi viacerými používateľmi
Overenie: Hypotézy • Obohacovanie prispeje k učeniu sa cudzieho jazyka (získavaniu slovnej zásoby). • Personalizácia procesu obohacovania zlepši výsledky učenia sa • Zohľadnenie zabúdania v procese obohacovania zlepší výsledky učenia sa • Čas venovaný čítaniu sa zväčší zanedbateľne • Zachová sa zážitok z prehliadania
Návrh experimentov 1. riadený experiment - kvalitatívny • Sedenie s každým používateľom • Vplyv obohacovania na zážitok z prehliadania • rýchlosť čítania, porozumenie obsahu, dojem • Schopnosť naučenia sa nových slov (francúzština) • (pre test), experiment, post test • Parametre metódy • 6 používateľov • 45 minút pre každého • 50 webový stránok • 750 cudzích slov
Návrh experimentov 2. neriadený experiment -kvantitatívny • Bez dozoru • Pravidelné testy slovnej zásoby • Schopnosť naučenie sa nových cudzích slov • Rozdiel medzi personalizovaným a náhodným obohacovaním • Presnosť modelovania vedomostí používateľa • 20 používateľov • 10 dní • 1500 webový stránok • 18000 cudzích slov
Výsledky • Kvalitatívny experiment: • Spomalenie 30%, avšak pre používateľa zanedbateľné • Vyhovoval spôsob obohacovania a parametre metódy • Zapamätanie si viac ako 15 slov za sedenie • Kvantitatívny experiment • Zlepšenie výsledkov v testoch o viac ako 19% (t-test p=0.009) • Zlepšenie výsledkov náhodného výberu len o 4% • Model odzrkadľujevedomosti používateľa Pomer kliknutí/nekliknutí vzhľadom na vedomosť
„Surfovať“ a učiť sa • Metóda obohacovania webu pre podporu učenia • Realizácia softvérovým nástrojom • Unikátny prístup zohľadňujúci vedomosti používateľa a špecifiká procesu učenia • Učenie sa cudzieho jazyka a bez straty zážitku • Preukázané prostredníctvom niekoľkých experimentov • Prezentácia výsledkov: IIT-SRC 2013, EC-TEL 2013 • Budúcnosť ? Ďalšie jazyky, preklad podľa kontextu, šírenie informácií medzi modelmi, reálni používatelia...
1. otázka • Vývoj modelu používateľa • 150 stránok, 1400 cudzích slov • Výsledok vstupného testu: 5300
1. otázka • Výsledky testov vzhľadom na model používateľa
2. otázka • Sprístupnenie možností učiť sa aj mimo samotného prehliadania: • Testy slovnej zásoby • Mobilné zariadenia • Gamifikácia • Získavanie bodov, úspechov (achievements) • Porovnávanie sa s priateľmi • Prechádzanie úrovní • Získavanie „certifikácií“ (B2, C1...)