80 likes | 219 Views
Ján Krausko. Poznámky a závery so stretnutia ( 24.10. 2006). Tvorba softvérového systému v tíme , FIIT STU BA. Motivácia. Súčasný stav: Globálny kontext Celý program, sekvencia príkazov. Učenie Vzory, filtre (XPath, reg. výrazy) Reprezentácia ( DOM , string, viz. mapa)
E N D
Ján Krausko Poznámky a závery so stretnutia(24.10. 2006) Tvorba softvérového systému v tíme, FIIT STU BA
Motivácia • Súčasný stav: • Globálny kontext • Celý program, sekvencia príkazov Učenie Vzory, filtre (XPath, reg. výrazy) Reprezentácia (DOM, string, viz. mapa) Dokumenty (HTML, PDF, TXT) • Vstupné premenné (napr.: url) • DOM stránky • Výstupné objekty
Nové myšlienky • Lokálny kontext • ak sa presunie podstrom vnútri stromu sa nič nemení • akcie navigácie – sekvencie, procedúry • pri extrakcii – akcia pomocou filtrov identifikuje vzory (napr. tabuľku) • vzory objekty, ktoré implementujú rozhrania – s nimi pracuje učenie
Nové myšlienky • Čo musí vedieť vzor ? • Obsahuje filtre • Ukáž sa – vizualizácia vo Firefoxe • Na aký typ vzoru sa môže pretypovať (aby sme mohli pracovať s viacerými reprezentáciami) • Vzor vie pre aký typ je (DOM, PDF) • Úloha: nájsť niečo také pre JAVU • Ako sa bude učiť Vzor je teda viac filtrov + učenie DOM Nepriamo cez medzi reprezentáciu
Nové myšlienky • Filtre: • Booleovský výraz • Zoznam filtrov • Strom • Fuzzy filter Tomuto sa prispôsobí učenie
Nové myšlienky Vzory: Tabuľka Riadok JobTitle Company Salary Nakonfigurovaná cesta /JOBOFFER JOBTITLE COMPANY Akcia: WRITE vytvorí JOBOFFER JOBTITLE COMPANY COMPANY
Čo treba • Naštudovať rozhranie pluginov Firefoxu • Pozrieť pluginy: • ColorZilla - vie farebný border, poziciu kurzora, CSS • Selenium ID – naposledy odporučil Peter • Nájsť adapt Pre JAVU • Vybrať metódu učenia –> filtre vo vzore • Ujasniť analýzu (VZOR -> FILTER vs. FILTER -> VZOR) • Ujasniť slovník