1 / 11

Anal ýza r e á l nych X Query dotazov

Anal ýza r e á l nych X Query dotazov. Peter Hlísta. Zadanie diplomovej práce. Cieľ diplomovej práce zozbierať dáta ( XQuery dotazy) a zanalyzovať ich K dispozícii program Analyzer * a jeho plug-in XQConverter ** Dorobiť Vybrať vhodný crawler /prípadne ho upraviť

lela
Download Presentation

Anal ýza r e á l nych X Query dotazov

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analýza reálnych XQuerydotazov Peter Hlísta

  2. Zadanie diplomovej práce • Cieľ diplomovej práce • zozbierať dáta (XQuery dotazy) a zanalyzovať ich • K dispozícii • program Analyzer* a jeho plug-inXQConverter** • Dorobiť • Vybrať vhodný crawler/prípadne ho upraviť • Zozbierať dáta z internetu • Zanalyzovať zozbierané dáta *Analyzer je program vytvorený ako softwarový projekt na MFF **XQConverter je plug-in vytvorený k diplomovej práci J. Schejbala

  3. Crawler* *upravený crawler z „crawler4j“

  4. Získané súbory • Z 4,198 URL sme získali 10,591 súborov

  5. XQConverter • Súčasť Analyzeru (plug-in) • Obsahuje lexikálny skener (analyzér) a syntaktický analyzér • Má konzolovú verziu • Chyby v stiahnutých programoch • lexikálne 87% • syntaktické 3% • bez chýb 10% *architektúra použitého „XQConverter“ plug-inu

  6. Analýza dát – XQuery gramatika • Počet jednotlivých gramatických symbolov • Ich výskyt v súboroch (v %) • Nepoužité gramatické symboly • DefaultCollationDecl, EmptyOrderDecl, OrderedExpr, UnorderedExpr

  7. Analýza dát – XPath v XQuery • Rozsiahlosť XPath výrazu • Počet krokov XPath výrazu • Ako často je použitý predikát • Z 24,236 XPath je predikát v 5,749 (tj. 23.7%) • Použité vstavané XPath funkcie • Na čo sa v poslednom kroku pýta • element, atribút alebo textový uzol

  8. XPath v XQuery programoch

  9. Analýza dát - FLWOR • For (56.1%), Let (74.5%) • Priemerný počet na jeden ‘FLWOR’ • Maximálny počet na jeden ‘FLWOR’ • Where (21.1%), Order By (7.2%), Return • Zanorenie FLWOR • 2-, 3-, 4-krát bežné ale našlo sa aj cez 5-krát

  10. Analýza dát • Funkcie • rekurzívne funkcie • funkcie bez volania v tele dotazu • počet volaní funkcie fn:doc • počet volaní vstavaných alebo externých funkcií • Premenné • priemerná dĺžka znakov v premenných typu ‘xs:string’ • iba zadefinovaná premenná (nepoužitá) • Jednoduchší a zložitejší výstup z XQuery dotazu

  11. Ďakujem za pozornosť

More Related