130 likes | 320 Views
Talend Open Studio. Ing. David Pejčoch Tutorial. Instalace a spuštění. Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) Rozzipujte na disk H Spusťte TOS_DQ-win32-x86.exe Při spuštění přeskočte registraci kliknutím na „Register Later“. Stažení z webu Talend.com.
E N D
Talend Open Studio Ing. David Pejčoch Tutorial
Instalace a spuštění • Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) • Rozzipujte na disk H • Spusťte TOS_DQ-win32-x86.exe • Při spuštění přeskočte registraci kliknutím na „Register Later“
Integrovaný help „for Dummies“ Help se zobrazuje v záložce v pravé části úvodního okna. Neumožňuje přímé spouštění wizardů, pouze odkazuje na jednotlivé kroky.
Připojení k MySQL Vyplňte příslušný login, heslo, adresu serveru a název databáze.
Popis základních funkčních prvků • Rules = pouze WHERE klauzule • Patterns = vzory pro validaci • pomocí regulárních výrazů (nástroj obsahuje předpřipravené regulární výrazy v různých složkách podle domén) • pomocí SQL LIKE klauzule specifické pro různá RDBMS • Source files = SQL příkazy, které lze spustit pomocí Data Expolreru (v rámci existujícího připojení na databázi) • Indicators = SQL příkazy s využitím sady předdefinovaných templatů • Pattern Matching: počet záznamů, které vyhovují regulárnímu výrazu; počet záznamů, které vyhovují SQL LIKE klauzuli • Pattern Finder = hledání četností vzorů • Soundex: tabulka četností Soundex hodnot • ...
Popis funkcionalit v rámci DB Connection • Na úrovni připojení: porovnání databází, overview analýza (počty tabulek, řádků, indexů v tabulkách) • Na úrovni databáze: overview analýza • Na úrovni seznamu tabulek: porovnání tabulek • Na úrovni tabulek: • analýza tabulky pomocí SQL rules, • column analysis (na základě výběru datového typu, vzoru, indikátoru, sloupců a where podmínky provede analýzu s grafickým výstupem), • pattern frequency analysis (viz. předchozí, ale zkoumá četnosti vzorů; z výsledků lze vidět záznamy odpovídající jednotlivým vzorům, generovat ze vzorů regulární výrazy) • preview table (přehodí do módu s konzolí pro SQL)
Popis funkcionalit v rámci DB Connection • Na úrovni sloupce: • Analýza hodnot z množiny sloupců • Analýza korelace mezi sloupci • Analýza kategorií nominální proměnné • Pattern frequency analysis + další viz na úrovni tabulek