1 / 10

Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique. Plan. Intégration de données Définition Pourquoi ? Les outils . L’ETL TOS : Qu’est-ce ? Pourquoi ? Travaux dirigés Découverte. Intégration de données. Définition

Download Presentation

Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

  2. Plan • Intégration de données • Définition • Pourquoi ? • Les outils. • L’ETL TOS : • Qu’est-ce ? • Pourquoi ? • Travaux dirigés • Découverte

  3. Intégration de données • Définition • Ensemble des processus par lesquels les données provenant de différentes parties du système d'information sont déplacées, combinées et consolidées. • Ces processus consistent habituellement à extraire des données de différentes sources (bases de données, fichiers, applications, Services Web, emails, etc.), à leur appliquer des transformations (jointures, lookups, déduplication, calculs, etc.), et à envoyer les données résultantes vers les systèmes cibles

  4. Intégration de données • Pourquoi ? • Synchronisation de différents SI : • Alimentation de bases par des fichiers à plat • Alimentation d’entrepôts de données. • Systèmes répliqués. • Migration de S.I

  5. Intégration de données • Outils • Développement spécifiques (moulinettes)  • Difficulté de maintenance. • Manque de cohérence. • Peu de documentation. • Outils dédiés (ETL : Extract – Transform – Load) • Facilité de maintenance. • Meilleure productivité.

  6. ETL TOS Qu’est-ce que c’est ? • Atelier de développement : • Une interface graphique • Des composants spécialisés (plusieurs centaines) prêt à l’emploi. • Facilité de documentation • Générateur de programme (Java et Perl) • Basé sur Eclipse : • Multiplateforme

  7. ETL TOS Pourquoi ? • Solution libre dans la version de base : • Communauté grandissante. • Une démarche non isolée (URGI – ISIE – DSI …) • Un outil accessible même aux non informaticiens

  8. Travaux dirigés TD1 : Alimentation fichier CSV • Création d’un Job • Création d’un schéma (métadonnées) • Création / Liaison / Configuration de composants • Exécution du job • Génération du programme indépendant • Génération de la documentation

  9. Travaux dirigés TD1 : Scénario Tableau enrichi

  10. Fin • Intégration de données • Définition • Pourquoi ? • Les outils. • L’ETL TOS : • Qu’est-ce ? • Pourquoi ? • Travaux dirigés • Découverte Merci de votre attention

More Related