Talend Open Studio Data Integration : Initiation + Approfondissement

Formation inter-entreprise

À qui s'adresse la formation?

Administrateurs systèmes/BDD, Chefs de projets, Développeurs

Durée

5,00 jour(s)

Langues(s) de prestation

EN FR

Prochaine session

Prérequis

Connaissance de Java

Objectifs

Comprendre le processus d'intégration de données - Maîtriser l'outil Talend Open Studio et la bibliothèque de composants.

Contenu

Introduction

Problématique d'intégration de données
Intégration
Opérationnelle et Décisionnelle
Outils ETL (Extract Transform Load) disponibles
Talend Open Studio: présentation, licences, lien avec Eclipse
Support disponible: documentation, communauté, …

Atelier: Installation et présentation de l'environnement Talend Open Studio

Découvrir l'interface

Les perspectives et les vues Talend
Utilisation du Business
Modeler
Les jobs: grille, palette de composants
Les flux principaux (main)
La notion de schéma: types des colonnes
Premiers composants: entrée, sortie, génération de flux

Atelier pratique: création et exécution d'un job simple, génération de contenu dans un fichier

Les principaux composants de Talend

Composants d'entrée (tFileInput, tMysqlInput, …)
Génération de contenu (tRowGenerator, tFixedFlowInput,...)
Sorties et affichage (tLogRow, tFileOutput, tMysqlOutput, …)
Logique et chaînage des composants
Suivi pas à pas des traces de l'exécution du job
Gestion des rejets
Transformations simples (filtre, tri, remplacement, jointure)

Atelier pratique: génération de contenu dans une base de données, extraction et traitement des données pour affichage en console

Garantir la pérennité des jobs

Versions et statuts des jobs
Les métadonnées: propriétés et schémas.
La découverte de schéma pour les fichiers CSV
Récupération des schémas de bases de données
Mises à jour des jobs depuis les métadonnées

Atelier pratique: insérer les sources et cibles de données dans les métadonnées du référentiel

Variables et contextes

Utiliser des variables dans un job (tSetGlobalVar)
Mise en place d'un contexte local au job
Groupes de contexte dans le référentiel
Les métadonnées comme contextes

Atelier pratique: utiliser une variable dans un job, contextualiser les paramètres d'une métadonnées, créer un contexte de test, et de production

Le mappage de données: tMap

Le composant ETL par excellence
Gérer les entrées: flux principal, secondaires, nommage des flux
Gérer les sorties: l'éditeur intégré de la tMap
Filtrer les données: en entrée, sortie
Sorties conjointes, capture des rejets de sortie, de jointure interne
L'éditeur d'expression
Les performances

Atelier pratique: extraction multi-sources, multi-destinations avec une tMap, sur un exemple complet

Orchestration des jobs, gestion d'erreurs

Exécutions parallèles de sous-jobs
Déclencheurs
Talend (triggers)
Enchaînement de sous-jobs et de composants (OnSubjobOK, OnComponentOK)
Gestion des erreurs de composants, sous-job (OnComponentError, OnSubjobError)
Composant de départ, et de fin (tPreJob, tPostJob)
Attraper et lever des erreurs: tWarn, tDie, tLogCatcher

Atelier pratique: assembler plusieurs jobs en un seul, factoriser la gestion d'erreurs pour générer un fichier de compte-rendu

Les flux de programmation: liens iterate

Différencier les flux principaux des flux iterate
Boucles et programmation via tLoop, tForeach
Passer d'un flux principal à un flux iterate, et l'inverse (tFlowToIterate, tIterateToFlow)
Synchronisation de jobs avec les tWaitForFile, tWaitForSocket, tWaitForSQL

Atelier pratique: paralléliser des sous-jobs, synchroniser les jobs avec un événement externe

Utilisation avancée

Utilisation de composants évolués: Java ou expressions régulières
La spécificité des flux XML dans Talend
Réutilisation du code: les routines

Atelier: Utilisation des composants tJavaRow, tJavaFlex, utilisation de l'éditeur Java embarqué, déploiement d'une routine personnalisée

Déboguage dans Talend

Rappels sur le débogage de traces
Utilisation du mode Debug
Java: perspective Debug, mode pas à pas
Visualisation et modification à chaud des variables

Atelier: Debuggage basique/avancé de tâches

Déploiement et industrialisation

Rappel sur les contextes
Export des jobs pour exécution sur un serveur
Passage de contexte entre jobs, à l'exécution
Utilisation d'un fichier pour charger le contexte (tContextLoad)

Atelier: Déploiement de tâches et chargement dynamique du contexte

Utilisation avancée

Utilisation de composants évolués: Java ou expressions régulières
Création de logs spécifiques
Gestion des flux
XML
Réutilisation du code

Atelier: Utilisation des composants tJavaRow, tJavaFlex - création de logs avec tCatch, tDie... - utilisation de l'éditeur Java embarqué

Les composants Talend

Concepts essentiels pour étendre Talend Open Studio
Création de la maquette du composant avec tJavaFlex / interface graphique
Découvrir la forge Talend et ses composants communautaires
Intégration dans Talend Open Studio des plugins créés ou téléchargés

Atelier: Création d'un composant simple via tJavaFlex, intégration de composants de la forge Talend

Méthodes pédagogiques

Méthodologie basée sur l'Active Learning : 75% de pratique minimum. Chaque point théorique est systématiquement suivi d'exemples et exercices.

Évaluation

Contrôle continu

Certificat, diplôme

Attestation de fin de stage mentionnant le résultat des acquis

Contact pour cette formation

Dawan - Service commercial

Ces formations pourraient vous intéresser