Talend Data Preparation est une application en libre service qui permet aux utilisateurs métier de préparer leurs données pour analyse ou pour d’autres tâches orientées sur les données. Cette formation vous permettra d’utiliser rapidement l’interface Talend Data Preparation.

Vous y apprendrez à créer des jeux de données et des préparations afin de nettoyer, structurer et enrichir vos données à destination des utilisateurs métier. Vous verrez également comment utiliser le Studio Talend pour exécuter des préparations et créer des jeux de données dans un Job d’intégration de données.

Durée 1 jour (7 heures)
Public Gestionnaires de données, développeurs DI et administrateurs qui souhaitent déployer, gérer et fournir des données prêtes à l’utilisation aux utilisateurs métier.
Pré-requis Avoir suivi la formation Introduction to Talend Studio ou Talend Data Integration Basics et disposer des connaissances de base sur les tâches d'administration.
Objectifs

À l’issue de cette formation, vous pourrez :

  • Utiliser Talend Administration Center (TAC) pour configurer les utilisateurs Data Preparation et gérer les tâches associées à ce module
  • Créer et partager des jeux de données et des préparations
  • Gérer de grands volumes de données avec Data Preparation
  • Utiliser le Talend Dictionary Service pour associer vos données à des types sémantiques standard et créer des types sémantiques
  • Créer vos propres types sémantiques dans Talend Dictionary Service
  • Exécuter une préparation de données personnalisée dans un Job Talend
  • Créer et publier des flux de données en temps réel et par lots, en tant que jeux de données, pour les utilisateurs autorisés
Plan du cours

Introduction à Data Preparation

  • Concepts et objectifs

​Démarrage

  • Découvrir l’environnement
  • Obtenir des informations sur les utilisateurs dans TAC

Création d’une préparation de données

  • Créer une préparation de données et un jeu de données associé
  • Ajouter une jointure à une préparation de données
  • Promouvoir la préparation

Gestion des grands volumes de données

  • Créer un jeu de données à partir d’une base de données
  • Utiliser l’échantillonage sélectif
  • Exporter des préparations

Utilisation de Talend Dictionary Service

  • Découvrir Talend Dictionary Service
  • Créer un type sémantique dans le dictionnaire
  • Créer un type sémantique à partir d’une expression régulière
  • Créer un type sémantique composé

Utilisation d’une préparation dans un Job d’intégration de données

  • Publier un jeu de données dans Data Preparation
  • Exécuter une préparation dans le Studio Talend

Implémentation d’un jeu de données en temps réel

  • Implémenter un jeu de données en temps réel dans le Studio Talend
  • Déployer un Job dans Talend Administration Center (TAC)
  • Créer un jeu de données à partir d’un Job Talend