La migration des données est le processus de transfert de données d’un système à un autre. Comprenez pourquoi elle est importante, découvrez les bonnes pratiques et les principales étapes, et apprenez à choisir le bon logiciel.
En savoir plus
Dans ce tutoriel, apprenez à générer des données aléatoires et à les écrire dans HDFS. Puis lisez les données depuis HDFS, triez-les et affichez-les dans la console.
Regarder
Vinci utilise les solutions Data Integration, ESB et MDM de Talend pour gérer les données de ses différentes filiales, notamment Vinci Autoroutes, ce qui lui permet d’offrir aux clients une vision en temps réel sur les conditions de circulation via une application mobile.
En savoir plus
La transformation des données consiste à convertir des données d’un format à un autre, en général du format d’un système source vers le format requis par un système cible.
En savoir plus
L’ETL basé dans le cloud est un outil essentiel pour gérer de grands ensembles de données, et les entreprises y auront recours de plus en plus à l’avenir.
En savoir plus
Examinez en détail ce qu’est un intergiciel, comment il fonctionne et dans quelle mesure il peut aider votre entreprise.
En savoir plus
Découvrez les fonctionnalités et l’interface de Talend Studio. Créez un projet et un Job de test simple. Ce tutoriel vous guidera étape par étape. Le texte des instructions est disponible dans la vidéo et en téléchargement au format PDF, pour le consulter quand vous en avez besoin.
Regarder
Plus de 50 % des données d’entreprise se trouvent dans le Cloud. C’est pourquoi de plus en plus d’organisations choisissent des outils ELT pour leurs besoins de traitement. Découvrez comment les outils ELT vont changer le futur de l’intégration des données.
En savoir plus
Vous avez décidé que le data lake était fait pour vous. Il est temps désormais de découvrir les bonnes pratiques de configuration d’un data lake, pour une réussite durable.
En savoir plus
La « gestion des données de référence » (Master Data Management/MDM) est une méthode de travail qui permet à une entreprise de disposer en permanence de données exactes et à jour et de prendre des décisions plus efficaces grâce à ces données fiables. Dans cette page, vous allez découvrir les points suivants : principaux avantages de cette solution pour une entreprise, défis à envisager, comment faire les premiers pas dans cette discipline.
En savoir plus
Hadoop est un framework Java open source utilisé pour le stockage et traitement des big data. Les données sont stockées sur des serveurs standard peu coûteux configurés en clusters. Le système de fichiers distribué Hadoop supporte des fonctionnalités de traitement concurrent et de tolérance aux incidents.
En savoir plus
MapReduce est un modèle de programmation disponible dans les environnements Hadoop qui est utilisé pour accéder aux big data stockées dans le Hadoop File System (HDFS). La fonction map analyse les entrées, les paires et les processus et elle produit un autre ensemble de paires intermédiaires en sortie.
En savoir plus
Un « data mart » est une base de données dont le contenu est en rapport avec une activité de l’entreprise et qui est créée pour répondre aux besoins spécifiques d’un groupe d’utilisateurs. Les data marts accélèrent les processus de l’entreprise en facilitant l’accès aux données stockées dans un data warehouse (ou autre gisement de données opérationnelles) en quelques jours au lieu de plusieurs mois ou plus.
En savoir plus
Les tests ETL sont appliqués tout au long du processus ETL pour valider, vérifier et garantir la qualité des données tout en évitant la duplication des enregistrements et la perte de données. Ce document vous propose de découvrir les huit étapes des tests ETL, les neuf types de tests ETL, les défis les plus courants, comment identifier les outils les mieux adaptés à vos besoins, etc.
En savoir plus
Un data lake est un emplacement de stockage centralisé qui contient des big data sous un format brut provenant d’un grand nombre de sources. Les avantages du format data lake incitent de nombreuses entreprises à abandonner leurs data warehouses. Découvrez les avantages spécifiques des data lakes, pourquoi ils sont de plus en plus populaires et comment faire vos premiers pas pour en créer un.
En savoir plus
Un data warehouse est un vaste gisement de données qui facilite la prise de décision dans l’entreprise. C’est par ailleurs l’un des éléments fondamentaux de la Business Intelligence. Dans ce document, vous allez découvrir les principes de fonctionnement du data warehouse, ses spécificités par rapport au data mart ou aux bases de données, comprendre pourquoi ils sont en train de migrer vers le cloud et d’autres aspects de cette technologie.
En savoir plus
La Business Intelligence (BI) est un ensemble de processus, de technologies, de compétences et d’applications qui est utilisé pour prendre des décisions d’entreprise avisées et pilotées par les données disponibles. La BI s’appuie sur les opérations appliquées aux données (collecte, agrégation, analyse) pour les transformer en une connaissance exploitable qui facilite la prise de décision.
En savoir plus
La redondance des données se produit lorsque des données identiques sont conservées dans différentes bases de données ou différents gisements de données. Ces données redondantes peuvent réapparaître dans différents champs d’une base de données ou dans plusieurs emplacements de différentes plates-formes ou différents environnements logiciels. Découvrez comment la technologie MDM (Master Data Management, gestion des données de référence en français) peut éviter la redondance des données et les problèmes qui l’accompagnent.
En savoir plus
Le machine learning est une technique qui utilise des probabilités statistiques pour donner aux ordinateurs la capacité d’apprendre par eux-mêmes grâce à leur exposition à différents types de données en entrée. On parle également, mais plus rarement d’« apprentissage automatique [par les machines] ».
En savoir plus
L’intelligence artificielle (IA) désigne collectivement le traitement exécuté par certains logiciels qui imitent l’intelligence humaine pour accomplir des tâches évoluées. Le machine learning (ML) est un sous-domaine de l’IA dans lequel les systèmes apprennent par eux-mêmes à partir des big data et sans aucune programmation. Le deep learning (DL) désigne un sous-ensemble du machine learning qui construit des abstractions à partir des ensembles de données (datasets) pour en extraire de la connaissance ou une signification.
En savoir plus
Rejoignez les experts Talend pour découvrir les nouveaux produits et les nouvelles fonctionnalités de la dernière version de Talend Data Fabric.
Regarder
Rejoignez les experts Talend pour découvrir les nouveaux produits et les nouvelles fonctionnalités de la dernière version de Talend Data Fabric.
Regarder
Dans ce webinar, nous vous présentons Talend Cloud sur Microsoft Azure, une suite unique d’applications Cloud pour l’intégration et l’intégrité des données, optimisée pour les services et connecteurs Microsoft Azure.
Regarder
Il est essentiel de disposer d’outils de gouvernance efficaces pour garantir l’intégrité de vos données, et de maîtriser les normes de conformité et les exigences de sécurité en constante évolution. Découvrez les stratégies les plus efficaces pour organiser, protéger vos données et y accéder.
En savoir plus
L’intégration des données passe par les quatre principales actions survenant dans les pipelines de données. Tout commence avec des données brutes, pour aboutir à des informations exploitables.
En savoir plus