Le concept de big data existe au moins depuis la Seconde Guerre mondiale. Cependant, ce terme n’a fait son apparition dans les glossaires et dictionnaires qu’au cours de la dernière décennie. C’est l’arrivée de la Wi-Fi, de l’Internet 2.0 et d’autres technologies connectées utilisant l’intelligence artificielle (IA) qui ont fait de la gestion et de l’analyse d’ensemble de données massifs une réalité et une nécessité pour tous.
En savoir plus
Ce webinar à la demande presenté par Talend démontre comment l’INA orchestre son SI.
Regarder
La différence entre l’ETL et l’ELT réside dans le fait que les données sont transformées en informations décisionnelles et dans la quantité de données conservée dans les entrepôts. Découvrez ce que signifie ces différences pour les données décisionnelles, la meilleure approche pour votre entreprise et pourquoi le Cloud est un élément décisif.
En savoir plus
Dans ce tutoriel, apprenez à générer des données aléatoires et à les écrire dans HDFS. Puis lisez les données depuis HDFS, triez-les et affichez-les dans la console.
Regarder
Plus de 50 % des données d’entreprise se trouvent dans le Cloud. C’est pourquoi de plus en plus d’organisations choisissent des outils ELT pour leurs besoins de traitement. Découvrez comment les outils ELT vont changer le futur de l’intégration des données.
En savoir plus
Hadoop est un framework Java open source utilisé pour le stockage et traitement des big data. Les données sont stockées sur des serveurs standard peu coûteux configurés en clusters. Le système de fichiers distribué Hadoop supporte des fonctionnalités de traitement concurrent et de tolérance aux incidents.
En savoir plus
MapReduce est un modèle de programmation disponible dans les environnements Hadoop qui est utilisé pour accéder aux big data stockées dans le Hadoop File System (HDFS). La fonction map analyse les entrées, les paires et les processus et elle produit un autre ensemble de paires intermédiaires en sortie.
En savoir plus
Les tests ETL sont appliqués tout au long du processus ETL pour valider, vérifier et garantir la qualité des données tout en évitant la duplication des enregistrements et la perte de données. Ce document vous propose de découvrir les huit étapes des tests ETL, les neuf types de tests ETL, les défis les plus courants, comment identifier les outils les mieux adaptés à vos besoins, etc.
En savoir plus
Apprenez à créer un Job Big Data Batch à l’aide du framework Spark, ainsi qu’à lire des données depuis HDFS, à les trier et à les afficher dans la console.
Regarder
Apprenez à créer automatiquement des métadonnées de cluster Hadoop en vous connectant à Cloudera Manager.
Regarder
Talend, leader des solutions d’intégration de données open source, étend les possibilités de Sqoop en l’insérant dans une solution d’intégration big data unifiée, polyvalente et facile à utiliser.
En savoir plus
Webinar à la demande Talend pour mieux comprendre comment construire un data lake agile et gouverné
Regarder
TDWI a interrogé les plus grands experts dans le domaine de la gestion des données et a découvert quelles sont les 12 priorités pour une implémentation réussie des data lakes.
TÉLÉCHARGER
Le déploiement d’Hadoop dans les services de Cloud public ne s’arrête pas à la simple location des machines. Le choix et la configuration de la distribution Hadoop adaptée à vos besoins vous permettent d’exploiter dles fonctionnalités et la flexibilité de votre service Cloud pour optimiser vos projets Big Data.
TÉLÉCHARGER
Quand il s’agit d’intégration de données, il n’y a pas de compromis possible. Vous avez besoin d’un outil qui s’appuie sur des standards ouverts, qui intègre n’importe quelle source de données et qui réponde à vos besoins d’intégration de tous types ; intégration de données, profilage de données, Big Data, intégration d’applications etc.
Regarder
En 2016, la moitié de la population mondiale s’est connectée à internet*, et le nombre de machines connectées a dépassé 6,4 milliards** : un volume énorme de données provenant de multiples endroits. Ce livre blanc écrit par Bernard Marr de l’Advanced Performance Institute identifie les opportunités et les dangers liés aux 6 tendances clés de l’IT, parmi lesquelles figurent
TÉLÉCHARGER
Ce webinar à la demande présente les bases pour pouvoir commencer à utiliser Talend Open Studio for Big Data.
Regarder
Les entreprises aujourd’hui sont suralimentées de données à traiter mais la plupart d’entre elles ne parviennent qu’à en analyser une partie.
Beaucoup d’entreprises adoptent une nouvelle approche appelée l’analytique en libre-service afin de se tourner vers une culture plus orientée données.
Regarder
Ce rapport étudie comment des solutions novatrices améliorent les processus de préparation des données pour les services informatiques et les utilisateurs métiers, afin de répondre à la demande d’analyses approfondies.
TÉLÉCHARGER