Tout savoir sur l’exploration de données, ses avantages et sa mise en place

Le data mining n’est pas née lors de l’ère numérique. Ce concept existe depuis plus d’un siècle mais il est devenu réellement connu dans les années 1980. Depuis, un long chemin a été parcouru. Les entreprises utilisent désormais le data mining et le machine learning pour accomplir de nombreuses tâches, de l’amélioration du processus de vente à l’interprétation des données financières pour l’investissement.

En savoir plus

Qu’est-ce que le machine learning ?

Le machine learning est une technique qui utilise des probabilités statistiques pour donner aux ordinateurs la capacité d’apprendre par eux-mêmes grâce à leur exposition à différents types de données en entrée. On parle également, mais plus rarement d’« apprentissage automatique [par les machines] ».

En savoir plus

Utiliser le machine learning pour la qualité des données

Découvrez comment les big data modifient la méthodologie de qualité des données. Les big data ont démocratisé le machine learning et tout comme la qualité des données a transformé le machine learning, ce dernier transforme également la méthodologie de mise en œuvre de la qualité des données.

En savoir plus

Sqoop

Talend, leader des solutions d'intégration de données open source, étend les possibilités de Sqoop en l'insérant dans une solution d'intégration big data unifiée, polyvalente et facile à utiliser.

En savoir plus

Préparation des données – Présentation générale

Le terme « préparation des données » désigne les opérations de nettoyage et transformation qui doivent être appliquées aux données brutes avant leur traitement et analyse. Il s’agit d’un processus très chronophage, mais indispensable à un environnement de Business Intelligence exploitable. Et avec les outils de préparation des données disponibles en libre-service, ce processus est désormais plus facile à exécuter et très efficace.

En savoir plus

Analytique en périphérie – Avantages et inconvénients d’une connaissance immédiate et locale

Un rapport Gartner indique que 90 % des données accumulées par les entreprises ne seront jamais exploitables, et un rapport Experian indique que près de 32 % des données disponibles dans les entreprises américaines sont inexactes. Il n’en demeure pas moins que les données sont la ressource la plus précieuse de toute entreprise. Il est donc inconcevable de les ignorer complètement ou de les laisser dormir dans un data lake dont personne ne se préoccupe jamais. Les data scientists doivent impérativement exploiter leurs gisements de données IoT pour mieux comprendre les différents points de terminaison qui reçoivent ces données et formuler des conclusions permettant de définir un environnement opérationnel plus efficace.

En savoir plus

Qu’est-ce que profilage des données ?

Le profilage des données, une affaire sérieuse. Les entreprises qui appliquent des fonctionnalités de profilage à leurs données pour les structurer et les analyser plus efficacement découvrent de nouvelles opportunités de succès et se dotent d’un avantage concurrentiel très net sur le marché.

En savoir plus