Talend annonce son appui au projet open source Delta Lake

Renforcer la relation avec Databricks pour aider les entreprises à traiter leurs données à la demande dans le cloud

Redwood City, CA - 7 mai 2019 - Talend, un leader mondial de l'intégration et de l'intégrité des données dans le cloud, annonce aujourd'hui qu'il prendra en charge Delta Lake, le nouveau projet open source de Databricks. Talend Cloud, une plateforme d'intégration unifiée, complète et hautement évolutive (iPaaS), intégrera nativement les données de n'importe quelle source vers et depuis Delta Lake, pour un environnement fiable et homogène de transmission de données en batch et en streaming, permettant ainsi une large variété de cas d’usages analytiques et opérationnels.

Talend Cloud intégrera de manière transparente les données en provenance et à destination de Delta Lake, en tirant parti de ses capacités de conformité ACID (Atomicité, Cohérence, Isolation, Durabilité), de time travel (gestion des versions des données), et du traitement unifié par batch et en streaming. En plus de se connecter à un large éventail de sources de données, y compris les principales applications SaaS et plateformes cloud, Talend offrira aux utilisateurs de Delta Lake des fonctionnalités complètes de qualité et de gouvernance des données pour la prise en charge du machine learning et d’analyses avancées, en supportant nativement toute la puissance de la technologie Apache Spark sous-jacente de Delta Lake.

« La fiabilité des données dans les data lake a empêché les organisations de réaliser pleinement le potentiel de leurs données », déclare Ali Ghodsi, cofondateur et CEO de Databricks. « En tant que projet open source, Delta Lake offre à la communauté un environnement propice pour créer des solutions qui répondent aux problèmes de qualité des données dans les data lake. Talend a toujours été à la pointe de l'intégration open source et nous attendons leurs contributions avec impatience. Notre partenariat soutenu permet à nos clients communs d’accélérer leurs initiatives en data engineering et machine learning. »

La prise en charge étendue des connecteurs Spark par Talend apportera plusieurs avantages à Delta Lake, notamment :

  • Une meilleure cohérence des données grâce aux capacités natives de qualité des données de Talend avec les transactions ACID de Delta Lake.
  • Une facilité pour des retours en arrière et un retraitement grâce à l'intégration de Talend à Delta Lake Time Travel et aux capacités de gestion des versions des données.
  • Un traitement de gros volumes à la demande grâce à la prise en charge par Talend de l'architecture évolutive de Delta Lake.

Delta Lake apporte la fiabilité aux data lake en gérant les opérations de données en streaming et en batch, et entre plusieurs lecteurs et rédacteurs simultanément. Delta Lake peut facilement fonctionner avec n'importe quel data lake existant, ce qui permet aux entreprises d'obtenir de la fiabilité des données avec un minimum de changements dans leurs architectures de données. En conséquence, les développeurs peuvent avoir des centaines d'applications qui téléchargent et interrogent des données à la demande, de manière fiable.

« La prise en charge de Delta Lake par Talend est une évolution naturelle de notre expertise dans l'unification des données, en batch et en streaming, pour les entreprises », déclare Mike Tuchen, CEO de Talend. « Depuis sa création, Talend a toujours adopté des technologies innovantes qui facilitent la transition vers des architectures modernes de données. Nous nous engageons à poursuivre nos efforts pour aider les entreprises à traiter leurs données à la demande dans le cloud, et Delta Lake comble une lacune importante dans l'optimisation des analyses pour des pipelines de données massifs. »

Talend Cloud offre une suite unique d'applications d'intégration et d'intégrité de données pour aider les entreprises à collecter, gérer, transformer et partager leurs données. Au sein d'une interface unique, les entreprises peuvent utiliser des capacités d'intégration de données, d'intégration de big data et de qualité des données pour fournir des données fiables et gouvernées à tous les niveaux de l'entreprise. Les clients de tous les secteurs d'activité choisissent Talend Cloud pour leurs projets de cloud data lake et de cloud data warehouse. Talend Cloud propose plus de 900 connecteurs et composants, une qualité des données intégrée, un support natif des dernières technologies big data et cloud, ainsi qu’un support du cycle de développement logiciel (SDLC) aux entreprises, à un prix prévisible. Talend Cloud est intégré avec Azure Databricks et Databricks pour AWS.