Talendが業界初のクラウドネイティブかつApache Beam採用の データストリーミング用クラウドアプリを提供

Talend Data Streams for AWS 無償版により、ペルソナベースのクラウドアプリケーションスイートを増強 データの経済性を変革し、データサイエンティスト、エンジニアの知見獲得を加速 2018年5月10日 <本資料は2018年5月8日に米国で発表されたプレスリリースの日本語抄訳版です>

REDWOOD CITY, Calif. and NEW YORK - 2018年5月8日 - クラウドおよびビッグデータ統合ソフトウェアの世界的リーダーであるTalend(米国カリフォルニア州レッドウッドシティ)は、ニューヨークで開催中の顧客とパートナー向けの同社の年次イベント「Talend Connect US」(5月7日-9日開催)において、無償アプリケーションの「Talend Data Streams」をオンラインストア「AWS Marketplace」で提供することを発表しました。Talend Data Streamsは、大量で多様なリアルタイムデータの取り込みを簡素化・高速化し、かつデータエンジニア、データサイエンティスト、データアナリスト、そしてその他のデータを必要とするユーザーに対して、統制されたセルフサービスアクセスを提供します。Talend Data Streamsは、Talendがすでに展開しているペルソナベースのクラウドアプリケーションスイートの一部として年内に提供が開始されます。

TalendのCMO、アシュリー・スタラップは次のように述べています。「革新的なビジネスの知見が単独で生まれることはありません。データサイエンスの成功事例からは、データドリブンな活動がチームスポーツと同様の性質を持っていることがわかります。つまり、全ての従業員がデータを収集・整形し、品質と信頼を向上させる必要があるのです。Talend Data Streamsは、このコラボレーションをさらに前進させ、リアルタイムデータも対象範囲に含めます。データサイエンティスト、データエンジニア、データアナリストは、使いやすく直感的なセルフサービス型アプリケーションを使用してデータを収集・処理することができるため、イマジネーションからイノベーションへと加速的な飛躍が実現します」。

16,000人以上のデータ専門家を対象に実施された最近の調査で、データサイエンスの一般的な課題として多く挙げられたのは、いわゆる「ダーティデータ」の問題(36%)、データサイエンスチームに対する管理サポートの欠如(27%)、データ活用に関する明確な方向性の欠如(22%)、全体的なデータアクセスと可用性の問題(22%)でした1。データサイエンティスト、データエンジニア及びデータアナリストがこれらの課題を克服するために、Talend Data Streamsは次の機能を提供します。

  • ゼロインストールで管理不要のWebベースUIを使用して、数分でデータ統合を開始できます。
  • 莫大な量の個別のストリーミングとクラウドデータを簡単な手順で迅速に収集します。
  • リアルタイムにデータの変遷を可視化するライブプレビュー機能により、パイプライン開発を加速します。
  • Apache Beam搭載が可能な全てのクラウドプラットフォーム間での、他に例をみない移植性を実現。レガシーサイクルを打破し、全てのデータパイプラインのライフサイクルを延ばします。

信頼性の高いデータの提供

今日のデジタル経済において、データは新たな通貨としての役割を果たしています。それにもかかわらず、データの経済性は破綻しています。データ量が年を追うごとに倍増し、データに関する仕事につく人が3倍に増えている一方で、IT予算は横ばいのままです。これではビジネスに必要な情報への要求拡大にITが対応することは不可能なため、事業部門ごとにデータ収集・統合に独自のツールを使用することが一般的になり、情報のサイロ化(シャドーIT)の問題が進行しました。結果として、企業全体でのデータドリブンによる可能性を実現できなくなっています。

クラウドベースのビッグデータストリーミングテクノロジーは、企業がクラウドを利用してデータドリブンの意思決定を拡張できるよう支援します。同時に、データという最も価値の高い資産のガバナンスと信頼性を確保・管理し、さまざまな従業員がアクセスできるようにするうえで重要な役割を果たします。

Talendの製品担当SVP、キリアン・ダインズは次のように述べています。「デジタルビジネスでは、企業全体のセキュリティ、プライバシー、プロセスのコンプライアンスを管理するための一貫したアプローチが必要です。しかし、情報がサイロ化して、品質と一貫性を確保するための基準が満たされなければこのアプローチは実現できません。破綻しているデータの経済性を克服してデータ利用を改善するために、企業は従来とは根本的に異なるデータアーキテクチャーを必要としています」。Talendの使命は、コラボレーションとクラウドを使用して、レガシーインフラストラクチャからデータを解放し、可用性、品質、パフォーマンス、価値を向上させることです。

Talend Data StreamsはTalend Data Fabricに追加されます。Talend Data Fabricは全てのTalend製品をひとつに統合したオープンソースベースの統合プラットフォームで、リアルタイムまたはバッチのデータとアプリケーション統合のための強力で使いやすい共通ツールセットを提供します。Talendが提供するクラウドベースでセルフサービス型の統合アプリケーションスイートは、作業者の生産性を向上し、デジタル変革を実現するために最適化されています。Talendを使用することで、ビジネスとITはデータ統合とガバナンスのタスクを共同で推進できます。アプリケーション間での作業共有も簡単になり、スチュワードシップのタスクも調整できます。さらに、データの信頼性が高まり、データ活用のレベルと速度も向上します。

ライブウェビナーでTalend Data Streamsの機能とメリットの詳細を紹介します。ウェビナー「もっと多くのデータを業務で活用するために:Talend Spring ‘18」は、6月5日の14:00~15:00に開催されます(申し込みはこちら)。Talendのブログでも、クラウド・ビッグデータストリーミングがビジネスパフォーマンスに及ぼす影響について、さらなる知見を提供しています。

以上

―――――――――――

1 Kaggle 2017 State of Data Science and Machine Learning:16,000人以上のデータ専門家を対象に実施(2017年8月に収集)