Epsilonレガシーデータベースを合理化します

Talend Integration Suite を適用して、マルチ・フォーマットのデータソースから、人口統計属性リストを構築します。

Talend Open Studio は、非常に有効であったが、プロジェクトの集中統制、コード管理などのチームワーク上の課題が生じました。我々は、Talend Integration Suite に投資することを決定し、その投資は十分に価値がありました

Aaron Dix,
Senior Technical Manager, Data Engineering

リーディング・マーケティング会社

Epsilon は、1969 年に設立された産業マーケティングサービスに関するトップ企業です。Ad Age が、No1 のUS マーケティングサービス企業、およびNo1 のUS ダイレクトマーケティング機関と評価しています。3つの部門(Purple@Epsilon、マーケティング技術、Epsilon ターゲティング<含むAbacus>)から構成されており、世界中でクライアントのマーケティングを成功させるために、世界に通用する創造的で証明された技術を駆使し、世界で最も広範囲な消費者およびビジネスデータの収集力を持っています。サービスには、戦略的コンサルティング、確かなデータベース技術、所有データ、予測モデル作成および広範囲な創造的かつ対話型サービス(ブランドと販促の開発、Web デザイン、サーチエンジンの最適化、e メールマーケティング)を含んでいます。フルサービスのマーケティング会社として、Epsilon 顧客は、完璧なサービスを利用でき、多くのオンライン/オフライン・ソリューションも選択できます。さらに、Epsilon は、世界最大のパーミッションベース・e メールのマーケティング会社です。

Epsilon が抱える問題は、顧客のためにデータを収集する会社に共通していました。データは、異なるフォーマットで収集され、大量の手作りコードが必要でした。そのため、この統合プロセスを効率化する必要に迫られていました。

レガシーシステムとのインタフェース

Epsilon は、社内に豊富な複数ツール経験を持っており、新しいプロジェクトを進めるとき、クローズなソリューションの制約に縛られることを望みませんでした。「我々は、もっと正式に、データ統合に焦点を絞ったものが欲しかったのです」とData Engineering group のシニアテクニカルマネージャのAaron Dix は述べています。オープンソース・ソリューションを選択する要件にコストもありましたが、Epsilon は、テストした製品の中で、Talendが最も使いやすいツールであることが分かりました。これまで社内で使っていたプログラムがJava またはPerl で書かれているので、開発者は、すでに技術に習熟していました。Aaron Dix は、次のように述べています。「我々は、Talend が、テストしていた他の製品より能力が優れていることに、すぐ気付きました。しかし、決定的要因は、プロジェクトが我々のソリューションに統合する必要があるレガシーコードを含んでいたことです。システムまたはJavaドライバーを介した外部アプリケーションの使いやすさで、Talend が、外部プロセスとのインタフェースすることを容易に可能としてくれました。基本的に、我々は、Talend を使って、レガシー技術をリプレース、また書き換えました。更に、メンテナンスも非常に容易になりました。」

人口統計データベース構築

Epsilon のプロジェクトは、地図と人口統計属性(年齢、民族、職業、収入など、800 以上)を持ったリストファイルを構築することを必要としました。このデータは、12 以上のフォーマットで届き、Talend を介して処理した後、データベースに追加されます。Aaron Dix は、次のように説明します。「このデータベースは非常に大きく、約430 百万レコードとなっています。我々は、複数サーバ間でこの作業を分散させることができていましたが、時間を費やすと同時に、大量の手作業を必要としていました。」さらに、Aaron Dix は続けて述べています。「まず、通常、固定位置またはデリミッタ形式のASCII、DOS、またはUNIX のフラットファイルにインポートされます。我々は、バックエンドでAlterian Integrated Marketing Platform を使います。Talend は、その間での統合アスペクトを処理します。また、通常、Talend は、ファイル検索(我々が行っていることをうまく統合する非常に効率よいコンポーネントセット)を実行します。さらに、コード生成アプローチもプラスです。生成されたコードを見て、ジョブを修正でき、更に、我々の要求に合わせることができます。また、Talend プロセス内から呼び出されるコードを書くこともできます。ユーザルーチンを追加することにより、コンポーネントを作成したり、Talend の拡張ライブラリからそれらをインポートできます。そして、我々が開発したルーティンを呼び出すことにより、約80%を再利用できます。」

Talend Open Studio からTalend IntegrationSuite へ

Epsilion では、エンタプライズ・ソリューションであるTalend Integration Suite の購入を決定する前に、相当な期間、GPL 製品であるTalend Open Studio を使用していました。Aaron Dix は、次のように述べています。「Talend Open Studio は、非常によく機能しましたが、我々の使用を拡大したとき、チームワーク、プロジェクトとコードの集中化などに関わる課題に直面しました。我々は、Talend Integration Suite に投資することに決め、かつその投資は十分に価値がありました。」 TalendIntegration Suite への購入は、より大きなプロジェクトに対する付加価値ある機能に加えて、テクニカルサポートとIP 補償を含みます。

Aaron Dix は、次のように続けます。「もし、多くの異なるシステムに関わるならば、テストのためでも、この製品は大変能率がよいのです。多くの異なるシステムに、コードをマニュアルでエクスポートする代わりに、TalendIntegration Suite は、単一リポジトリから異なるシステム上でコーディングし、テストすることも可能です。再利用性も促進し、チームワークをきれいにシームレス化してくれます。」

また、Talend Integration Suite は、会社のどこでも使用できます。Aaron Dix は、次のように説明します。「我々は、アドホックなプロジェクトのために、サンドボックスを持っています。Talend は、外部データフォーマットを受取り、データを解析、分析できるデータベースを素早く作成します。現在、10 ライセンスを持ち、更に、増やそうと考えています。」

オープンソース技術とともに前進

Epsilon は、Talend Integration Suite MPx をテストすることを検討しています。MPx は、高度にデータ処理を並列化できる画期的な技術であるFileScale をベースとしたTalend の最新ソリューションです。Talend IntegrationSuite MPx は、企業が大容量データを短時間で処理できる一方、旧来のデータ統合アーキテクチャが持つ制約を解消しています。Aaron Dix は、次のように述べています。「我々のデータセットは、かなり大きく、かつ急速に増加しており、早く処理し、かつ並列化を増やす方法に興味を持っています。Talend Integration Suite MPx は、興味深いソリューションのように思えます。」