ETAI社は データ⽣成アーキテクチャを統⼀しました

Talend Open Studioは多様な環境に分散したデータの統合を⾃動化して、データ⽣成の品質を⼤幅に向上しました。

データ品質に関するこれらの毎⽇のテストのおかげで、我々は今や重要なエラー要因を制御し、品質を維持することができます。製品として出荷するデータベースを構築するための⼀連のデータ・アセンブリにおいて、エラーが発⽣しないこと、⽣成後のデータを⼿直しする必要がないことを、実⾏前に知ることができるのです。

Philippe Bobo,
Software & IS Director

データ・スペシャリスト

ETAIの先進の専⾨知識とメディア・ミックスは、⾃動⾞産業および製造業、⼩売業の3つの産業分野をカバーしています。同社は、これらの産業にデータベース、ソフトウェア、展⽰会、⾒本市、雑誌発⾏など多様な情報ソリューションを提供しています。400⼈の従業員により、ETAIは6,000万ユーロ(8,000万ドル)の収益を⽣み出します。

ETAIのビジネスは、データを作成して、販売することから成り⽴ちます。たとえば、⾃動⾞産業のために、ETAIは供給元(⾞体および部品メーカー)から⽣データを集め、それらのデータを統合・編集して構築したテクニカル・データベースに基づくアプリケーションを作成しています。これらの製品は、⾃動⾞ディーラーや修理業者などの業界関係者に対しDVD-ROMまたは購読会員制のインターネット・ポータルを通じて提供されます。

複雑なデータ・アーキテクチャ

⾃動⾞産業アプリケーションを構築するために、ETAIは⾞両(50,000以上)、補修部品、代替部品、⾞両と部品との適合性、保守のための技術と保守期間、価格、その他に関連した情報を収集します。

「これは広⼤な領域です、そして、標準となるデータ・フォーマットは存在しません」と、同社のソフトウェアおよび情報システム担当ディレクタであるPhilippe Bobo⽒は説明します。「我々は多様なリポジトリ・フォーマットのデータだけでなく、重要な情報を含んだ⼤量の紙⽂書をも収集しています。我々はデータ⼊⼒の⽣産性を向上させ、情報更新のコストを低減するため、最も効果的なフォーマットを持ったデータ⼊⼒⽅法の確⽴に努⼒してきました」

その結果、データベース製品の新しいバージョンがリリース(1年につき100回以上)されるたびに、これらすべてのリポジトリが処理される必要があります。すなわち、データ統合、編集とクレンジングの作業です。「このプロセスは、時間とリソースを⼤量に消費するとともに、常にデータ品質に課題を抱えていました」と、Philippe Bobo⽒は述懐します。「我々はAccess、Java、Python、PL/SQL、その他による多くのプログラムを実⾏していました。さらに、プロセスの多くのステップは⼿動で、その分野の専⾨知識を必要としました」

逆に⾔えば、ETAIの他の事業(ディレクトリ・サービス、雑誌、展⽰会、その他)における⾮技術的なリポジトリをも含めた、各分野に共通するデータ・モデルを⾒出し、統合することには重要な意味がありました。

「我々は、⾃動⾞産業のテクニカル・データベース構築を⾃動化するだけでなく、ETAIの他の事業のデータ管理システムを吸収することのできるデータ統合ソリューションを求めました」と、Philippe Bobo⽒は述べています。「我々のすべてのニーズを満たす単⼀のツールに努⼒を集中することは、不可⽋でした。最終的には、当社の社内システム⾃⾝も同じデータ統合環境を使うことを⽬指しました」

徹底したツール検証

「我々のツール選定は⾮常に秩序⽴ったものであり、コンサルタントの助けを借りて社内の統合プロセス(⼿動であれ⾃動であれ)を分析することから始めました」と、Philippe Bobo⽒は回想します。「その後、我々の主要な評価基準 - 特に当社事業全体への適合性と⾃動⾞産業データベースの⼤量データを処理する能⼒ - を満たすいくつかの製品を選び、パイロット・プロジェクトを⽴ち上げました」

ソリューションのベンダー各社には、予算枠と共にさまざまな課題が提⽰されました。「プロプライアタリなソリューションと⽐較して、Talend Open Studioはより⼤きな柔軟性を持っていました」と、Philippe Bobo⽒は認めています。「プロトタイプのステップはどれ⼀つとして、ツールの機能により制約されることがありませんでした。これは、業界標準の⾔語を⽤いているおかげで、コンポーネント・ライブラリがすぐに利⽤できたこともひとつの要因でした」

Talend Open Studioは性能⾯でも優れていました。プロトタイプの200万レコードを処理する複雑なプロセス実⾏で最⾼速であり、他の競争相⼿、および既存の⼿組みプログラムより30〜50%速い実⾏性能を記録しました。

データ統合の複雑さに加えて、データ・ソースの多様性も重要な課題でした。ETAIのデータ・ソースはMySQL、DB2/400、Access、SQL Server、Oracle、Excel、XML、その他を含みます。そして、製造業者からのデータの多くは複雑なフラット・ファイルで提供されます。テクニカル・データベースのホストはOracleですが、MySQLの上に展開されます。そして、⾃社のバックエンド・システムは、AS/400で実⾏されています。それゆえに、幅広いコネクティビティも必須条件でした。

産業初のオープン・ソース・データ統合ソリューションの選択

ベンダー各社によるプロトタイプ構築のあと、ETAIは結果を⽐較するとともに、リスク要因も加えて評価を下しました。各々のツールの性能と機能だけでなく、ベンダーの信頼性、地理的要因、ETAIチームを⽀援する能⼒も、⻑い⽬で⾒て重⼤な要因でした。その結果、ETAI の評価基準を最⼤に満たすものとしてTalendのソリューションが選ばれました。

「価格も、要因のひとつでした」と、Philippe Bobo⽒は説明します。「我々の7つのサイトにソリューションを展開するには、従来のライセンス・モデルでは、予算上の困難がありました。Talendのオープン・ソース・モデルがすべてのコストを無くすわけではありません。しかし、特にデプロイメント段階における負担をかなり軽減します。さらに、将来のコストを、より予測し易くしてくれます」

ETAIがTalend Open Studioで構築した最初の実務プロジェクトは、すべてのデータ⼊⼒リポジトリの統合過程を⽇常的にシミュレートするものでした。このシミュレーションは、データの⽭盾を直ちに検出し、修正することを可能にします。「データ品質に関するこれらの毎⽇のテストのおかげで、我々は今や重要なエラー要因を制御し、品質を維持することができます。製品として出荷するデータベースを構築するための⼀連のデータ・アセンブリにおいて、エラーが発⽣しないこと、⽣成後のデータを⼿直しする必要がないことを、実⾏前に知ることができるのです」

Talend Open Studioを最⼤限に利⽤するために、ETAIはTalendのサービス提供を受けることとしました。同社のITチームは、最初に上級のトレーニング・セッションに参加しました。応答時間の保証されたGoldテクニカル・サポートも契約しています。そして最後に、Talendの専⾨コンサルタントがETAIを定期的に訪問し、開発チームに⽀援を提供しています。

「Talendが提供するサポートは素晴らしいものであり、それを重要視した我々の選択が正しかったことを実証してくれました」と、Philippe Bobo⽒は明⾔しています。「共に作業したTalendコンサルタントの進んだ専⾨知識とプロ意識は、我々のプロジェクトの成功にとって重要な資産になっています」