データサイロとは、企業のあるグループ・部門によって保持されているデータの集合のうち、他のグループから容易に、または全くアクセスできなく分断され、連携が取れていないデータを指します。このサイロ化したデータは、企業のデータから深く実用的な知見を集めるプロセスを妨げ、企業データを総合的に見渡す際の障壁となります。また、データのサイロ化とは、データの連携ができていないことを指すのはもちろんのこと、ビジネスにおける組織構造の分断を指すこともあります。

データは社内の部門ごとに整理されがちです。 財務や管理、人事、その他の部門は、それぞれの業務を行うために異なる情報を必要とします。こうした、時に重複していて整合性のないデータの集合は、別々のサイロに保管されています。データの量と多様性が増大するにつれて、データサイロも拡大し続けています。

企業がデータ分析の利点を最大限に活用するには、自社データに対する全方位的な視界を得て、隠れた機会(あるいは脅威)を全社規模で見つけ出せるようにする必要があります。

データサイロによって、自社の総合的なデータ分析の可能性が抑制されているかどうかを良く理解するために、データサイロの詳細と、それがデータの利点を最大限に引き出す障害となる問題、そしてデータ統合を実現するために何ができるのかについて詳しく説明します。

データ統合徹底解説をダウンロードする
詳細

データサイロはどこからやって来るか?

データサイロは、ほとんどの企業に共通する状況に起因して、時間の経過とともに自然に発生します。 それぞれの部門が独自の目的のために独自のデータを収集して保存することで、独自のデータのサイロ化が形成されます。

組織の構造

ビッグデータとクラウドによるビジネスの革新以前は、各部門が独自のデータを作成して管理することは悪いことではないと考えられていました。 各部門にはそれぞれ独自のポリシーや手順、目標があります。 チームは自分たちのニーズに合わせて、データの取り扱いや分析を行う独自の方法を開発しました。 企業の部門が中心となってデータの収集や保管が行われたために、企業の部門を中心としてデータのサイロ化が始まりました。

文化

オペレーションや人事、採用、その他の部門は、自分たちの独自の世界で業務を行うように習慣づけられています。 それぞれに独自の専門用語があり、プロセスがあり、課題があります。 各部門は物理的に区切られた場所で働いているため、必然的に自分たちが他の部門から隔離されていると考えます。 この隔離の文化は、データにも及んでいます。 全社的なデータの共有は比較的新しい目標であるため、各部門は共有するよう動機付けされていません。

テクノロジー

各部門では多くの場合、スプレッドシートや会計ソフトウェア、病院管理ソフトウェアといった、さまざまな技術ソリューションを使用して業務に対応します。 各ソリューションによってデータの保存方法や管理方法は異なり、その多くはソリューションを開発したベンダー独自の方法です。 レガシーなシステムは、データを簡単に共有できるようには設計されていません。 そのため、企業のデータ管理プロセスが独自技術に依存するようになった結果、多くの企業が毎日使用している技術ツールによって、企業はデータサイロに押しとどめられました。これがデータサイロの問題となっているのです。

データサイロが企業組織を分断する4つの問題

それぞれの部門は、共通の目標達成を支援するために存在しています。 各部門は個別に業務を行っていますが、互いに依存しあってもいます。 たとえば、財務部門が作成して管理しているデータの少なくとも一部は、管理部門や他の部門による分析にも関連しています。

競争やコスト削減の必要性、そして案件獲得の欲求により、企業はさらなる自社データの活用を迫られています。 業務効率を最大限に高め、新たな機会を発見するには、全社規模の情報にアクセスできる必要があります。

しかしどこかの時点で、データサイロが成功を阻む障壁となり、企業内の問題になっています。 以下がそのよくある4つの形です。

  1. データサイロがデータへの視界を制限する

サイロは関連するデータの共有を妨げます。 各部門が行う分析は、それぞれから見える範囲によって制限されます。 会社全体のデータを見ることができなければ、全社的な効率を見出すことはできません。 たとえば、業務のデータとコストのデータが統合されていないのに、どうして業務コスト削減につながる隠れたチャンスを見つけられるでしょうか。

  1. データサイロがデータの整合性を脅かす

データがサイロ化すると、同じ情報が異なるデータベースに保存されるケースが多くなり、部門間のデータの不整合につながります。 データが古くなると不正確となり、有用性が低下します。 たとえば、同じ患者のデータが別々のシステムに保存されている場合、データは時間とともに同期しなくなる可能性があります。

  1. データサイロがリソースを浪費する

同じ情報が異なる場所に保存されている場合、そしてユーザーがデータを個人またはグループのストレージにダウンロードする場合、リソースが損なわれます。 データを1つのソースに集約して合理化することで貴重なストレージが解放され、不要かもしれないストレージを購入して維持管理するというIT部門のストレスが軽減されます。 たとえば、作業者の多くはデータをダウンロードしてスプレッドシートで分析しますが、ダウンロードされた各データは既存のデータの冗長なコピーとなります。

  1. データサイロにより共同作業が妨げられる

文化がデータサイロを形成し、データサイロが文化を増強します。 データ駆動型の企業は、新しい知見を見つけて活用するための強力なツールとして共同作業を積極的に取り入れています。 共同作業を促進するためには、各部門がデータを共有できる方法が必要です。 データのサイロ化によって、データの共有が困難、あるいは不可能な場合、共同で作業する能力が損なわれます。

データサイロを破壊する方法(解決策)

分析のためのデータの一元化は、クラウドによってはるかに迅速かつ容易になりました。 かつては数週間、数か月、数年を要していた作業は、効率的な分析のためにデータを共通のプールに共通の形式で集約するプロセスを合理化するツールを使用して、数日から数時間で完了できるようになりました。 サイロは、技術的および組織的に解決できます。

  1. 文化を変える

データ共有のメリットを伝えて、従業員が変化を納得できるようにしましょう。 また、データ整合性や競争力の喪失といった、データのサイロ化に伴う問題についても周知します。 文化を変えるのは難しい課題ですので、経営陣は本気の姿勢を示す必要があります。

  1. データを一元化する方法を開発する

データサイロを破壊する最も有効な方法は、効率的な分析のために最適化された中央データリポジトリである、クラウドベースのデータウェアハウスやデータレイクにデータをプールすることです。 異なるソースからのデータは均質化されて集約され、個人やグループに対して容易にアクセス権を付与できます。

再生 Architecting Your Customer 360 Data Lake for Today and Tomorrow をダウンロードする
今すぐ見る

  1. データを統合する

効率的かつ正確なデータの統合は、将来のデータサイロを防ぐための折り紙付きの方法です。 企業はさまざまな方法を用いてデータを統合します。

スクリプト

IT部門にSQLやPython、その他のスクリプト言語を使用したスクリプトを記述させることで、企業はデータをサイロ化したデータソースからウェアハウスへと移行できます。 スクリプトの欠点は複雑になりうる点です。データソースが増大すれば、スクリプトもより複雑になります。 データソースに変更があった場合にはスクリプトの更新が必要となるため、IT専門家にはメンテナンスのためのコストと時間の負担が生じます。

オンプレミスETLツール

ETL(抽出、変換、ロード)およびELTツールは、さまざまなソースからデータウェアハウスへのデータの移行プロセスを自動化します。 こうしたツールはソースからデータを抽出して、データを分析のための共通の形式に変換し、結果を企業のデータセンターにあるデータウェアハウスにロードします。

クラウドベースのETL

クラウドとデータは密接に連携し、高度な技術を持ったクラウドプロバイダーがETLプロセスを簡単で高速なものにします。クラウドベースのETLでは、データウェアハウスやETLツールなどの、クラウドプロバイダーの環境で効率よく動作するように設計されたインフラストラクチャーが利用されます。 ETLは、さまざまなソースからのデータを分析のために1か所に集約する技術的手段を提供することで、サイロを破壊します。 ETLはデータ整合性の問題にも対処し、誰もが常に最新のデータを扱えるようにします。

  1. 統治されたセルフサービスのアクセスを確立する

データが一元化されたら、データガバナンスを一元化する機会も得られます。 こうしたアクセスポリシーによってセルフサービスでの分析が容易になり、権限を持つユーザーは必要な時にデータに簡単にアクセスできます。

データガバナンス 徹底解説をダウンロードする
詳細

クラウドとデータストレージの未来

クラウドは、さまざまなソースからのデータを一元化して、オフィスや自宅、移動中、あるいは支店業務からでも容易にアクセスできるようにする自然な方法として登場しました。

クラウドは共同作業を妨げる技術上の障壁をなくし、データサイロをすぐに解消できるソリューションを提供します。 企業は確立されたETLプロセスを使用して、不適切なデータを取り除いて重複をなくすことにより、新しいデータや更新されたデータをクラウドデータウェアハウスに素早く追加できます。 その結果、データサイロの問題が解決し、財務や管理、人事、その他の部門は、需要に合わせてスケーリングされる利用しやすい単一プラットフォーム上で、新しくタイムリーでクリーンなデータを使って共同作業できます。

クラウド技術とクラウドデータウェアハウスは共同作業を促進し、企業全体のデータへのアクセスを通じてアナリストに全社的な360°の顧客ビューをもたらします。 データアナリストは、自身の業務が企業全体に与える影響と、他のメンバーの業務によって自身が受ける影響を、さらに詳しく把握できるようになります。

データサイロを破壊する

データサイロは生産性を徐々に低下させ、知見の獲得を妨げ、共同作業の障害となります。 しかしデータが一元化されて、分析のために最適化されると、サイロは障壁ではなくなります。 クラウド上での一元化には、クラウドテクノロジーが実用的な一元化を実現できるように最適化されているという利点があります。

Talend Data Fabricを利用してクラウド上でデータを一元化することで、Talendがデータ統合ETLやデータガバナンス、セキュリティ、規制遵守を簡素化しつつ、すべての部門がサイロを破壊してデータにアクセスできるようにするという恩恵を受けることができます。 たとえば、建築資材サプライヤーであるTravis Perkinsは、データの収集、管理、変換、共有の方法を改善するためにサイロを破壊しました。 このプロセスにより、同社の売上は30%増加しました。

Talend Data Fabricにより、企業全体のユーザーが包括的なアプリケーションスイートを利用して共同作業できるようになります。これはデータサイロを恒久的に破壊するプロセスを簡素化するソリューションの1つです。 Talend Data Fabricをお試しになり、Talendがどのようにお客様のパートナーとなってサイロを一掃し、業務を改善して利益を高め、ビジネス戦略を導く信頼できるデータを得られるようにするのかをご確認ください。