データプロファイリングとは?

データプロファイリングはビジネスに不可欠です。データプロファイリングを使用してデータを編成/分析する企業は、新たな成功につながる可能性を発見し、市場で明確かつ強力な優位性を発揮できます。

詳細

Hadoopとは?

Hadoopは、Javaベースのオープンソースフレームワークであり、ビッグデータの格納と処理に使用されます。データは、クラスターとして動作する安価な汎用サーバーに格納されます。分散ファイルシステムにより、同時処理とフォールトトレランスが実現します。

詳細

データレイクとデータウェアハウス

データレイクとデータウェアハウスは、どちらもビッグデータを格納するために広く使用されていますが、同じものではありません。データレイクは、ローデータの巨大なプールですが、その目的はまだ定義されていません。データウェアハウスは、特定の目的のために処理され、フィルタリングされた構造化データのリポジトリーです。

詳細

MapReduceとは?

MapReduceは、Hadoopフレームワーク内のプログラミングモデル(パターン)であり、Hadoopファイルシステム(HDFS)に格納されたビッグデータにアクセスするために使用されます。map関数は、入力、ペア、プロセスを使用して、別の中間ペアのセットを出力として生成します。

詳細

ELTとETL:違いの定義

ETLとELTでは、データがビジネスインテリジェンスに変換される場所、そして運用中のデータウェアハウスに保持されるデータの量が異なります。ここでは、これらの違いがビジネスインテリジェンスにとって何を意味するのか、それぞれの組織にとって最適なアプローチはどちらか、なぜクラウドがすべてを変えているのかについて説明します。

詳細

Sparkでのジョブの実行

Sparkフレームワークを使用してビッグデータバッチジョブを作成し、HDFSからデータを読み込み、ソートしてコンソールに表示する方法を紹介します。

今すぐ見る

IT意思決定者が注目すべき2017年以降の6つの重要トレンド

2016年の時点で、世界の総人口の半分がインターネットに繋がっており*、オンライン接続する機械は64億台を超えています**。あらゆる場所で膨大な量のデータが送受信されているのが現状です。Advanced Performance InstituteのBernard Marr氏により執筆された本ホワイトペーパーでは、人、モノ、企業のスマート化を実現する6つの重要なITトレンドについて解説します。

今すぐダウンロード

無料レポート:セルフサービス分析

今日の企業はデータに圧倒され、収集したデータのほんの一部の分析をかろうじて行っている状況にあります。そのような中、より強固なデータ駆動型文化の構築に向け、セルフサービス分析と呼ばれる新しいアプローチを採用する企業が増加しています。

今すぐダウンロード