ストリーミングデータとは?

Kafkaなどのストリーミングデータフレームワークによって、スケーラブルで柔軟な方法でストリーミングデータを移動/処理できるようになりました。

詳細

ESBによるアプリケーション統合の簡素化

今日、P2P統合スタイルに起因するすべての課題、障害、エラーに対処し、アプリケーション統合の問題を克服できるエンタープライズサービスバス(ESB)が、革新的な組織に採用されるようになっています。

詳細

データマネジメント(管理)とは?/データ管理の方法とメリット

データ管理とは、現代のビジネスに不可欠なデータの取り込み、格納、マイニング、アーカイブのためのフレームワークを構築・維持する専門プラクティスを指します。7タイプのデータ管理、適切なデータ管理のメリット、3つのベストプラクティス、適切なツールの見つけ方を紹介します。

詳細

データ抽出の定義

現実のメリットをもたらすようにデータの抽出とETLプロセスを定義する方法を紹介します。

詳細

エッジアナリティクス:ローカルで即座に知見を得ることのメリットとデメリットについて

ガートナーは、展開されたデータの90%は役に立っていないと報告しています。また、エクスペリアン(Experian)は、米国企業が抱えるデータの約32%は不正確であると報告しています。重要なのは、あらゆる企業にとってデータが最も貴重な資産であることです。データを丸ごと廃棄したり、利用されないデータレイクに放置したりするのは非常に残念なことです。さまざまな情報エンドポイントを理解し、最終的にビジネス成果をもたらす結論を導くためには、すべてのデータサイエンティストがIoTの膨大なデータプールを活用することが不可欠です。

詳細

データ処理とは?

データ処理は、生の形態のデータを読み取り可能な形式に変換します。これによって、コンピューターがデータを解釈し、組織全体で従業員が活用できるようになります。

詳細

クラウド統合入門:iPaaS、SaaS、セキュリティなど

クラウド統合の様々なプラクティスが用意されており、役立つツールやサービスも多様に提供されています。一方、各組織のレベルでは、データ活用のあり方について重要な決定を下す必要があります。その両面について説明します。

詳細

ビッグデータ(Big data)の定義と未来予測

ビッグデータとは、業務を改善するために莫大な量のデジタル情報を収集、分析、使用することを指す一般的な用語です。ビッグデータによって、私たちの生き方、ショッピング、そして日常生活のアプローチが急速に変化しています。ビッグデータとはどのようなもので、どのように活用できるのかを説明します。

詳細

ETLテスト:概要

ETLテストとは、レコードの重複やデータの損失を防ぎながらデータの正確性の検証/確認/保証を行うために、ETLプロセス全体に適用されるテストを指します。ETLテストの8つの段階、9種類のテスト、一般的な課題、最適なツールの見つけ方などを紹介します。

詳細

データレイクとは?

データレイクは、多数のソースからのビッグデータを元のままの形式で保持する中央ストレージリポジトリです。データレイク形式のメリットは魅力的であり、多くの組織がデータウェアハウスからデータレイクに切り替えています。データレイクの特長、データレイクの使用が拡大している理由、データレイクを構築する方法について紹介します。

詳細

データウェアハウス(DWH)とは? メリット・特徴を紹介

データウェアハウスは、組織の意思決定を支援するために使用される大規模なビジネスデータです。ビジネスインテリジェンスの取り組みの基盤となるコンポーネントです。データウェアハウスの仕組み、データベースやデータマートとの違い、クラウドへの移行の理由について紹介します。

詳細

データの冗長性とは?

データの冗長性は、データベースやデータストレージのテクノロジーに同じデータが保持されている状態を指します。単一データベース内の2つの異なるフィールド、または複数のソフトウェアプラットフォーム/環境内の2つの異なるスポットでデータが再現されることがあります。MDMによってデータの冗長性とそれが引き起こす問題を回避する方法を紹介します。

詳細

AI vs 機械学習 vs ディープラーニング

AIは、人間の知能を模倣してタスクを実行する機械です。機械学習(ML)はAIの亜領域であり、プログラミングを使用せずにコンピューターがビッグデータから学習することです。MLのサブセットとなるディープラーニングは、データセットから抽象概念を構築して意味を組み立てることです。

詳細

データプロファイリングとは?

データプロファイリングはビジネスに不可欠です。データプロファイリングを使用してデータを編成/分析する企業は、新たな成功につながる可能性を発見し、市場で明確かつ強力な優位性を発揮できます。

詳細

データベース統合とは?

データベース統合は、複数のソースからの情報を集約し、組織全体でクリーンで最新のデータを共有するためのプロセスであり、ビッグデータの運用における核心となります。ここでは、統合で使用されるプロセス、パートナー、ツールについて説明します。

詳細

マスターデータ管理(MDM)とは

マスターデータ管理(MDM)は、一貫性のある「真の」最新データを常に使用し、これに基づいて意思決定を行うことを可能にする手法です。それがビジネスにどのように利益をもたらすのか、どのような課題に備えるべきか、どのように開始するのかについて説明します。

詳細

Hadoopとは?

Hadoopは、Javaベースのオープンソースフレームワークであり、ビッグデータの格納と処理に使用されます。データは、クラスターとして動作する安価な汎用サーバーに格納されます。分散ファイルシステムにより、同時処理とフォールトトレランスが実現します。

詳細

データレイクとデータウェアハウス

データレイクとデータウェアハウスは、どちらもビッグデータを格納するために広く使用されていますが、同じものではありません。データレイクは、ローデータの巨大なプールですが、その目的はまだ定義されていません。データウェアハウスは、特定の目的のために処理され、フィルタリングされた構造化データのリポジトリーです。

詳細

MapReduceとは?

MapReduceは、Hadoopフレームワーク内のプログラミングモデル(パターン)であり、Hadoopファイルシステム(HDFS)に格納されたビッグデータにアクセスするために使用されます。map関数は、入力、ペア、プロセスを使用して、別の中間ペアのセットを出力として生成します。

詳細

データマートとは?

データマートは、特定ユーザーグループのニーズに対応するサブジェクト指向のデータベースです。データウェアハウスやオペレーショナルデータストア内の情報へのアクセスを(数か月以上もかけずに)数日で実現するデータマートは、ビジネスプロセスを加速します。

詳細