データ ファブリック: 概要、ヒント、ベスト プラクティス
公開: 2022-11-05Gartnerは、企業がデータとアプリケーションを監視および管理するのを支援するデータ ファブリックと名付けました。 企業がさまざまなアプリを利用し、データがより動的になるにつれて、データを収集してデータ駆動型の組織になることは、これまで以上に困難になっています。
企業は、このような問題を解決するために、上位 10 位までのデータおよび分析技術開発の中で包括的な戦略を必要としています。 複数のソースと種類からのデータが統合され、統合された仮想ソースが形成されます。 この統合されたアーキテクチャにより、アプリケーション、プラットフォーム、またはストレージの場所に関係なく、分散インフラストラクチャ全体でのシームレスなアクセスとデータ交換が可能になります。
このブログでは、データ ファブリックとは何か、その重要性、ヒント、ベスト プラクティスについて説明します。
コンテンツ インデックス:
- データ ファブリックとは
- データ ファブリックの重要性。
- ヒントとベスト プラクティス
- 結論
データ ファブリックとは
データ ファブリックは、データを使用してハイブリッド マルチクラウド環境全体のエンドポイントに一貫した機能を提供する統合アーキテクチャです。 この統合アーキテクチャは、一貫したデータ管理方法を確立することで、可視性、アクセス、および制御を向上させます。 最も重要なことは、環境全体に一貫性をもたらし、どこでもデータを使用および共有できるようにすることです。
この統合アーキテクチャは、多くの企業が生データを実用的なビジネス インテリジェンスに変換するための主要なツールです。 これにより、特に AI や機械学習の使用において、分析がよりアクセスしやすくなります。 データ管理の労力を最大 70% 削減できることから、Gartner は 2022 年の戦略的テクノロジ トレンドのトップにこれを選択しました。
企業は頻繁にデータをコピーして 1 つの場所に統合しますが、これにはコストがかかり、データ ライフ サイクル全体でコンプライアンスやデータ セキュリティの問題が発生する可能性があります。 しかし、そのデータを組み合わせる正当な理由はまだあります。 多くの企業が、次のことを可能にするアーキテクチャ ソリューションとしてデータ ファブリックの採用を選択する可能性があります。
- 既存のデータにアクセスする
- データのライフサイクルを制御します。
- データ移動プロセスを自動化します。
データ ファブリックの重要性
組織は、制限されたデータ アクセス (つまり、データを必要とする人がデータにアクセスできない) やデータ統合の複雑さなどの問題により、データの価値を完全に活用して最大化することはできません。
従来のデータ統合は、普遍的な変換、リアルタイム接続などのビジネス ニーズにはもはや十分ではありません。多くの企業は、さまざまなソースからの組織データを結合、統合、および変換するための支援を必要としています。
データ ファブリックにより、ユーザーは幅広いデータにすぐにアクセスでき、ユーザーがどこにいても視覚化できます。 マルチクラウド データ ランドスケープにおけるデータ ガバナンスと管理は、データ ファブリックを使用することで、ユーザーにとってよりシンプルになります。
ヒントとベスト プラクティス
データ ファブリックが適切に管理されている場合、ビジネス、運用、および技術のメタデータを積極的に管理する必要があります。 これを実現するには、データ カタログとビジネス レキシコンを会社の全従業員が利用できるようにする必要があります。
組織内の誰もが、データを使用する際にデータに関する知識を共有できます。 妥当な量のデータ ドリフトを許容する速度でメタデータが取り込まれるように、元のすべてのソースに対してスケジュールを維持する必要があります。
ヒントとベスト プラクティスは次のとおりです。
DataOps プロセス モデルを利用します。
dataOps とデータ ファブリックの概念は異なりますが、dataOps は重要なイネーブラーになる可能性があります。 DataOps プロセスのモデルによると、データ プロセス、ツール、および洞察を使用する人々はすべて密接に関連しています。
ユーザーは、継続的にデータに依存し、自由に使えるツールを有意義に使用し、洞察を適用して運用を改善することができます。 このモデルとデータ ファブリックのアーキテクチャ設計は調和して機能します。 ユーザーがそれを最大限に活用するには、DataOps プロセス モデルと DataOps に対する姿勢が必要です。
さらに別のデータ レイクを作成することは避けてください。
データ ファブリックを構築する際の典型的な問題は、それが単なるデータ レイクになる可能性があることです。 アーキテクチャ コンポーネント (データ ソース、分析、BI 手法、データ転送、データ消費) が整っていても、API と SDK が欠けている場合、結果は真のデータ ファブリックではありません。
「データ ファブリック」という用語は、特定のテクノロジーではなく、アーキテクチャ設計を指します。 この設計の際立った機能には、コンポーネントの相互運用性と統合の準備が含まれます。 その結果、組織は、接続層、シームレスなデータ転送、および新しく接続されたフロントエンド インターフェイスへの自動化された洞察の配信を優先する必要があります。
規制とコンプライアンスの義務を認識してください。
データは広範囲に及ぶため、データ ファブリックの設計は、セキュリティ、ガバナンス、規制コンプライアンスに役立ちます。 データは複数のシステムに分散されません。 したがって、機密データが公開される可能性は低くなります。

導入する前に、データに適用されるコンプライアンスと規制を理解することが重要です。 さまざまな種類のデータが、規制の枠組みや法律の対象となる場合があります。 法的要件に準拠するために必要なデータ変換を強制する自動化されたコンプライアンス手順を実装することで、これに対処できます。
グラフ分析を使用して相互接続を探します。
ナレッジ グラフを使用してメタデータとデータの関係を示すことにより、グラフ分析はリレーショナル データベースに代わるよりインテリジェントな手段を提供します。 テキスト文字列のみを使用する代わりに、データにセマンティック コンテキストを入力して、情報が何を示しているかを理解します。
ナレッジ グラフは、データ ソース間の接続を調べることで、運用上およびビジネス上の洞察を提供できます。 リレーショナル データベース方式と比較して、多様なデータの統合に優れており、発見された洞察はビジネス ユーザーにも役立ちます。 この統合アーキテクチャの主な目的は、さまざまなデータ ソースを重複なく幅広く使用できるようにすることであるため、グラフ分析を利用したナレッジ グラフは、データ テキスタイルに最適です。
シチズン デベロッパー向けのデータ マーケットプレイスを作成します。
通常、この統合アーキテクチャは、洞察を生成してビジネス アプリケーションに直接送信するか、IT またはデータ チームによる調査のために断片化されたデータ リポジトリを生成します。 シチズン デベロッパーのアクセスを民主化するデータ マーケットプレイスは、その可能性を活用するもう 1 つの方法です。
この市場からのデータを使用して、データ分析の基本的な理解と長年のビジネス分析の経験を持つビジネス ユーザーは、新しいユース ケースの新しいモデルを構築できます。 企業は、ユース ケース固有の BI を開発するだけでなく、シチズン デベロッパーが斬新で柔軟な方法でそれを使用できるようにすることができます。
オープンソース技術を活用。
データ捏造を作成する場合、オープンソースはゲームチェンジャーになる可能性があります。 拡張可能で統合に対応できるように設計されているため、オープンソース テクノロジがそのアーキテクチャに最も適しています。
多額の投資が必要になる可能性があり、後でプロバイダーを譲渡することを決定した場合でもその投資を保護したいため、オープンソース コンポーネントは、単一のベンダーへの依存度を下げるのにも役立ちます。 最近リリースされた Open Data Fabric プロジェクトを必ず調べてください。これは、ビッグ データとブロックチェーンを使用して分散型ストリーミング データ処理パイプラインを可能にします。
ネイティブ コードの生成を有効にします。
データ ファブリック ソリューションの重要な機能はネイティブ コード生成です。これにより、統合に利用できるコードを自動的に生成できます。 受信データを分析しながら、Spark、SQL、Java などのさまざまな言語で最適なコードをネイティブに生成できる場合があります。
IT プロフェッショナルは、このコードを使用して、API と SDK を利用する必要がある新しいシステムを統合できます。 この方法により、高い統合コストや投資を心配することなく、新しいデータ システムを迅速かつ簡単に組み込むことができます。 また、デジタル トランスフォーメーションの加速にも役立ちます。 ネイティブ コード生成は、ユーザー フレンドリーにするために既製のコネクタで機能する必要があることに注意してください。
エッジ コンピューティングのデータ ファブリックを強化する
企業は、データ ファブリケーションをエッジ コンピューティングに適応させることで、IoT デバイスを最大限に活用できます。 エッジからクラウドへのデータ ファブリックと呼ばれることが多いエッジ データ ファブリックは、特に IoT の展開を支援するために作成されました。 重要なデータ関連のタスクを集中型アプリケーションから、分散しているが密接にリンクされている別のエッジ レイヤーに移します。
たとえば、インテリジェント ファクトリは、エッジ データ ファブリックを使用して、貨物コンテナの重量を自動的に判断し (集中化されたクラウドに接続することなく)、手順の選択を開始できます。 これにより、自動アクションが促進され、従来の集中型データ レイクパラダイムでは実現不可能な意思決定が迅速化されます。
結論
コンポーネント間で必要に応じてデータを転送できます。 データ ファブリックを使用して、さまざまな物理リソースと仮想リソースのリソースと設定を 1 つの場所から管理し、必要なデータ管理の量を減らします。
データ ファブリックは、リアルタイム データを含むデータの包括的な視点を提供し、創造的な戦術の検索、クエリ、および使用に必要な時間を削減します。 また、より深いデータ分析を提供し、企業のインテリジェンスを向上させます。
QuestionPro は、すべての主題と業界向けのソリューションを備えており、単なる調査ソフトウェアではありません。 また、InsightsHub リサーチ ライブラリなどのデータ管理サービスも提供しています。 データ作成に関してサポートが必要な場合は、QuestionPro チームにお問い合わせください。