ホーム > ライブラリー > Teradata コラム > 賢い選択 (2)

賢い選択

エンタープライズ・アプリケーション統合(Enterprise Application Integration:EAI)

EAI によるデータ取得および統合方法は、中間層(アプリケーション・レベル)を利用し、そこから基本データにアクセスします。

EAI は、Teradataウェアハウスへのアクセスがビジネス・プロセスまたはイベントの一部である場合や、異機種が混在する環境でトランザクションの整合性が要求される場合のデータ取得・統合の方法と考えるべきです。EAIワークフローの開発プロセスは特別なアプリケーション知識が必要で、複雑になる場合があります。EAI は、特にサービス指向アーキテクチャ(Service-Oriented Architecture:SOA)でサービスやイベントを公開する必要がある場合に最も適切な方法です。Teradata Database V2R6 では、独自の UDFインターフェースまたはアクセス・モジュールを介してサービスやイベントを公開できます。

エンタープライズ情報統合(Enterprise Information Integration:EII)

EII は主に、現行データウェアハウスや分析ツールを補完するために、複数のデータソースからデータを取得・統合するための方法として利用されます。EII は、新しく物理的なデータ構造を作成するのではなく、ばらばらのデータソースのから仮想的にデータを統合し、仮想ビューを作成します。また、データウェアハウス外にあるいくつかのデータをインポートせずにリアルタイムでアクセスするのに利用されます。仮想ビューが作成されると、SQLステートメントを発行するどのツールからでもデータを呼び出すことができます。Teradata Database V2R6 は、外部ソースに直接アクセスしてデータをロードしたり、揮発性データを UDF や外部ストアド・プロシージャ (ESP)を介してクエリーに取り入れることができます。しかし、EII によるソリューションはかなりのオーバーヘッドが伴うことがあるため、大量データには適していません。

レプリケーション

レプリケーションは、データベース変更トランザクションを様々なシステム間で一方向または双方向でデータをほぼリアルタイムで収集し、適用することを可能にするエンタープライズ・ソフトウェア・ソリューションです。一方向レプリケーションは、1つ以上のソースから 1つ以上のターゲットへ一方向にデータが流れます。双方向レプリケーションは、両方向にデータが流れることを意味します。DataMirror、GoldenGate、Sybase などの主要ベンダーは、異種データソースから Teradataデータベースへの一方向レプリケーションをサポートしています。さらに、Informatica、Ascential などの主要ETLベンダーの多くはリアルタイム・レプリケーション機能を開発しています。Teradataレプリケーション・サービスは、Teradataデータベースをソースとして一方向および双方向のレプリケーションが可能です。

ビジネス・ルールは設計時に設定し、どのデータを捕捉し、どこに変更を適用し、どんなフィルタリングや変換が必要かを示します。ビジネス・ルールを設定すると、様々なソース・システムで発生するデータ変更を、自動的にデータウェアハウスに反映させます。レプリケーションは、基本的な変換、フィルタリングおよびフィールド・マッピングに対応でき、基本的なチェックポイント・リスタート機能を備えています。一般的に、遅延は 1秒未満から数秒です(レプリケーション・ルールやネットワーク・トポロジーの複雑さによります)。
図1 は、レプリケーションの簡単なアーキテクチャとデータの流れを示しています。図はレプリケーション・ソリューションの一般的なエレメントを示していますが、名称は製品ごとに異なります。

図1.一般的なレプリケーション・アーキテクチャ

実用例

架空の企業を例にして、リアルタイム・エンタープライズへと進化していく過程を説明しましょう。この企業は製造システムを Oracleデータベースで稼働させていますが、部品情報を戦略的観点から分析するために、新たに Teradata でウェアハウスを構築したいと考えています。データ取得・統合に関する最初の課題は、まず、製造システムから部品番号、部品明細、故障情報といった特定のデータを Teradataデータベースにロードすることです。この最初のロードは、FastLoad およびこの企業で開発した抽出プログラムを利用して行われます。

Teradataデータベースにデータが格納されると、次の課題は、製造システムで生じた更新を Teradataデータベースと定期的に同期化することです。そこで、次のロード方法として、変更されたデータのみを Teradataデータベースに挿入する MultiLoad を使います。製造システムの更新は、Oracleデータベースからトリガーされます。

Teradataウェアハウスは計画通り分析を実行しています。そこでさらに、財務情報をデータウェアハウスに統合し、ベンダーの価格や実績を分析することにしました。Teradataデータベースには、いくつかのデータソースからデータが入力されるようになり、一部のデータはロードする前に複雑な変換が必要です。そのため、複数のデータソースからのデータの変換および入力に対応するために ETL製品を採用しました。

Teradataウェアハウスが成果を挙げるに伴い、アクセス数は飛躍的に増大し、全世界から多数のユーザーがアクセスするようになりました。データウェアハウスは現在、24時間稼働という可用性が求められ、サービル・レベル要件が厳しくなり、データを Oracleデータベースから直接 Teradataデータベースへ移すことが新たな課題となります。この場合の対応方法は、ほぼリアルタイムのデータ同期化要件を満たすことができる TPump が最善の選択です。先に開発された Oracleデータベースからのトリガーに対し、変更データをキューに書き込むよう命令が出されます。

ユーザーやデータが増えるに伴い、ミッション・クリティカルなデータ配信の重要性が一層重要視されるようになりました。そこで、この企業はデータウェアハウスのシステムを二重化するデュアル・アクティブ戦略を導入します。

この戦略は “ロードの二重化” を可能とし、Teradataレプリケーション・サービスおよび Dual Apply を利用して両方のリポジトリにデータを格納でき、両システム間でデータの同期化を維持します。ビジネス・ルールを設定し、変更データを各 Teradataデータベースに送ることができ、データウェアハウスに対するほぼリアルタイムの要求に応えられます。

この企業では、さらに、SCM(Supply Chain Management)システムを統合し、価格性能指標を利用して、最善の部品をエンジニアが選択できるようにすることを決定しました。そして、最後の課題を解決するために、XMLフォーマットを介してデータを交換する SCMパッケージ・アプリケーションを採用します。また、EAIソリューションを導入して、このパッケージ・アプリケーションと Teradataウェアハウス間のデータの流れを促進することにしました。

様々な決定

様々なビジネス要件を満たすため、企業はニーズを慎重に分析し、それに応じて最適なデータ統合アプローチを決定する必要があります。単純なデータ取得から、ほぼリアルタイムの複雑なデータ統合への移行をサポートする正しいツールやパートナー製品の利用により、Teradataウェアハウスの利用形態を無理なく高度化できます。

Randi Zeehandelaar

Randi Zeehandelaar:
Teradata部門のエンタープライズ統合マーケティングマネジャーとして、Teradata のツール、ユーティリティおよび Teradata RTEリファレンスアーキテクチャを担当。

Margaret Mills

Margaret Mills:
Teradata部のシニア・プロダクトマネジャーとして、復旧センターのソリューションや環境を含む、複数のプラットフォームやベンダー、および様々な規模のビジネス継続プランを立案し実施。

Copyright (C) Teradata Magazine - March 2005

ページの先頭に戻る