過去25年間のリレーショナルデータベースの発展

by Colin White

Teradata Magazine(米国版)からリレーショナルデータベース・テクノロジーの進化について執筆依頼があったとき、私は2つ返事で引き受けた。私がこれまでビジネス人生の大半を費やしてきたテクノロジーについて振り返る良い機会だと考えたからだ。

また、この執筆を通じてTeradata の Stephen Brobstチーフ・テクノロジー・オフィサー、著名な執筆者であり研究者であるChris Date氏、Microsoft の有名なエンジニア Jim Gray氏、マサチューセッツ工科大学の Mike Stonebraker コンピュータ科学部助教授等、RDBMSテクノロジーの初期段階に携わった先駆者の方々と意見を交わすこともできた。

その中で、過去 25年間に起きた出来事について、データベース業界の将来の展望についてどのように考えているのか、また、リレーショナルデータベースの発展について興味ある話や具体的な事実をいろいろ聞くことができた。ここでそのすべてを紹介することはできないが、これまで RDBMS がどんな進化を遂げ、今後どこに向かったら良いのか概略を理解していただけることだろう。

適者生存

将来を見通すためには、1969年8月に戻ってリレーショナルモデルの起源を理解しなければならない。この月、E.F.Codd博士がIBM研究レポートに "Derivability, Redundancy, and Consistency of Relations Stored in Large Data Banks" と題する論文を発表した。

Codd博士のこの論文は読者が限られていたが、翌年これに加筆修正を加えた "A Relational Model of Data for Large Shared Data Banks" と題する論文が "Communications of the ACM" 誌に掲載された。この雑誌は最初の論文に比べてはるかに発行部数が多かったため、この雑誌に掲載された論文がリレーショナルモデルについて最初の論文であると思われている場合が多い。(この2つの論文について詳しくは、1998年に Chris Date氏が "Intelligent Enterprise Magazine" に寄稿した "The Birth of the Relational Model" と題する連載記事を参照)

Codd博士の論文に基づいて、カリフォルニア州サンノゼにあるIBM研究所での System Rプロジェクト、カリフォルニア大学バークレイ校でのMichael Stonebraker助教授による INGRESリレーショナルデータベース・プロトタイプ等、いろいろな研究プロジェクトが進められた。

これらのプロジェクトは大きな関心を呼び起こしたが、最初のリレーショナルモデルの製品が出現したのは 10年後のことであり、リレーショナルテクノロジーが認められるようになるまでには、IBM社内外で様々な困難を乗り越えなければならなかった。

例えば IBM社外では、リレーショナルモデルは別のソリューションを支持する人たちには全く受入れられなかった。最も知られていたのが、CODASYL Data Base Task Group (DBTG)によるネットワークデータベース提案だろう。業界標準データベースモデルの確立を目指したこのプロジェクトは、Charlie Bachman氏が指揮していた。

この間、データベース開発に対するネットワーク方式とリレーショナル方式のメリットについて Bachman氏とCodd博士との間で白熱した論争が展開されていた。実績のないリレーショナルテクノロジーが、実績のあるIMSトランザクションとデータベースシステムの売上ベースに及ぼす影響を懸念して、IBM社内でも強硬な反対があった。

1970年代末、人々はビジネスがどのように行われているかはっきり理解できませんでした。私たちは、情報を適切に取り扱えば、憶測や神頼みでなく、毎日または一瞬一瞬決定を下すことができるはずだと考えていました。
- PhilNeches(Teradataの共同創設者)

Codd博士は Date氏の協力を得て、リレーショナルモデルの認知に向けて戦った。Codd博士の目標の1つは、"負担が増えるようになると思われる DBA の仕事を簡単にする" ことだった。この考えにより、リレーショナルモデルのデータ独立性で解決することができ、データベーステクノロジーが使い易く簡単にプログラムできるようになった。

IBM は System R の開発と同時に、IMS の後継版も含む Future Systems(FS)という新世代のハードウェアおよびソフトウェアの開発にも力を入れていた。この新製品は、CODASYL DBTGモデル、リレーショナルモデル、および既存の IMSデータベースアプリケーションをこの新しいシステムで稼動させるためのインターフェースをベースとしたネットワークデータベースであった。

しかし、FSプロジェクトは失敗に終わった。「規模が大きすぎ、複雑すぎたのが原因です。IBM の社歴の中で最も大きな損害を受けた開発の失敗でした」とEmerson Pugh氏は 1995年に出版した "Building IBM" と題する本の中で述べている。このため、IBMはデータベーステクノロジーについてどうすべきかという問題を解決する必要があった。この間の出来事に関係した様々な人たちの間で行われた興味ある具体的な検討については、"1995年SQL Reunion: People, Projects, and Politics" におけるレポートで報告されている。

この失敗にも拘わらず、IBM はリレーショナルデータベース管理システム(RDBMS)の製品化に向けた開発努力を継続し、1981年に第1号製品を発売した。この製品(VSE用SQL/DS)は System R の研究活動に基づいて開発され、IMS を保護する目的で意思決定支援システムとして慎重に位置付けられた。1983年にIBM は、多額の投資をして失敗に終わった FSプロジェクトで最後まで生き残った部分で MVS用DB2を発表した。DB2 も、IMS を保護するために、最初は意思決定支援を対象に販売された。

IBM は RDBMSテクノロジーに関して "政治的" および現実的な障害を乗り越えなければならなかったが、同業他社は製品化に向けた開発に全力を挙げていた。1979年、Relational Software Inc. (現社名:Oracle Corporation)が Oracle RDBMSを発表し、製品化で IBM より 2年先行した。その他、Stonebraker助教授が開発し商品化されたINGRES、Jim Gray氏が開発に協力した NonStop SQL を含め多くの主要 RDBMS製品が 1980年代初期に発売された。

製品が出始めると、そのパフォーマンスとスケーラビリティに関して議論が起こるようになった。パフォーマンスを改善する方法の1つが、データベースのパフォーマンスを改善するためにハードウェアとフソフトウェアを密に統合して構築したデータベースマシンだった。また、独自のオペレーティングシステムを採用し、大規模なデータベースに対するデータベースリクエストを並列処理できるように最適化が行なわれた。データベースからのサービスを必要とするアプリケーションは、ホストコンピュータ(通常DEC VAX/VMSまたはIBM MVS を利用)上で稼動し、チャネルまたはネットワーク接続を介してデータベースマシンにアクセスした。

最も良く知られていたデータベースマシン企業の中に、Britton-Lee (後に社名をShareBase Corporationに改名)と Teradata があった。両社は、目的をトランザクション処理ではなく意思決定支援に絞っていた。Strategic Communications の創業者で Britton-Lee の元広報部長Humphrey氏は「Teradataの成功は 1984年に他社に先駆けて IBMメインフレームに接続できるデータマシーンを発売して市場に進出したことであると考えています」と話す。1985年、TeradataはShareBase を買収した。

その後、RDBMS は意思決定支援およびビジネストランザクション処理の両方に優れたパフォーマンスを実現できることが実証され、1980年代末から1990年代初期にかけてマーケットシェアを確実に伸ばした。