データベースには、従来のリレーショナルデータベースだけでなく、多次元データベースと呼ばれる種類があります。しかし、企業担当者のなかには「多次元データベースについてよくわかっていないので、概要や特徴について理解したい」という方も多いのではないでしょうか。
そこで本記事では、多次元データベースの概要やリレーショナルデータベースとの違い、特徴などを解説していきます。
関連記事:データ一元管理とは?導入前に知っておきたい3つのメリット・デメリットを解説
この記事の目次
多次元データベースとは
多次元データベースの概要やリレーショナルデータベースとの違い、活用場面を解説します。
多次元データベースの概要
多次元データベースとは、収集した膨大なデータを多次元(多数の視点)で簡単に分析できるように構成されたデータベースのことです。英語では「MDDB」(Multi-Dimensional Database)と表記されることもあります。
一般的な縦軸と横軸に加えて、奥行きのような新たな軸を持つ立体的なデータベース構造になっています。
リレーショナルデータベース(RDB)との違い
多次元データベースとリレーショナルデータベース(RDB)との主な違いは、データベースが2次元構造か立体構造(キューブ構造)であるかです。
リレーショナルデータベースは、正規化されたデータを2次元のテーブル形式で管理するデータベースです。集計結果を表示するためには複数のテーブルの結合が必要であり、属性項目(次元)を変えるごとにデータを再度関連付けるため、応答時間がかかる点などが課題と言えます。
一方の多次元データベースでは、リレーショナルデータベースのリアルタイム性が下がる課題を解消できる利点があります。柔軟な属性項目の変更ができるものの、多次元のキューブ構造であることから、設計には専門的な知識が必要です。
多次元データベースが活用できる場面
多次元データベースは、収集したデータ対象をさまざまな切り口で柔軟に分析することに適しています。そのため、たとえば経営者や責任者の意思決定に役立つBIツールなどで利用すると効果的だと言えるでしょう。
多次元データベースの特徴
ここでは、多次元データベースの特徴について3点解説します。
属性項目(次元)を柔軟に変更できる
多次元データベースの大きな特徴は、属性項目を柔軟に変更可能な点です。データベース上の複数の属性項目を切り替えながらデータの検索や集計ができるため、欲しい結果に合わせて柔軟に検索操作や集計操作ができます。
短時間で集計結果を表示できる
多次元データベースでは、短時間でデータの集計結果を表示できます。あらかじめ全パターンの組み合わせに応じた集計結果を保持しているため、属性項目を変更した際でも短時間で結果を表示できるのです。
多角的なデータ分析が可能になる
多次元データベースでは、多角的なデータ分析もできます。社内のエクセルやCSVデータだけでなく、社外のSNS上などのデータも含めたあらゆる角度でのデータ分析が可能です。
多次元データベースの構造
多次元データベースの構造を理解するうえでは、「キューブ」という独自のデータベース形式を知ることが必要です。
キューブの3種類の構成
キューブには、主に以下の3種類の構成があります。
- MOLAP(Multidimensional Online Analytical Processing)
- ROLAP(Relational OnLine Analytical Processing)
- HOLAP(Hybrid OnLine Analytical Processing)
MOLAPは、多次元のデータベース形式で、レスポンスが速い点がメリットです。一方、ディメンション(分析の視点)が増加するとデータ容量も増加する点がデメリットと言えます。
ROLAPは、リレーショナルデータベースを利用した形式で、柔軟にディメンションを変更できる点がメリットです。反面、レスポンスはMOLAPに劣る傾向があります。
HOLAPは、MOLAPとROLAPの両方の特徴を組み合わせたハイブリッド形式の構成となります。
多次元データベースの分析方法
本章では、多次元データベースの分析方法について、以下の5つを解説します。
- ドリルダウン
- ドリルアップ
- スライス
- ダイス
- ドリルスルー
それぞれ順番に見ていきましょう。
ドリルダウン
ドリルダウンは、現在のディメンションの階層よりも掘り下げてデータ分析をする方法です。たとえば、東京都の階層からさらに各23区エリアに掘り下げて検索するなどが挙げられます。
ドリルアップ
ドリルアップは、現在のディメンションの階層よりも上位階層のデータ分析をする方法です。たとえば、横浜市の階層を上位階層の神奈川県に広げて検索するなどです。
スライス
スライスは、ディメンションの特定の値に視点をあてて、対象をさまざまな切り口でデータ分析する方法となります。たとえば、ある商品Aを対象に、商品Aの四半期別や地域別の販売額を分析するケースなどが考えられます。
ダイス
ダイスは、ディメンションを切り替えて、異なる視点でデータ分析をする方法です。たとえば、商品別・期間別の軸でデータ分析をしていた際に、軸を商品別・地域別の軸に切り替えて分析をする場合などが挙げられます。
ドリルスルー
ドリルスルーは、ディメンションの特定の値に視点をあてて、対象の明細(内訳)をデータ分析する方法です。たとえば、店舗Aの月間総売上に対し、総売上に占める各商品の内訳を検索するケースなどが該当します。
まとめ
多次元データベースは、多種多様なデータを多次元(多数の視点)で容易に分析できるように構成されたデータベースです。従来の2次元構造のリレーショナルデータベース(RDB)とは異なり、立体構造(キューブ構造)となっていることが特徴的です。
多次元データベースは、膨大なデータをさまざまな切り口で柔軟に分析する場面に向いています。したがって、BIツールなど、意思決定者があらゆる変数のもと合理的な判断を下す場合に特に効果を発揮するでしょう。
多次元データベースの利点や適した用途を把握し、今後の社内での情報システム業務に役立てていきましょう。