2001. 5. 20更新
(C) Copyrights データウェアハウス研究会, 2000.
無断転載を禁じます。
データウェアハウスに関連する用語について、解説します(『
|
BI(Business
Intelligence)
|
|
→ビジネスインテリジェンス
|
|
CIF(Corporate
Information Factory:コーポレート・インフォメーション・ファクトリ)
|
| |
データウェアハウス提唱者のインモンが発表した企業情報システム全体を体系づけた概念。意思決定支援の観点から企業情報システム全体を捉え、その中でデータウェアハウスの役割を位置づけている。アプリケーション、ODS、データウェアハウス、データマートなど構成要素間の情報の流れを体系化している。(6.3、6.4、6.11、7.1) |
|
CRM(Customer
Relationship Manegement:カスタマー・リレーションシップ・マネジメント)
|
| |
顧客一人ひとりのニーズに的確に対応し、一対一で顧客と接することで信頼感を高め、長期的に優良な顧客関係を保持してゆこうという経営手法。顧客満足を向上させることによって顧客と企業との関係を良好に保ち、企業の収益力を高める。(1.3、7.4) |
| CTI
(Computer Telephony Int-egration:コンピュータと電話の統合)
|
|
電話とコンピュータを融合させる情報技術。顧客からかかってきた電話番号をもとに、顧客情報をデータベースから検索し画面に表示するのが一般的な活用方法。電話番号をもとに正確なデータ収集が自動的におこなわれるという活用法もある。(1.7)
|
|
DBMS(Data
Base Management System:データベース管理システム)
|
| |
データベース内のデータの整合性を正しく保つための保全機能、データの二重更新を防止するための排他制御機能、データ障害時に回復するためのリカバリ機能、アクセス権を制御し機密を保護するためのセキュリティ機能などを提供するデータベース管理システム。(2.2) |
|
ERP(Enterprise
Resource Planning)
|
| |
「企業資源管理」と訳され、企業が扱う経営資源を一元的に管理する概念。その概念をソフトウェアにしたものがERPパッケージである。(7.3) |
|
ETLツール(Extract Transformation Loading)
|
| |
業務系システムからデータウェアハウスへのデータの転送(ロード)を、支援するツール。不正なデータに対する修正(データのクレンジング(浄化))、統合化、要約、導出データの計算、データ変換、ロードなどの機能を有する。(6.9) |
| EUC(EndUser
Computing)
|
|
エンドユーザコンピューティングといい、情報部門ではなく業務部門にいるユーザ自らが主体となってコンピュータ上のデータを分析し、業務の効率化や作業品質の向上を目指すこと。(2.3)
|
|
GIS(Geographic Information Sys-tem:地図情報システム)
|
| |
地図情報システムと呼び、地理的位置に関する情報をもったデータをグラフや数値にて、コンピュータ画面上の地図に重ね合わせて表示することができる機能を持つシステム。(1.7) |
|
KDD(Knowledge
Discovery in Databases:ベータベースによる知識発見)
|
| |
大規模なデータベースから有用な知識を発見すること。米国の人工知能学会から派生したKDD学会が使っている言葉。データマイニングとほぼ同じ意味を持つ言葉。(3.4) |
|
ODS(Operational
Data Store)
|
| |
「サブジェクト指向」「統合化」「揮発性」「現在または近現在のデータを収納」という特徴をもった業務システムのデータベース。ここで「揮発性」とは「恒常性」対する概念で、データが更新・変更される特性のことをいう。データウェアハウスとの大きな相違点はこの「揮発性」と「現在または近現在」の2点である。
ODSはデータウェアハウスにロードするソースデータを整理、統合するとともに、基幹業務処理系に統合された情報系処理の環境を提供する点で重要な役割を果たすデータベースである。(6.4) |
|
OLAP<オーラップ>(Online
Analytical Processing)
|
| |
オンライン分析処理。エンドユーザーが直接データベースを検索・集計することで、問題点を見つけ出し、その対策を講ずる分析型アプリケーションの総称。関係データモデルの提唱者でもあるコッド博士が、「OLAPに関する12のルール」を提唱した。(6.16) |
| OLAPサーバー
|
|
オンライン分析処理において、次元を即座に切り替えて多次元の検索要求をおこなうことを目的として構築されるデータベース。主にデータマートにおいて利用され、多次元データベースとも呼ばれる。(6.16)
|
|
OLAPツール
|
| |
オンライン分析処理を行うためのソフトウェア。スライス&ダイスやドリルダウン、グラフによる視覚化などの機能を有し、仮説検証型分析に用いられる。なお新たな仮説発見にはデータマイニングツールを用いる。
OLAPツールには、MOLAP(Multidemensional
OLAP多次元データベース型)やROLAP(Relational
OLAP 多次元ビュア型)などがある。
(4.3、6.16) |
|
OLTP(Online
Transaction Processing)
|
| |
オンライン・トランザクション処理。オンライン端末よりホストコンピュータのデータベースに直接アクセスする処理形態。銀行のATMなどに用いられている。なおトランザクションとは作業の単位。(3.2) |
|
PDCA
|
| |
→管理サイクル |
| POS<ポス>(Point
Of Sale:販売時点情報管理)
|
|
販売時点情報管理と呼び、販売時点でいろいろなデータを取得する仕組みをいう。小売業などでバーコードなどを活用し、自動読取方式のレジスターより販売された商品単品ごとの売上情報を収集する仕組み。(1.2)
|
|
RFM分析
|
| |
販売情報、顧客情報などから優良顧客を抽出する方法。顧客を直近購入日(Recently)、購入頻度(Frequency)、購入金額(Monetary
Value)の3つの視点毎にセグメント分けし、その組み合わせにより決定された顧客分類にしたがって適切な販売促進策を講じる。最近取引があり、度々、たくさん商品を購入してくれる顧客はランクが高い。(5.10) |
|
SQL(Structured
Query Language:構造化問合せ言語)
|
| |
2次元の行と列からなる関係データベースに対して、データの照会(SELECT)、挿入(INSERT)、削除(DELETE)、更新(UPDATE)などのデータ操作がおこなえるコンピュータ言語。(2.3) |
|
因子分析
|
| |
あるひとつの事象が発生した時に、どのような因子群がその事象を引き起こすのかを分析する手法。例えば、「売上増」となる為の要因として、「営業部員の増員」「販売促進活動」などが因子群として考えられる。 |
|
インモン
|
| |
ウイリアムH.インモン。データウェアハウスの提唱者。1990年にデータウェアハウスの概念と構築方法について具体的な方策を提言。その後もCIF(Corporate Information Factory)などの概念を発表するなど精力的な活動を行っている。データウェアハウスの父と呼ばれている。(3.1) |
|
回帰分析
|
| |
相関関係にある事象について、一定の関係式を適用し、数学的な数式で表現・分析する。例えば、子供の身長と親の身長との相関関係について、過去のデータから数式を算出することで、他の人の身長からその人の子供の身長を推定することができるようになる。ビジネスにおいては、需要予測などに用いられる。なお、関係式は複数の因子によって成り立つ場合には重回帰分析とよぶ。(4.5) |
| 関係データベース(リレーショナルデータベース)
|
|
1970年に米IBM社(当時)のコッド博士が提唱した関係データモデルに基づいたデータベース。二次元の表で表現され、表中の要素の論理的な結合によってデータの相互関係を表現する。行と列からの二次元の表に対して選択・射影・結合などのデータ操作を行うことができる。(2.4)
|
|
管理サイクル
|
| |
P(Plan計画)−D(Do実行)−C(Check点検)−A(Action修正行動)を繰り返すことで品質を高めてゆく管理手法。主としてQC(品質管理)活動にて用いられており、デミングのサイクルとも言われる。(2.8) |
|
業務系システム
|
| |
企業活動において、日常的に繰り返される販売・生産・購買・支払・物流など基幹的な業務処理をおこなう情報システム。事務処理の効率化、省力化、迅速化など「効率性の追求」が主なシステム目標となる。(2.5) |
|
クエリ(Query:問い合わせ、照会)
|
| |
データベースへ問い合わせて、必要なデータを抽出するプログラム。抽出したデータに対して更新や削除などの編集も行うことができる。GUI(グラフィックユーザーインターフェイス)ベースのものやSQL言語ベースのものがある。
(3.14、6.11、6.12、6.13、6.15) |
|
クラスター分析
|
| |
似ている個体あるいは変数をグループ化するための分析手法。クラスターとはcluster(群れ、かたまり)という意味で、事象を分析するために、種々の角度でグループ分けをする。(4.12) |
| 傾向動向分析
|
|
複数年度の数字から事象の傾向を把握する分析。時系列データ(年別、月別など)を、チャート(折れ線グラフ、棒グラフが効果的)やレポートにすることで傾向を把握する。
(4.4)
|
|
恒常性
|
| |
データウェアハウスに格納されたデータは値が更新されず、変更されることがない特性。「不揮発性(Non-volatile)」とも呼ばれる。インモンが主張するデータウェアハウス概念の四特性の一つ。(3.8) |
|
コールセンター
|
| |
顧客からの電話を一元的に受け付けるセンター。受注受付や消費者相談、苦情受付、ヘルプディスク業務などが行われている。CTI技術を活用して顧客サービスを向上している。(1.7) |
|
サブジェクト指向(Subject
oriented)
|
| |
業務機能や業務プロセスによってデータを区分するのではなく、企業での主要な管理対象となっている「顧客」・「製品(商品)」・「得意先」・「売上」などのように、テーマ別、活用目的別・用途別にデータを区分する考え方。インモンが主張するデータウェアハウス概念の四特性の一つ。(3.5) |
|
サマリーデータ
|
|
個々の取引や伝票の1行1行の詳細(生)データを集計したり、スナップショットをとったりして作成された要約データ。(3.11)
|
|
時系列性
|
| |
分析に必要なデータが長期間にわたって保存され、時間の推移による変化を捉えることができる特性。時間の要素をキー構造に持ち、顧客や売上などのサブジェクト(管理主体)の属性値を、時間をさかのぼって参照することができる。インモンが主張するデータウェアハウス概念の四特性の一つ。(3.7) |
|
次元テーブル(ディメンジョンテーブル)
|
| |
データウェアハウスにおけるテーブル構造であるスター・スキーマを「ファクトテーブル」とともに構成する。分析対象のファクトテーブルを取り囲むようにに位置し、時間・商品・店舗・顧客などの解析用の切り口を表現するテーブル。(3.13) |
|
情報系システム
|
| |
主として分析業務をサポートし、企業の様々な意思決定を支援するために構築される情報システム。戦略の策定、方針の設定、業務改善などにどれだけ寄与したかの「有効性の追求」が主なシステム目標となる。データウェアハウスは情報系システムの核と位置付けられる。(2.5) |
|
スタースキーマ
|
| |
R.キンボールの提唱したデータウェアハウスのモデル。ディメンジョナル・モデルとも言われる。中心にファクトテーブル、周辺に次元テーブルを配置した、スター(星)のような形態のモデル。なお次元テーブルが多段階になったものをスノーフレーク・スキーマという。(6.6) |
|
スナップショット
|
| |
あるタイミングで採取されたデータべースの写し。採取された時点の瞬間にデータベースに保存されていたデータの集合。(3.7) |
|
スノーフレーク・スキーマ
|
| |
スタースキーマの次元テーブルが多段階になったデータベースモデル。スタースキーマを正規化するとスノーフレーク化することがある。検索におけるパフォーマンスの関係から、むしろ非正規化して意図的に行う方法が取られている。(6.8) |
|
スライスアンドダイス(slice
and dice)
|
| |
多次元分析手法で、データをいろいろな角度から分析し問題点を抽出する。この機能はOLAPツールによりサポートされている。
スライスは、そのデータの一面を薄く切るような形で参照すること、ダイスは軸の組み合わせを変えて参照することをいう。そのイメージは「月別商品別売上推移表」を支店毎に見ることがスライス、それを軸を変えて「月別支店別売上推移表」として商品毎に見ることがダイスである。ドリルダウンと組み合わせることでより効果的な分析が可能となる。(4.6) |
|
正規化
|
| |
データ間の曖昧な関係をなくし、最適なデータ構造へと整理し導くこと。一定のルールのもとにテーブル間が連携され、システムが使い易い形にデータベース全体が整理される。第一正規化から第三正規形まで手順を踏んで行われる。(2.4) |
|
セントラル・データウェアハウス
|
| |
業務系システムなどから統合された形で生データが集結され、一元的に保管される全社的なデータ保管庫。ここから、部門単位で持つデータマートにデータが提供される。コーポレート・データウエハウスとも呼ばれる。(3.3) |
|
相関関係分析
|
| |
データ間の関係(関連度)を分析する統計的手法。データ間の関係(関連)の傾向や強弱度合いを数学的に相関係数で表現する。何が一緒に購買されるかの傾向を探るマーケットバスケット分析などに用いられている。(4.11) |
|
大福帳型データベース
|
| |
江戸時代の帳簿である大福帳に習い、伝票単位に発生するデータを要約せずに生のままで記録してゆくデータベース。生データをそのまま記録しておくことで、色々と切り口を変えながら企業活動を詳細に調べていくことができる。各種のERP
(Enterprise
Resource Planning)パッケージのデータベース概念として活用されている。(2.3) |
|
多次元分析
|
| |
複数次元の様々な角度からデータを見ることで傾向や問題点などを発見する分析方法。多次元とは、地区、時間、内容などの要素軸の次元と年、四半期、月などの集計度合いによる次元のことである。分析の方法としてスライスアンドダイス、ドリリングがある。(4.6) |
|
多次元データベース
|
| |
オンライン分析処理において、次元を即座に切り替えて多次元の検索要求をおこなうことを目的として構築されるデータベース。主にデータマートにおいて利用され、OLAPサーバーとも呼ばれる。(6.16) |
|
帳票
|
| |
出力プログラムが定期的に実行され、一定の形式でアウトプットされる集計表。従来は紙に出力されることが専らであったが、現在ではデジタルデータで渡される電子帳票もある。専用のプログラムによって出力されるため、出力内容を変えるためにはその都度プログラムの変更が必要。(2.7) |
|
データウェアハウジング
|
| |
データウェアハウスが意思決定のためのデータ倉庫という狭義を意味するとき、業務データを抽出・整理・蓄積し、分析して活用する活動全般とその考え方を総称して「データウェアハウジング」と呼び分ける。広義でのデータウェアハウス概念に含まれる。(3.4) |
|
データウェアハウス
|
| |
意思決定支援に最適化したデータベースで、分析に適した形で加工していない生のデータを長期間保持する。広義では、そのようなデータベースを核にした意思決定支援システムそのものや、システムの構築概念、それらを活用して企業価値を高めてゆく経営手法までを含む。(3.1) |
|
データマート
|
| |
ユーザが利用しやすいように、部門や地区別、使用目的別にセントラル・データウェアハウスからデータを小分けして整理しなおし別途作成されたデータベース。処理特性の異なる要求がデータウェアハウスに集中するのを避ける目的でも作成される。(3.9) |
|
データベース・マーケティング
|
| |
データベースに蓄積された購買情報や顧客属
性データなどから顧客ニーズを分析し、市場へ
アプローチしてゆくマーケティング手法。
大量に蓄積されたデータを活用できるというデ
ータベースの特性を活かしたマーケティング分
野でのデータウェアハウスの活用方法。(2.9) |
|
データマイニング(Data
Mining)
|
| |
今まで知られていなかった有効で、活用できる規則や法則などを、膨大な量のデータの集まりから発見する作業のこと。マイニングとはmining(採鉱)つまり鉱石・石炭などを採掘することを意味する語であるが、膨大なデータの集まりを鉱山、隠れた法則性などを鉱石とみたてて比喩的に用いられている。主な分析手法としては、クラスター分析、クラス判別、相関関係分析などがある。適用事例としてはマーケットバスケット分析などが有名。(4.9) |
|
テキストマイニング
|
| |
テキストデータをいろいろな角度・観点から分析し、有用な知識・情報を抽出する技術。膨大な量のテキスト文書からその相関関係や傾向などを分析し、戦略に活かせる知識・情報を取得する。(4.15) |
|
統計解析
|
| |
統計学のうち推測統計学を用いた解析のこと。推測統計学とはデータのサンプルから全体の傾向などを推測するものである。主なものとしては、相関分析、回帰分析などがあり、多変量解析も含まれる。(4.5) |
|
統合性
|
| |
本来同じであるべき業務データのフィールドを洗い出し、定義・意味・内容、コード化(値)、フィールド名、単位、計算法などを統一して企業レベルで一元管理することを目指した考え方。インモンが主張するデータウェアハウス概念の四特性の一つ。(3.6) |
|
ドリリング
|
| |
多次元分析手法で、OLAPが取り扱うデータの集計レベルを変更することをいう。この機能はOLAPツールによりサポートされている。
集計レベルとは集計の度合いのことで、期間を例にとると、年、四半期、月の順で集計レベルは低くなる。ドリルダウンとドリルアップがある。(4.7) |
|
ドリルダウン(ドリルアップ)
|
| |
ドリリングの方法で、ドリルダウンは集計レベルを下げること(例えば、四半期集計データから月集計データに移る)、ドリルアップは集計レベルをあげること(例えば、四半期集計データから年集計データに移る)をいう。(4.7) |
|
ナレッジ・マネジメント(Knowledge
Management)
|
| |
一人ひとりの持つ情報、知識、ノウウハウといった知識資産を共有化して企業の共有資産として蓄積し、最大限に活用することで相互の知力を高め企業価値を向上させていこうとする経営手法。知識や知的資産こそ企業成長の源泉という考え方にもとづく経営。データウェアハウスをはじめとした情報技術(IT)が活用される。
(3.4、8.7) |
|
名寄せ<なよせ>
|
| |
一人ひとりを特定して、散在する顧客データを一つの顧客マスターに整備しなおす作業。銀行では同一名義人の預金口座や負債を集約する。(1.3) |
|
ニューラルネットワーク
|
| |
設定学習によって作られるモデルをもとに、新しくグループを選別するのに優れたデータマイニング手法。人間の脳の情報処理をモデル化してつくられている。(4.10) |
|
ビジネスインテリジェンス(BI)
|
| |
企業の意思決定のために、社内外の「情報(インフォメーション)」を「組織的」「系統的」に収集・分析・加工して、有用な「知識(インテリジェンス)」を生み出して業務に役立てるビジネス活動全般を幅広く指す活動をあらわす。データウェアハウスの活用により支えられている。(1.8、7.2) |
|
ファクト
|
| |
調達・生産・在庫・物流・販売といった日々の業務を通じて行われる様々な業務上の事象や事柄。(3.6) |
|
ファクトテーブル
|
| |
データウェアハウスにおけるテーブル構造であるスター・スキーマを「次元テーブル」とともに構成する。スキーマの中央に位置し、分析対象となる大量のデータが保管されるテーブル。売上や在庫などが入る。分析条件となるデータを収めた次元テーブルとはキー項目により結合される。(3.13) |
|
不揮発性
|
| |
→恒常性 |
|
マーケットバスケット分析
|
| |
データマイニングの相関関係分析手法などを用い、買い物かご(Market
Basket)の中の商品が一緒に買われるグループを見つけ出すもの。店舗レイアウト、棚割りなどの参考として活用される。アメリカにおける分析結果として『夕方における「ビール」と「紙おむつ」』が有名。(4.11) |
|
メタデータ(meta-data)
|
| |
データの定義や説明、構造、出所や計算方法などが記載され、データ項目を解説するデータ。ユーザーがデータ収集や分析において、データを選択したり判断を下す際に参照する。(3.12、6.10) |
|
ラルフ・キンボール(人名)
|
| |
著書『データウェアハウス・ツールキット』において、多次元データベースを設計し構築するための実践手法を公開。その中でデータウェアハウス設計のためのスタースキーマというデータモデルを提唱している。(6.6、6.12) |
|
粒度<りゅうど>(グラニュラリティ)
|
| |
詳細データからサマリーデータに要約するときの要約レベル。粒の粗さという意味。要約レベルの高いデータは粒度が粗い、要約レベルの低いデータは粒度が細かいという。(3.11) |