天天看點

資料庫必知詞彙:OLAP

聯機分析處理(Online Analytical Processing, OLAP)是一種軟體技術,它使分析人員能夠迅速、一緻、互動地從各個方面觀察資訊,以達到深入了解資料的目的。OLAP有的時候也叫DSS決策支援系統,就是我們說的資料倉庫。在這樣的系統中,語句的執行量不是考核标準,因為一條語句的執行時間可能會非常長,讀取的資料也非常多。是以,在這樣的系統中,考核的标準往往是磁盤子系統的吞吐量(帶寬),如能達到多少MB/s的流量。

OLAP具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多元資訊的快速分析的特征。其中F是快速性(Fast),指系統能在數秒内對使用者的多數分析要求做出反應;A是可分析性(Analysis),指使用者無需程式設計就可以定義新的專門計算,将其作為分析的一部分,并以使用者所希望的方式給出報告;M是多元性(Multi—dimensional),指提供對資料分析的多元視圖和分析;I是資訊性(Information),指能及時獲得資訊,并且管理大容量資訊。

OLAP是以資料倉庫為基礎的,其最終資料來源與OLTP一樣均來自底層的資料庫系統,但由于二者面對的使用者不同,OLTP面對的是操作人員和低層管理人員,OLAP面員和高層管理人員。OLAP是使分析人員、管理人員或執行人員能夠從多角度對資訊進行快速、一緻、互動地存取,進而獲得對資料的更深入了解的一類軟體技術。OLAP的目标是滿足決策支援或者滿足在多元環境下特定的查詢和報表需求,它的技術核心是"維"這個概念。

“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分。“維”一般包含着層次關系,這種層次關系有時會相當複雜。通過把一個實體的多項重要的屬性定義為多個維(dimension),使使用者能對不同維上的資料進行比較。是以OLAP也可以說是多元資料分析工具的集合。

OLAP展現在使用者面前的是一幅幅多元視圖。其中維(Dimension)是人們觀察資料的特定角度,是考慮問題時的一類屬性,屬性集合構成一個維(時間維、地理維等)。維的層次(Level)是人們觀察資料的某個特定角度(即某個維)還可以存在細節程度不同的各個描述方面(時間維:日期、月份、季度、年)。維的成員(Member)是維的一個取值,是資料項在某維中位置的描述。(“某年某月某日”是在時間維上位置的描述)。度量(Measure)是多元數組的取值。

OLAP的基本多元分析操作有鑽取(Drill-up和Drill-down)、切片(Slice)和切塊(Dice)、以及旋轉(Pivot)等,具體解釋如下:

  • 鑽取:是改變維的層次,變換分析的粒度。它包括向下鑽取(Drill-down)和向上鑽取(Drill-up)/上卷(Roll-up)。Drill-up是在某一維上将低層次的細節資料概括到高層次的彙總資料,或者減少維數;而Drill-down則相反,它從彙總資料深入到細節資料進行觀察或增加新維。
  • 切片和切塊:是在一部分維上標明值後,關心度量資料在剩餘維上的分布。如果剩餘的維隻有兩個,則是切片;如果有三個或以上,則是切塊。
  • 旋轉:是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。

資料來源:

聯機分析處理 (OLAP) 概述

https://support.office.com/zh-cn/article/%E8%81%94%E6%9C%BA%E5%88%86%E6%9E%90%E5%A4%84%E7%90%86-OLAP-%E6%A6%82%E8%BF%B0-15d2cdde-f70b-4277-b009-ed732b75fdd6

韓培友,董桂雲,柳虹編著.資料庫技術:西北工業大學出版社,2008.12

廖開際主編.資料倉庫與資料挖掘:北京大學出版社,2008.11

王超等編著.人工智能技術及其軍事應用:國防工業出版社,2016.01