OLTP:
線上交易處理(Online transaction processing)。OLTP是一種資料處理系統,主要設計用於處理大量即時、頻繁、且小規模的資料交易。這類系統是企業日常營運的基礎,例如銀行交易、超商結帳、訂單處理等。
特性:高頻率操作,處理大量且頻繁的交易操作(新增、修改、刪除);即時性高,必須快速反應,用戶能即時查詢與執行操作;資料一致性強,通常使用資料庫交易(ACID 原則)來確保資料一致與完整性;資料量小但頻繁,每次操作涉及的資料量不大,但操作次數多;標準化設計,資料表設計通常高度正規化,以減少重複與增加查詢效率。OLAP:
線上分析處理(Online analytical processing)。OLAP讓使用者能夠從多個角度互動地分析多維資料,包括:上卷(roll-up)、鑽取(drill-down)、切片(slicing)和切塊(dicing)。
- 上卷可以在一個或多個維度中累積和計算的資料的聚合。例如,所有的銷售辦事處匯總到銷售部門,以預測銷售趨勢。
- 鑽取是一種允許使用者瀏覽詳細資訊的技術。例如,使用者可以檢視組成一個地區銷售額的單個產品的銷售額。
- 切片是從多維資料集中固定某一個維度的特定值,取得一個低一維度的子集。假設一個三維OLAP立方體,選擇2024年這個特定時間維度進行切片,就會從三維立方體中擷取出一個二維的資料表。
- 切塊是對多維資料進行多個維度的範圍選取,形成一個較小但仍保持多維的子立方體。假設一個三維OLAP立方體,想要分析2023年到2024年、地區為北部和中部、產品類別為電子產品的資料,切塊取出結果就是三維子立方體。
OLAP系統的核心是一個OLAP多維資料集,通常是從關聯式資料庫中的表的星型模式或雪花型模式中建立的。
標籤(Label)、維度(Dimension)、以及度量(Measure),這三個元素構成了OLAP分析的基礎架構。
- 維度是用來切割、分類資料的角度或分類依據。它們是分析數據時的觀察點或切面。常見的維度(上例)例如時間、地區、產品類別。
- 度量是指可以被計算、加總、平均等數值化的資料,是分析的核心數據。例如若要查看2024年第一季在北部地區的總銷售金額,度量就是銷售金額。
- 標籤是用來描述維度或度量的名稱或分類項目,通常是用來輔助理解資料內容。例如時間維度下的標籤:2023-Q1、2023-Q2;地區維度下的標籤:北部、南部;產品類別維度下的標籤:電子產品、家電。
OLAP通常與OLTP(線上交易處理)形成對比,OLTP的特點是查詢的複雜性要小得多,而且查詢量要大得多,以處理事務,而不是像OLAP用於商業智慧型或報告。OLAP系統主要針對讀取進行最佳化,而OLTP得能處理各種查詢(讀取、插入、更新和刪除)。
參考
小結
大家好久不見!之前是因為一頭栽入AI的世界,沒時間發文;最近是因為換工作忙著面試,沒時間發文(藉口一堆XD)。接下來會因為工作上需要查詢研讀資料,將找到的結果(其實也只是查維基和問ChatGPT而已XD)紀錄成文章,大家看看笑笑就好,希望大家一切安好。:)