資料結構：索引（Index）

2024/11/26 更新2024/11/26 發佈閱讀 5 分鐘

^{本篇是自學筆記，若有錯誤拜託要跟我說!}

索引其實是一種資料結構（Data structure），但我們摸不到。索引類似於書的目錄，是用來加速資料庫查詢的結構。索引會建立指標（Pointer）指向資料所在的物理位置，避免逐行掃描整個資料表（Full Table Scan )，提高查詢效率。

索引的基本原理：

- 索引條目包含了 Key 和指標（Pointer）。
- 指標指向資料所在的 Block。
- 索引和資料（Data File）通常分別存放，資料庫系統會根據索引快速找到對應的資料。

索引類型

Primary Index（主索引）

- 定義：用 Primary Key 建立的索引，Primary Key 保證唯一性，索引條目和資料行一對一對應。
- 特點：Primary Index 和資料是物理排序一致的。每個資料表只能有一個 Primary Index。
- 比喻：書的主要目錄，對應每一頁的具體位置。如下圖每個 Pointer 會指向區塊，當我想到 1002 就進入 1001 跟 1005 中間搜尋即可。

資料來源：Primary Indexing in Databases　

Primary Index 的兩個類型

Dense Index（密集索引）
- 定義：為資料表中每一筆資料都建立索引條目。
- 特點：索引條目完整覆蓋整個資料表。適合小型資料表，但隨資料量增長索引也會膨脹。
- 比喻：書中每一章、每一節都列入目錄。
Sparse Index（稀疏索引）
- 定義：只為部分資料建立索引條目，通常是分區點（例如每隔幾頁建立一條）。
- 特點：減少索引條目數量，適合排序好的大資料表。
- 比喻：書中只為重要章節（如第 1、5、10 章）建立目錄。

Secondary Index

用來補充 Primary Index 的不足。

- 定義：為非 Primary Key 的欄位（如 Foreign Key、頻繁查詢的欄位）建立的索引。
- 特點：Secondary Index 不改變資料的物理排序。刪除不影響
- 比喻：類似一本書的副目錄，可以按照不同分類快速定位內容。像是單字書可以用 A-Z 建索引，也有副目錄以大考出現頻率或是主題建索引。

索引結構：B-Tree　有索引就可以用二元搜尋的方式查找

索引通常以 B-Tree 或 B+Tree 資料結構運作：

理解進階資料結構（一）：B樹｜B+樹

Clustered Index v.s. Non-clustered Index

Clustered Index（叢索引）
- 定義：資料表的資料會根據索引的 Key 順序排列，索引條目和資料是一體的。
- 特點：每個資料表只能有一個 Clustered Index。適合範圍查詢，但插入/刪除效率較低。
- 比喻：書的目錄和內容緊密排列在一起。索引照1~10排，實體的資料也是1~10。
Non-clustered Index（非叢索引）
- 定義：索引條目和資料分離，索引只包含指向資料的指標。
- 特點：一個表可以有多個 Non-clustered Index。適合隨機查詢，但範圍查詢效率較低。
- 比喻：書的目錄和內容分開，目錄指向書櫃中的具體書籍位置。例如：「主題：人工智慧，對應到第 50 頁」。你需要找到索引知道頁碼，然後去翻到書的第 50 頁找到內容。
- 適合精確的搜尋，例如找到特定的名字

如果 ID 是 Clustered Index：

資料在硬碟上的存放順序會按照 ID 排列，例如：
- 第一筆資料存放 Alice（ID=1）。
- 第二筆資料存放 Bob（ID=2）。
- 物理存放順序就是 1 → 2 → 3 → 4。

如果建立一個按「部門」的 Non-clustered Index：

索引會是這樣的結構：
- IT → 指向 Alice 和 Cindy 的位置。
- HR → 指向 Bob 的位置。
- Finance → 指向 Dave 的位置。
但資料實際的存放順序並不改變，依然是按 ID 排列 1 → 2 → 3 → 4。

總結

索引提高查詢效率，但可能帶來維護成本（如插入、更新資料時需要同步更新索引）。
索引設計要點：
- Primary Index 用於關鍵性查詢。
- Secondary Index 提供額外的靈活性。
- 根據需求選擇 Dense 或 Sparse Index。
- Clustered 索引適合範圍查詢，Non-clustered 索引適合多條件查詢。

留言

越南放大鏡 X 下班資工系

63會員

109內容數

雙重身份：越南放大鏡 X 下班資工系政大東南亞語言學系是我接觸越南語的起點，畢業後找越南外派工作的生活跟資訊時，發現幾乎都是清單式的分享，很難身歷其境。所以我希望「越南放大鏡」可以帶讀者看到更多細節和深入的觀察。 - 下班資工系則是自學資工系的課程內容，記錄實際操作的過程，學習理論的過程。希望可以跟讀者一起成長。

越南放大鏡 X 下班資工系的其他內容

2025/04/24

JS 系列 0_JavaScript 新手入門教學：從基礎語法到 React 應用

本系列文章將循序漸進地介紹 JavaScript 的核心概念，從基礎語法到進階應用，例如非同步程式設計和 React 基礎。內容淺顯易懂，並使用生活化的比喻幫助讀者理解，搭配程式碼範例，適合 JavaScript 初學者學習。

2025/04/24

JS 系列 0_JavaScript 新手入門教學：從基礎語法到 React 應用

2025/04/21

網路學習筆記 -02 行動通訊網路演進：從1G到5G，以及ITU與3GPP的角色

本文介紹行動通訊網路的演進歷史，從1G到5G，並說明ITU與3GPP在制定通訊規格上的重要角色，以及5G的三大關鍵應用場景：URLLC、eMBB和mMTC。

2025/04/21

網路學習筆記 -02 行動通訊網路演進：從1G到5G，以及ITU與3GPP的角色

本文介紹行動通訊網路的演進歷史，從1G到5G，並說明ITU與3GPP在制定通訊規格上的重要角色，以及5G的三大關鍵應用場景：URLLC、eMBB和mMTC。

2025/04/11

網路通訊筆記 01：從OSI模型到WebSocket即時通訊

這篇文章說明網路的七層模型、IP 位址、通訊埠、TCP/UDP 協定、HTTP 協定、HTTP 狀態碼以及 WebSocket，並解釋它們之間的關係與互動方式。文中包含許多圖表和範例，幫助讀者理解這些網路概念。

2025/04/11

網路通訊筆記 01：從OSI模型到WebSocket即時通訊

看更多

你可能也想看

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11