雜湊表（Hash Table）& 字典樹（Trie）的程式碼和補充 Malloc 用法

2024/11/06 更新2024/11/03 發佈閱讀 13 分鐘

圖片來源和參考內容：Hash Tables and Hash Functions

想像一下，如果要在一個陣列中找出「Mia」，是否需要逐一檢查每個項目？有沒有更快的方法？

雜湊函數（Hash function）

雜湊函數（Hash function）就像是一台「資料壓縮機」，它把任意長度的資料壓縮成特定範圍的數值，稱為「雜湊值」。想像一下，有一大串名字要放進抽屜裡，為了不必每次翻箱倒櫃地找，雜湊函數就像一個貼標籤的助手。它會按照某種規則，給每個名字分配一個特定抽屜號碼，比如「Mia」可能會分到抽屜 8 號，「Sam」分到 4 號。

當我們想找某個名字時，只需照著這個編號打開對應的抽屜即可。但有時候，兩個不同名字會分到同一個抽屜，這就叫「衝突」。為解決衝突，可能會用指標將兩個名字串在一起，或是換個抽屜放置。這種方法讓雜湊表的搜尋效率高，即便資料量大，仍能迅速找到所需內容

雜湊表使用在通訊錄

假設我們要建立一個通訊錄，可以用 hash table（雜湊表）來存取人名，並利用字母的開頭來快速找到對應的位置。例如，我們可以建立一個包含 26 個索引值的 hash table。

如何知道該索引值呢？以 Mia 為例，假設 Mia 的位置是 8。這是如何計算出來的呢？

先將每個字母轉為 ASCII 值。
再用該值除以陣列大小（在這例子中為 11），取餘數作為索引位置，因此 Mia 的索引值是 4。

截圖至參考影片

在這樣的表格中記錄資料索引值，便能方便找到每個人名。但這樣的設計也可能會遇到「衝突」（collision）的問題。例如，如果 Mia 和 Rae 的餘數都是 4，則 Rae 只能向後移動，導致查找 Rae 時需要進行線性搜尋。

為了解決這個問題，可以使用指標（pointer）或「鏈結串列」來連接同一個位置的多個元素。當衝突發生時，會將新元素放到這個位置的鏈結串列中，並透過指標指向。這樣一來，我們可以在每個索引值的基礎上儲存多個元素，而不用重新排列整個表格，提升了搜尋效率。

例如下圖，Mia 跟 Sue 都的值都是 4 ，所以他們會放在同一列並用指標連結。

字典樹（Trie）

另外，另一種資料結構——字典樹（Trie）——可以用來更直觀地儲存和搜尋文字。Trie 將每個字的字母作為節點，形成一個多層的分支結構，方便快速搜尋。例如，若有「Mia」和「Max」，這兩個名字會共享相同的前綴字母「M」，然後各自分支到不同的子節點「i」和「a」。

當名字清單更多時，也可以設計「Mi」或是「Ma」「Mo」為單位搜尋取代先搜尋M再往下搜尋第二個字母，時間複雜度變低，速度變快，但是所佔用的空間就會多。

這種結構特別適合用於自動完成功能或搜尋大規模字詞資料，因為它可以避免重複存儲字母，同時提高搜尋效率。

程式碼演練：Leetcode 題目

其實，我是有問ChatGPT malloc 怎麼寫，當然google也可以

我前面這篇文章提到的，實在是太淺了... 寫了一個小時才生出來...

C 語言指標－程式碼圖解

https://leetcode.com/problems/two-sum

題目是給你目標值，請從陣列當中回傳兩個相加等於目標值的位置

Given an array of integers nums and an integer target, return indices of the two numbers such that they add up to target.

You may assume that each input would have exactly one solution, and you may not use the same element twice.

Input: nums = [2,7,11,15], target = 9
Output: [0,1]
Explanation: Because nums[0] + nums[1] == 9, we return [0, 1].

這是 Leetcode 上被評為簡單的題目，但是用 C 語言寫需要malloc記憶體，我完全卡再 malloc 的用法。

/**
 * Note: The returned array must be malloced, assume caller calls free().
 */
int* twoSum(int* nums, int numsSize, int target, int* returnSize) {// leetcode已寫好這行
    for (int i = 0; i < numsSize; i++) {
        for (int j = i + 1; j < numsSize; j++) { 
            if (nums[i] + nums[j] == target) { 
                int* result = (int*)malloc(2 * sizeof(int)); 
                result[0] = i;
                result[1] = j;
                *returnSize = 2; 
                return result;
            }
        }
    }
    *returnSize = 0; 
    return NULL;
}

讓我來解釋，

int* result = (int*)malloc(2 * sizeof(int));

基本概念是要新增兩個整數的空間，拆成兩階段來看：

sizeof(int)：這個函式會回傳一個整數的位元組大小。在大多數系統中，int 佔用 4 個位元組（Bytes），所以 sizeof(int) 通常是 4。
2 * sizeof(int)：表示分配一段空間，大小為兩個整數所需的空間（在大多數系統上就是 8 個位元組）。這樣我們就能在這段記憶體中存放兩個整數（即我們找到的兩個索引）。例［0,1］
通常建立的記憶體儲存空間沒有指定資料型別，所以我這裡使用 (int*) 將 void* 轉型為 int*，表示這段記憶體是一組整數。result[0] 和 result[1] 存取這兩個整數位置，也就是 twoSum 找到的兩個索引。

用雜湊表使時間複雜度變 O(n)

這裡我有偷看答案怎麼建立 hash table XD，因為 C 語言寫雜湊表對我來說太難了，所以我用 Python 來解釋，著重在介紹概念。

class Solution:
    def twoSum(self, nums: List[int], target: int) -> List[int]:#這行程式已經內建好了　
        hashmap = {}
        for i in range(len(nums)): 
            hashmap[nums[i]] = i
        for i in range(len(nums)):
            complement = target - nums[i] #complement是代表互補值的變數，後面可以直接拿來查表
            if complement in hashmap and hashmap[complement] != i:
                return [i, hashmap[complement]]
        # If no valid pair is found, return an empty list
        return []

hashmap = {}

這行才是真正建立一個空的 hash table（即 hashmap）。

for i in range(len(nums)):

		hashmap[nums[i]] = i

這裡的 for 迴圈只負責將 nums 中的每個數字及其索引全部存入 hashmap 中。在這個迴圈完成後，hashmap 會包含 nums 中所有數字及其對應的索引。

第二個回圈是開始檢查互補值是否存在於 hashmap 中。

第二個 for 迴圈會重新遍歷 nums，然後計算每個數字的 complement。它會檢查兩件事：

complement 是否存在於 hashmap 中。
hashmap[complement] != i（即 complement 的索引不能和當前數字的索引相同，不可以自己相加）。

運作範例

第一步：第一個 `for` 迴圈（建立 `hashmap`）

i = 0，nums[i] = 2
- hashmap[2] = 0，此時 hashmap 為 {2: 0}
i = 1，nums[i] = 7
- hashmap[7] = 1，此時 hashmap 為 {2: 0, 7: 1}
i = 2，nums[i] = 11
- hashmap[11] = 2，此時 hashmap 為 {2: 0, 7: 1, 11: 2}
i = 3，nums[i] = 15
- hashmap[15] = 3，此時 hashmap 為 {2: 0, 7: 1, 11: 2, 15: 3}

到此為止，我們完成了 hashmap 的建立，hashmap 已經包含了 nums 陣列中每個數字的索引。_{(這段我請 ChatGPT 幫忙寫)}

第二步：第二個 `for` 迴圈（查找符合條件的 `complement`）

i = 0，nums[i] = 2
- complement = target - nums[i] = 9 - 2 = 7
- 7 在 hashmap 中，且 hashmap[7] != 0（7 的索引為 1，不是 0），滿足條件
- 找到答案：return [0, 1]

最後結果

此時返回 [0, 1]，即 nums 中索引為 0 和 1 的兩個數字 2 和 7 加起來等於 9，符合題目要求。

更快的方式：一次迴圈解決

^{（因方格子介面問題，註解的部分沒有反灰）}

class Solution:
    def twoSum(self, nums: List[int], target: int) -> List[int]: 
        hashmap = {}
        for i in range(len(nums)):
            complement = target - nums[i]
            if complement in hashmap:
                return [i, hashmap[complement]]
            hashmap[nums[i]] = i
        # Return an empty list if no solution is found
        return []

運作範例

假設 nums = [2, 7, 11, 15] 且 target = 9，這段程式碼的執行步驟如下：

第一次迴圈 (i = 0，nums[i] = 2)：
- complement = 9 - 2 = 7
- 7 不在 hashmap 中，因此將 2 和它的索引 0 加入 hashmap：{2: 0}
第二次迴圈 (i = 1，nums[i] = 7)：
- complement = 9 - 7 = 2
- 2 在 hashmap 中，表示 2 和 7 可以組成一組和為 9 的數字對。
- 返回 [1, hashmap[2]]，即 [1, 0]。

留言

越南放大鏡 X 下班資工系

63會員

110內容數

雙重身份：越南放大鏡 X 下班資工系政大東南亞語言學系是我接觸越南語的起點，畢業後找越南外派工作的生活跟資訊時，發現幾乎都是清單式的分享，很難身歷其境。所以我希望「越南放大鏡」可以帶讀者看到更多細節和深入的觀察。 - 下班資工系則是自學資工系的課程內容，記錄實際操作的過程，學習理論的過程。希望可以跟讀者一起成長。

越南放大鏡 X 下班資工系的其他內容

2025/04/24

JS 系列 0_JavaScript 新手入門教學：從基礎語法到 React 應用

本系列文章將循序漸進地介紹 JavaScript 的核心概念，從基礎語法到進階應用，例如非同步程式設計和 React 基礎。內容淺顯易懂，並使用生活化的比喻幫助讀者理解，搭配程式碼範例，適合 JavaScript 初學者學習。

2025/04/24

JS 系列 0_JavaScript 新手入門教學：從基礎語法到 React 應用

2025/04/21

網路學習筆記 -02 行動通訊網路演進：從1G到5G，以及ITU與3GPP的角色

本文介紹行動通訊網路的演進歷史，從1G到5G，並說明ITU與3GPP在制定通訊規格上的重要角色，以及5G的三大關鍵應用場景：URLLC、eMBB和mMTC。

2025/04/21

網路學習筆記 -02 行動通訊網路演進：從1G到5G，以及ITU與3GPP的角色

本文介紹行動通訊網路的演進歷史，從1G到5G，並說明ITU與3GPP在制定通訊規格上的重要角色，以及5G的三大關鍵應用場景：URLLC、eMBB和mMTC。

2025/04/11

網路通訊筆記 01：從OSI模型到WebSocket即時通訊

這篇文章說明網路的七層模型、IP 位址、通訊埠、TCP/UDP 協定、HTTP 協定、HTTP 狀態碼以及 WebSocket，並解釋它們之間的關係與互動方式。文中包含許多圖表和範例，幫助讀者理解這些網路概念。

2025/04/11

網路通訊筆記 01：從OSI模型到WebSocket即時通訊

看更多

你可能也想看

小松鼠的演算法樂園

經典實作題 Design HashSet 實作集合 Leetcode #705

題目會給定一組已經規定好的介面interface，要求我們實作HashSet這種資料結構。也就是一般數學和程式語言中所說的"集合"。

#set#hashset#集合

2023/10/04

小松鼠的演算法樂園

經典實作題 Design HashSet 實作集合 Leetcode #705

題目會給定一組已經規定好的介面interface，要求我們實作HashSet這種資料結構。也就是一般數學和程式語言中所說的"集合"。

#set#hashset#集合

2023/10/04

橙果杏的沙龍

【基礎級】－[陣列]-運用

陣列運用、擷取字串　　對於陣列裡的內容值除了把資料存進去外，若想要知道陣列維度、陣列大小、複製陣列的值到另一個陣列中、清除陣列的值等等的相關處理，甚至比較常用到的可能還需要做資料排列、查找資料等等，此時C#有一些屬性方法可以幫助到我們，不用寫複雜的迴圈，來看一看有哪些吧～

2023/04/10

2023/04/10

　　陣列(Array)是什麼？它是一個很好用的東西哦！當我們要處理100個學生的成績的時候，如果沒有陣列的話，那麼我們的變數就要命名100個不同的變數，這樣的程式雖然不是不能執行，想一想，是不是有一點要在命名上會想破頭殼呢？因為要想100個不同的變數麻～　　你說：「那就變數後面加入編號就好啦～如

2023/04/05

2023/04/05

389. Find the Difference (找不同)

班上闖來了一個陌生人！該如何快狠準揪出他？這道經典考題的解法，遠比你想的還要多種 ......

#leetcode#刷題#筆記

2023/10/02

LeetCode King

389. Find the Difference (找不同)

班上闖來了一個陌生人！該如何快狠準揪出他？這道經典考題的解法，遠比你想的還要多種 ......

#leetcode#刷題#筆記

2023/10/02

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

小松鼠的演算法樂園

物以類聚尋找共同的字元_字典應用_Leetcode #1002

給定一個字串陣列，請把它們所共有的字元伴隨著出現次數輸出。這篇文章介紹如何使用字典統計出現次數，和字典取交集的方法來解決此問題。並提供了複雜度分析和關鍵知識點。

#python#leetcode#algorithm

2024/06/05

小松鼠的演算法樂園

物以類聚尋找共同的字元_字典應用_Leetcode #1002

#python#leetcode#algorithm

2024/06/05

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼，反而利用華麗的秀場視覺，引導觀眾在晚期資本主義的消費愉悅之中，而能驚覺「批判」本身亦可能被收編——而當絞繩升起，這場關於如何生存的黑色遊戲，又將帶領新時代的我們走向何種後現代的自我解構？

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

一代軍師

玩轉C#之【數據結構】

Array 在記憶體中連續分配，而且元素類型是一樣的，長度不變優點:讀取快，可以使用座標訪問缺點:新增、刪除慢記憶體： 📷 範例程式碼： ArrayList 不定長度，在記憶體中連續分配的，元素沒有類型限制，任何元素都是當成object處理，如果是值類型，會有裝箱的操作優點:讀取快缺點:

2022/09/18

2022/09/18

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28