郝信華 iPAS AI應用規劃師學習筆記

二進制編碼（Binary Encoding）

iPAS AI應用規劃師學習筆記

發佈於數據準備與模型選擇

更新於 2025/09/11發佈於 2025/09/04閱讀時間約 2 分鐘

Binary Encoding是一種用於機器學習中分類變數編碼的技術，它先將每個類別標籤轉換為整數，然後將這些整數轉換成二進位（binary）數字，最後將二進位的每一位拆分成獨立的欄位。例如，有8個類別時，普通的One-Hot Encoding需要8欄位，而Binary Encoding只需3欄，因為2^3=8，大幅減少維度，節省空間且避免資料稀疏。

這種方法適用於高基數（high cardinality）分類變數，能減輕One-Hot Encoding帶來的維度爆炸問題，同時克服Label Encoding可能導致的虛假序列關係。Binary Encoding既保留了類別的獨特性，也提升了編碼緊湊度，對樹模型等常見機器學習模型表現良好。

缺點是轉換後的數據可讀性較差，且部分模型（如線性模型）可能無法有效利用二進位分割特性。Python中通常使用category_encoders套件實現Binary Encoding。

總結：

先使用Label Encoding將類別轉為整數。將整數轉為二進位表示。將二進位的每一位拆分成獨立欄位。特別適合高基數類別變數，維度縮減明顯。

含 AI 應用內容

#數據準備與模型選擇

郝信華 iPAS AI應用規劃師學習筆記數據準備與模型選擇

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

19會員

489內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/09/04

標籤編碼（Label Encoding）

Label Encoding是機器學習中用來將非數值型的類別資料（categorical data）轉換成數值型資料的一種基本技術。它的原理是將每個類別標籤映射成一個獨特的整數值，使得機器學習算法能夠處理這些資料。例如，顏色"red"、"blue"、"green"可分別映射成0、1、2。 Labe

2025/09/04

標籤編碼（Label Encoding）

Label Encoding是機器學習中用來將非數值型的類別資料（categorical data）轉換成數值型資料的一種基本技術。它的原理是將每個類別標籤映射成一個獨特的整數值，使得機器學習算法能夠處理這些資料。例如，顏色"red"、"blue"、"green"可分別映射成0、1、2。 Labe

2025/09/04

Z-Score（標準分數）

Z-Score（標準分數）是衡量一個觀察值距離整體平均值多少個標準差的指標。其基本計算公式為：其中，X 是原始數據值，μ 是母體或樣本平均值，σ 是母體或樣本標準差。透過此計算，可以知道該數值高於或低於平均數多少個標準差。例如，Z分數為1表示該數值高於平均值一個標準差，為-1表示低於平均值一個標

2025/09/04

Z-Score（標準分數）

Z-Score（標準分數）是衡量一個觀察值距離整體平均值多少個標準差的指標。其基本計算公式為：其中，X 是原始數據值，μ 是母體或樣本平均值，σ 是母體或樣本標準差。透過此計算，可以知道該數值高於或低於平均數多少個標準差。例如，Z分數為1表示該數值高於平均值一個標準差，為-1表示低於平均值一個標

2025/09/03

Hashing Encoding （雜湊編號）又稱 Feature Hashing（特徵哈希）

Feature Hashing（特徵哈希）又稱為哈希技巧（Hashing Trick），是一種用於將大量、尤其是類別型或文本特徵快速且節省記憶體地轉換為固定長度數值向量的方法。 Feature Hashing的原理： • 對每個特徵名稱或特徵值應用哈希函數，將其映射為一個固定維度向量中的索引位

2025/09/03

Hashing Encoding （雜湊編號）又稱 Feature Hashing（特徵哈希）

Feature Hashing（特徵哈希）又稱為哈希技巧（Hashing Trick），是一種用於將大量、尤其是類別型或文本特徵快速且節省記憶體地轉換為固定長度數值向量的方法。 Feature Hashing的原理： • 對每個特徵名稱或特徵值應用哈希函數，將其映射為一個固定維度向量中的索引位

你可能也想看

Emma 的意識界。

輕鬆賺零用金的祕密 | 蝦皮分潤計畫賺零用金實測成果開箱＋近期敗家好物開箱 😁

透過蝦皮分潤計畫，輕鬆賺取零用金！本文分享5-6月實測心得，包含數據流程、實際收入、平臺優點及注意事項，並推薦高分潤商品，教你如何運用空閒時間創造被動收入。

#蝦皮#行動電源#測試

2025/09/07

Emma 的意識界。

輕鬆賺零用金的祕密 | 蝦皮分潤計畫賺零用金實測成果開箱＋近期敗家好物開箱 😁

透過蝦皮分潤計畫，輕鬆賺取零用金！本文分享5-6月實測心得，包含數據流程、實際收入、平臺優點及注意事項，並推薦高分潤商品，教你如何運用空閒時間創造被動收入。

#蝦皮#行動電源#測試

2025/09/07

好好宅在家

【單身實驗室．蝦皮分潤計畫】藏身蝦皮的植系青屬，為我的北向陽台增添家人。

單身的人有些會養寵物，而我養植物。畢竟寵物離世會傷心，植物沒養好再接再厲就好了~（笑）

#開箱#蝦皮分潤計畫#單身實驗室

2025/09/12

好好宅在家

【單身實驗室．蝦皮分潤計畫】藏身蝦皮的植系青屬，為我的北向陽台增添家人。

單身的人有些會養寵物，而我養植物。畢竟寵物離世會傷心，植物沒養好再接再厲就好了~（笑）

#開箱#蝦皮分潤計畫#單身實驗室

2025/09/12

翰墨飄香的沙龍

補貨小日常｜居家生活用品實測分享，還順便開啟蝦皮分潤計畫小驚喜！

不知你有沒有過這種經驗？衛生紙只剩最後一包、洗衣精倒不出來，或電池突然沒電。這次一次補貨，從電池、衛生紙到洗衣精，還順便分享使用心得。更棒的是，搭配蝦皮分潤計畫，愛用品不僅自己用得安心，分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E，輕鬆上手，隨時隨地賺取分潤！

#衛生紙#洗衣精#居家生活

2025/09/10

翰墨飄香的沙龍

補貨小日常｜居家生活用品實測分享，還順便開啟蝦皮分潤計畫小驚喜！

不知你有沒有過這種經驗？衛生紙只剩最後一包、洗衣精倒不出來，或電池突然沒電。這次一次補貨，從電池、衛生紙到洗衣精，還順便分享使用心得。更棒的是，搭配蝦皮分潤計畫，愛用品不僅自己用得安心，分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E，輕鬆上手，隨時隨地賺取分潤！

#衛生紙#洗衣精#居家生活

2025/09/10

阿Mo的murmur小天地🪄

開箱＋分潤分享｜社畜的療癒小樹洞 🧑‍🎨 iPad 殼 × 蝦皮分潤計畫

身為一個典型的社畜，上班時間被會議、進度、KPI 塞得滿滿，下班後只想要找一個能夠安靜喘口氣的小角落。對我來說，畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉，還是慢慢描繪喜歡的插畫人物，那個專注在筆觸和色彩的過程，就像在幫心靈按摩一樣，讓緊繃的神經慢慢鬆開。

#小確幸#iPad#樹洞

2025/09/10

阿Mo的murmur小天地🪄

開箱＋分潤分享｜社畜的療癒小樹洞 🧑‍🎨 iPad 殼 × 蝦皮分潤計畫

身為一個典型的社畜，上班時間被會議、進度、KPI 塞得滿滿，下班後只想要找一個能夠安靜喘口氣的小角落。對我來說，畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉，還是慢慢描繪喜歡的插畫人物，那個專注在筆觸和色彩的過程，就像在幫心靈按摩一樣，讓緊繃的神經慢慢鬆開。

#小確幸#iPad#樹洞

2025/09/10

🍋🗻檸檬富士山

質性研究要「編碼」？│研究入門：編碼是什麼🤔

「蛤！？到底什麼是編碼？網路上都查不到一個簡單的定義！」剛進研究室的你，被教授指派了許多任務，其中一件是要把質性資料給「編碼」，你是不是也像我一樣霧煞煞QQ 快點進來看看，我幫你統整了一篇簡單易懂的說明，讓你快速了解編碼是什麼！！

#質性研究#編碼#研究生

2024/08/13

🍋🗻檸檬富士山

質性研究要「編碼」？│研究入門：編碼是什麼🤔

「蛤！？到底什麼是編碼？網路上都查不到一個簡單的定義！」剛進研究室的你，被教授指派了許多任務，其中一件是要把質性資料給「編碼」，你是不是也像我一樣霧煞煞QQ 快點進來看看，我幫你統整了一篇簡單易懂的說明，讓你快速了解編碼是什麼！！

#質性研究#編碼#研究生

2024/08/13

小松鼠的演算法樂園

二進位操作: bit逆序翻轉 Reverse Bits_Leetcode_#190

題目敘述: Reverse Bits 給定一個32bit的整數，請逆序翻轉其二進位表達式，輸出翻轉過後的數字。例如輸入是二進位1010111 逆序翻轉後是 1110101，對應的十進位數值是117 測試範例 Example 1: Input: n = 00000010100101000

#python#leetcode#algorithm

2024/07/29

小松鼠的演算法樂園

二進位操作: bit逆序翻轉 Reverse Bits_Leetcode_#190

題目敘述: Reverse Bits 給定一個32bit的整數，請逆序翻轉其二進位表達式，輸出翻轉過後的數字。例如輸入是二進位1010111 逆序翻轉後是 1110101，對應的十進位數值是117 測試範例 Example 1: Input: n = 00000010100101000

#python#leetcode#algorithm

2024/07/29

WilliamP的沙龍

二元一次方程組計算練習（二）

中學數學基礎練習—二元一次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

二元一次方程組計算練習（二）

中學數學基礎練習—二元一次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

二元一次方程組計算練習（一）

中學數學基礎練習—二元一次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

二元一次方程組計算練習（一）

中學數學基礎練習—二元一次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（四）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（四）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（三）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（三）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（二）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（二）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（一）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

WilliamP的沙龍

一元二次方程式計算練習（一）

中學數學基礎練習—一元二次方程式

#中學#數學#中學數學

2024/07/18

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News