【資料科學的數學基礎課|第5課】這些「方向感超好」的向量,是模型背後的導航員!

更新於 發佈於 閱讀時間約 4 分鐘

✍️ 文/資料科學家練習生


你走在路上,手上拿著指南針,指南針告訴你「方向」,但它不會告訴你「多遠」。

在數學裡也有一種東西專門負責「方向」和「距離」的資訊,那就是──向量(Vector)

在前幾篇,我們學過怎麼量一個向量的長度(範數),現在我們要更進一步來看看:

👉 有哪些「有特殊能力」的向量? 👉 又有哪些「整齊得像軍隊」的向量組合?


✳️ 一、單位向量(Unit Vector):只有「方向」沒有「大小」

這種向量的特色是:

它的長度 = 1

也就是說,它只代表一個方向,但不帶「多遠」。

公式:

= x ÷ ‖x‖

🧠 這叫做「把向量單位化」,意思是:

不管原本多長,我們都縮小或放大,讓它的長度變成 1!

🔧 在資料科學中,單位向量就像:

  • 把每個人的走路方向都對齊來比較
  • 把數據的大小「標準化」,方便看趨勢而不是看量級

✳️ 二、正交向量(Orthogonal):彼此完全無關的方向

你還記得「內積」是什麼嗎?

簡單說,內積是拿來看「兩個向量有多同方向」。

而當兩個向量完全不一樣方向,互成 90 度時──

它們的內積 = 0

這種關係就叫做「正交」!

🧠 想像你走東、你朋友走北,你們的方向就互不干擾,是完全「正交」的!

🔍 在機器學習中,我們常用「正交」來保證:

  • 不同變數之間沒有干擾
  • 資料維度彼此獨立、乾淨

✳️ 三、正交矩陣(Orthogonal Matrix):整隊整齊又方向分明

正交矩陣就是一個超整齊的矩陣,裡面:

  • 每一「行」和每一「列」都是單位向量
  • 而且彼此都是正交關係

用數學的話來說:

Aᵀ × A = A × A= I(單位矩陣)

🧠 意思是:

這個矩陣裡的向量不但長度一樣(都是 1)

而且方向完全不重疊(彼此 90°),堪稱完美!

🔧 在資料科學中,我們用正交矩陣來:

  • 保證資料轉換時不會扭曲資料
  • 執行「旋轉」或「保持距離」的數據處理操作(例如 PCA 主成分分析)

✳️ 四、正交單位向量(Orthonormal):最完美的向量組合!

這是最厲害的組合包!一組向量如果:

  • 彼此正交(方向完全不重疊)
  • 每個都是單位向量(長度都是 1)

那我們就叫它們是「正交單位向量」,英文是 Orthonormal Vectors

🧠 這種向量組合非常穩定又好用,是許多 AI 模型、壓縮演算法、圖像轉換的基礎。

想像一個小隊,每個人走不同方向、都走同樣速度,合作無間、超好管理!


🔁 總複習:向量界的「完美隊伍」怎麼長?

🔹 單位向量:只有方向、長度 = 1  
🔹 正交向量:彼此方向差 90 度,內積 = 0
🔹 正交矩陣:每行每列都是正交單位向量
🔹 正交單位向量:方向不同又長度一致的完美夥伴

🚀 小總結:資料的「方向感」就是靠它們!

你未來會發現,很多資料其實只是「方向+大小」的組合。

而單位化、正交化、矩陣組合,就是在幫助我們:

  • 看得更清楚(去除雜訊)
  • 算得更精準(避免干擾)
  • 模型學得更聰明(更快收斂、更穩定)

📮 下次我們來聊「內積是怎麼計算的?可以幫我們判斷兩個人是不是同路人?」

喜歡這系列文章嗎?歡迎留言或收藏,我會用最簡單的方式,陪你邁向資料科學家的第一步!

留言
avatar-img
留言分享你的想法!
avatar-img
溫蒂的夢幻島航海日誌
1會員
13內容數
我是 Wendy,一位相信知識可以讓世界更美好的學習者。 白天是品保工程師,晚上是資料筆記的整理者。 正在深入統計與品質管理,也持續探索資料科學與商業邏輯的連結。 偶爾也會記錄家庭經營、親子對話與自由工作者的嘗試。 每一篇文章,都是給自己的備忘錄,也希望成為你前行路上的地圖。
2025/08/04
這篇文章介紹資料科學中四種常見且重要的矩陣:單位矩陣、對稱矩陣、反矩陣和奇異矩陣,並以淺顯易懂的比喻說明其特性和用途,幫助讀者快速理解矩陣在機器學習、影像處理和推薦系統中的應用。
2025/08/04
這篇文章介紹資料科學中四種常見且重要的矩陣:單位矩陣、對稱矩陣、反矩陣和奇異矩陣,並以淺顯易懂的比喻說明其特性和用途,幫助讀者快速理解矩陣在機器學習、影像處理和推薦系統中的應用。
2025/08/04
這篇文章以淺顯易懂的方式介紹了範數 (Norm) 的概念,並結合生活化的例子,例如走路、計算距離等,說明 L1 範數、L2 範數、Max 範數和 Frobenius 範數。文章也解釋了範數在資料科學中的應用,以及如何幫助資料科學家分析數據。
Thumbnail
2025/08/04
這篇文章以淺顯易懂的方式介紹了範數 (Norm) 的概念,並結合生活化的例子,例如走路、計算距離等,說明 L1 範數、L2 範數、Max 範數和 Frobenius 範數。文章也解釋了範數在資料科學中的應用,以及如何幫助資料科學家分析數據。
Thumbnail
2025/08/03
透過自助餐點菜的例子,淺顯易懂地解釋矩陣乘法,並說明其在資料科學中的應用。
Thumbnail
2025/08/03
透過自助餐點菜的例子,淺顯易懂地解釋矩陣乘法,並說明其在資料科學中的應用。
Thumbnail
看更多
你可能也想看
Thumbnail
高中數學主題練習—向量分點公式
Thumbnail
高中數學主題練習—向量分點公式
Thumbnail
高中數學主題練習—向量分點公式
Thumbnail
高中數學主題練習—向量分點公式
Thumbnail
高中數學主題練習—點與圓之關係
Thumbnail
高中數學主題練習—點與圓之關係
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 二 這一百廿一頁其實只是第一版的一個附錄,名為「幾何學」。除了坐標系統的引進,笛卡兒明顯地結合了幾何和代數的語言。事實上,所謂「解析幾何」就是用代數方法表述被
Thumbnail
1.0 從函數到函算語法 1.2 函數概念小史 1.2.1 中譯的來源 1.2.2 一個速度問題 1.2.3 幾何的方法 二 這一百廿一頁其實只是第一版的一個附錄,名為「幾何學」。除了坐標系統的引進,笛卡兒明顯地結合了幾何和代數的語言。事實上,所謂「解析幾何」就是用代數方法表述被
Thumbnail
大語言模型(如GPT-3和GPT-4)的出現改變了我們與機器互動的方式。這些模型能夠理解和生成自然語言,實現許多以前無法想像的應用。然而,你可能會好奇,這些模型究竟是如何理解語言的?這裡,我們來探討一個關鍵的概念:「一切語義都是關係」。
Thumbnail
大語言模型(如GPT-3和GPT-4)的出現改變了我們與機器互動的方式。這些模型能夠理解和生成自然語言,實現許多以前無法想像的應用。然而,你可能會好奇,這些模型究竟是如何理解語言的?這裡,我們來探討一個關鍵的概念:「一切語義都是關係」。
Thumbnail
本文提供快速的計算方式,不考慮相機校正的部分,主要會解釋單應性矩陣的計算原理,但要精確還是要進行相機校正。本文主要包括單應性矩陣的定義與計算、實際的校正方式,以及程式碼示例。
Thumbnail
本文提供快速的計算方式,不考慮相機校正的部分,主要會解釋單應性矩陣的計算原理,但要精確還是要進行相機校正。本文主要包括單應性矩陣的定義與計算、實際的校正方式,以及程式碼示例。
Thumbnail
在為「質數」此純數學範疇搜索相關的教學資源時,我發現到一個很好用的教具,那就是「Anchor Chart(錨點圖)」,類似於「海報展示」,對於純數學抽象概念的引導、闡明非常有幫助。
Thumbnail
在為「質數」此純數學範疇搜索相關的教學資源時,我發現到一個很好用的教具,那就是「Anchor Chart(錨點圖)」,類似於「海報展示」,對於純數學抽象概念的引導、闡明非常有幫助。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News