[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

更新於 2024/10/30發佈於 2019/10/31閱讀時間約 10 分鐘

原文：The Batch: Robot Hand Works Rubik’s Cube, Self-Driving Tanks Roll Toward Battle, Face Rec Dataset Sparks Lawsuit, Bayes Finds Wonder Material

Preface

最近事情多，這篇就晚了。這篇完稿的當天，下一篇「The Batch」已經出爐了，希望我還是能咬緊牙關趕快補上。到目前為止，機器學習確實達成了許多以往看來不可能的任務，但如同Andrew所述，其實開發的過程非但不容易，還很容易觸法。

由於遊戲往往是一個有明確規則的產物，而在製作過程中的規格變化又是那麼頻繁，因此機器學習在遊戲業界的應用更是難上加難，希望Andrew接下來的分析能有所幫助。

Andrew Says

我已在好多公司聽過這樣的對話：

機器學習工程師：看我在測試資料集內驗證效果多好！

企業主：但你的機器學習系統完全沒辦法使用啊，它太糟了！

機器學習工程師：但你看，在測試資料集內驗證效果多好！

為什麼AI專案會失敗？上週我在我們的「Pie & AI」議程中提出了這個題目。我們與來自於西班牙的Logroño，比利時的Ghent，倫敦及柏林等10個城市的觀眾，進行了激烈的討論。

我對AI產業仍是一派的樂觀，但我也都看到許多AI專案還在掙扎。和軟體工程不同，AI系統的開發過程還不是那麼成熟，而且研發團隊尚未瞭解常見的缺陷以及如何避開這些陷阱。

常見的問題是三個：穩健性不足，數據集太小以及工作流不佳。你可以從這幾個面向來分析你的AI專案，來增加成功的機率，我將在接下來的幾週提供一些我的想法，敬請關注。

How Neural Networks Generalize

人類是由抽象概念來理解這個世界的：如果你掌握了抓取一根木棍的要領，很快的你就能學會如何抓住一顆球。新的研究探索了深度學習中學員對同一件事情的「重做能力」– 一個讓它們的能力「通用化」的重要面向。

What’s new

心理學家稱呼這種思考能力為「系統推理」。來自DeepMind，Standford及London大學的研究員，研究了這種在深度學習中可與環境互動並完成任務的能力。

Key insight

Felix Hill和同事訓練了一個模型，把物件1置放到位置1這個動作做為範例。在測試期，他們要求這個模型把物件2置放到位置2，而這個要求並未被訓練過。所以這就是一個能通用化的理解「置放」的意義及完成任務的模型。

How it works

該模型隨著任務指示(搜尋物件，放到正確的位置)，可獲得環境資訊。模型就開始分別處理這些資訊，然後把對它們個別的理解組合起來，去確認一連串能完成任務的動作組合。

這個模型包括了3個元件(一個影像處理的通用選擇，文字理解及流程決策)：一個處理環境資訊的CNN，一個解譯任務說明的LSTM，以及一個由CNN及LSTM的輸出合併而來的一個隱藏的LSTM層。這三個元件可用來追蹤進程並完成任務。
該模型透過執行「置放物件」或「尋找物件」的任務過程中，學習透過名字來關聯這些不同的物件。
研究員們把測試集及訓練集的物件分開，他們先在訓練集中訓練模型去尋找及置放物件。
最終為了測量系統推理的程度，他們就會開始要求模型要在測試集執行同樣的任務。

Results

研究員在模擬的2D及3D環境訓練該模型的複本，在兩個環境都有91%找到新物件的成功率，然而在置放物件的成功率都掉到約50%。

Yes, but

當移除了任務描述及LSTM元件後，並沒有降低太多任務成功的比例。這意思是說，雖然「置放」及「尋找」對人們理解神經網路是如何系統化運作並執行任務的，但這些語言對執行的成功率而言就不是重點了。

Why it matters

神經網路看來是可以通用化的，但我們對於要怎麼做到還不那麼完整。這份研究提供了一個方向來評估「系統推理」的角色，而這份研究成果暗示了具有「系統推理」能力的模型，比較有可能能通用化。

Takeaway

預先以基礎知識來訓練好的語言模型，能讓他們完成許多不同種類的任務，而不用從頭開始再訓練。系統推理可讓神經網路不論在特定領域，或是跳脫出來到自然語言，都能達到更好的表現。

New Materials Courtesy of Bayes

你喜歡能裝到口袋裡的雨傘嗎？研究員用機器學習發明了一種結實但可折疊的材質，可用來創造這種神奇的產品。

What’s new

來自於 Netherlands’ Delft 科技大學的研究員，用「Bayesian」模型去找出一種脆型聚合物的排列，使其結實，輕量，可壓縮且可彈回原形狀。機器學習演算法讓設計及生產這種材質的過程，無須再經過以往的物理試誤實驗。

How it works

首席研究員Miguel Bessa設計了一種結構模型，其中有兩個通過撓性桿或縱梁連接的圓盤，當兩個圓盤擠壓在一起的時候，中間的撓性桿會以螺旋狀的方式折疊起來。

Bassa在模擬器中，透過100,000不同的材質組合，來對他的結構模型進行仿真測試。
然後他用一個神經網路模型來對能符合他條件的那些組合來分類，主要是那些能在壓縮後再回復到原形狀的縱梁。
最終他定案了兩種設計，建立微型及人體大小的可壓縮桅杆原型。

Results

微型版本的雛型十分堅挺，可完全壓縮，並在承受強烈壓力而不扭曲。而人體大小的版本則是在幾近被機器壓平的狀況下，仍然順利的彈回它原來的樣子。

Why it matters

從事超材料(以現有的材質去重組，以展現自然界尚未被發現的特徵)的科學家們，可改變材料的幾何形狀，大小及方向，來產生新的特性。以往，這需要許多的試誤，而透過機器學習可協助找出許多正確的屬性組合，讓研究員專心在挑選最有希望的候選者。

We’re thinking

從材料科學到藥物設計，蠻力實驗在前沿科學仍然是很重要的角色，但AI驅動的篩選能力已開始能為研究員找到通往Eureka(註：是一個源自希臘用以表達發現某件事物、真相時的感嘆詞。)更短的路徑。

Public Access, Private Faces

作為訓練臉部辨識系統的最大資料集，其中之一就起源於流行的照片分享服務。但使用這些資料的公司卻有可能因此要付出數百萬的法律賠償。

What’s new

根據New York Times的報導，許多Flickr的用戶在被記者告知，他們及他們的子女或家庭成員的相似性，是公開資料庫的一部分，用以訓練臉部辨識系統時，感到驚訝及不安。這種訓練可能會違反Illinois法庭正在測試中的數位隱私法。

Tracing the data

MegaFace，則是從Flickr的近4,000,000張照片描繪了672,000人，這些照片的創作者已在Creative Commons的智財許可下取得了商用授權。

Yahoo從2007年就持有Flickr到2017年，而在2014年的時候，這個網路巨人釋出了1,000,000張Flickr的照片，供機器學習者來訓練圖片分類。
次年，華盛頓大學的研究員就開始發布MegaFace子資料集。
從那時開始，Amazon, Google, Mitsubishi, SenseTime, Tencent及其他公司，就使用MegaFace的資料來訓練臉部辨識軟體。

Legal jeopardy

在2008年，Illinois通過了「生物識別訊息隱私法(Biometric Information Privacy Act)」，來預防商業單位在未經同意的狀況下，去頡取，購買或其他方式來取得個人肖像。而個人肖像在未經許可下被使用的話，有權在每次使用時獲得$1,000到$5,000的金額賠償。

Court action

Illinois的法案已在Facebook的集體訴訟中取得35,000,000,000美元，因Facebook在服務中提供了自動的臉部辨識功能。

Facebook辨稱在圖片中的人沒有起訴的理由，因為這項服務並沒有造成他們的經濟損失。
美國第9巡迴法院駁回了此反對意見，並援引了早期Illinois最高法院的裁決，認為光是侵犯隱私就足於違反法律。
該案子將由聯邦法院的陪審團來裁決，時間表尚未公佈。

Why it matters

MegaFace服務仍是可用的，根據2016年的華盛頓大學論文記載，而且至少有300個以上的組織用它的資料來訓練自己的模型。但任何用MegaFace的資料來盈利的組織，都會在Illinois的法案裁決上付出金額賠償。

We’re thinking

全球有約200個國家，美國有50個州，在不同司法管轄區中的監管失衡似乎是無法避免。用戶隱私及資料權是重要的，但法律要求應儘可能的清楚及通順，才能以更積極的方式推動科技進步。

#TheBatch

#machinelearning

留言

留言分享你的想法！

SharpWriter(周乃宏)的沙龍

34會員

69內容數

Google實驗室Area120釋出了一個「製作遊戲」的遊戲叫「Game Builder」。主要的用戶是遊戲編導，方便他們以拖拉卡片的型式來驗證遊戲性好不好。因此這個專題就是「Game Builder」的"真心話(好用難用都會說)"和"大冒險(真的來挑戰看看能做什麼遊戲)"囉！

SharpWriter(周乃宏)的沙龍的其他內容

2024/11/21

“專注”是AI時代下無法取代的競爭力

引文中最後的那句「大疆成立至今將近20年，在無人機應用上仍舊保有競爭力」,如果認真想想就會意識到那有多恐怖. 那20年專注在無人機的功力,已經不只是創辦人眼光的問題了...

2024/11/21

“專注”是AI時代下無法取代的競爭力

2024/11/01

不是"慢"生產力,而是"真"生產力

品質才是決定工作生產力的重點。

2024/11/01

不是"慢"生產力,而是"真"生產力

品質才是決定工作生產力的重點。

2024/10/27

《領導人的雙贏智慧》：做更好的選擇

「不批評,不指責,不抱怨」三大核心精神,真的是「不可能」的嗎？

2024/10/27

《領導人的雙贏智慧》：做更好的選擇

「不批評,不指責,不抱怨」三大核心精神,真的是「不可能」的嗎？

看更多

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

JN的沙龍

說你是 AI，你就是 AI

AI 的進展通常分為四個階段：被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)

2023/06/04

JN的沙龍

說你是 AI，你就是 AI

AI 的進展通常分為四個階段：被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)

2023/06/04

Ted Chen的沙龍

快速瞭解機器學習基本原理

本文深入探討機器學習的核心概念，包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務，並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型，並以寶可夢應用為例說明迴歸和分類問題。

2023/06/02

2023/06/02

讀《人工智慧在台灣》學習如何跟上人工智慧讓AI真的幫上忙

這是一本講述人工智慧的發展，以及企業在導入人工智慧會遇到的困境，和擁抱人工智慧所需要具備的條件，給身在台灣的各位一個思考的方向，是一本很值得一讀的書。

#人工智慧#學習#資訊

2023/05/11

跟著軌軌來讀書的沙龍

讀《人工智慧在台灣》學習如何跟上人工智慧讓AI真的幫上忙

#人工智慧#學習#資訊

2023/05/11

B2B Sales&Business Development

製造業的未來趨勢推演 - 元宇宙與金屬加工製造業

發揮一下想像力，這是您在一家金屬製造工廠工作的第一天，它已經實現無紙化，並且似乎正在順利連接機器並成為真正的數位製造工廠。在整個工廠中，您會看到精心佈置的儀表板，每個儀表板都顯示目前工作的進度；是否生產週期會提前、會準時或是落後於計劃。一切都在滴答作響，盡可能順利。然後警報響起，每個人都聽到一聲巨

#業務可頌#智慧製造#元宇宙

2023/03/03

B2B Sales&Business Development

製造業的未來趨勢推演 - 元宇宙與金屬加工製造業

#業務可頌#智慧製造#元宇宙

2023/03/03

劉奕酉的職場致勝賽局

【全息圖解】哈佛商業評論#17｜人工智慧大商機

麻省理工學院史隆管理學院首席研究科學家，安德魯．麥克費在這篇2017年發表的文章中，說明了人工智慧對於組織與企業來說，能做到、不能做到什麼，以及帶來哪些新的風險與機會？

#人工智慧#哈佛商業評論#全息圖

2022/09/19

劉奕酉的職場致勝賽局

【全息圖解】哈佛商業評論#17｜人工智慧大商機

#人工智慧#哈佛商業評論#全息圖

2022/09/19

SharpWriter(周乃宏)的沙龍

[The Batch] 星海爭霸２ x 素描變照片 x 搖桿玩手臂

AI系統從創建，調整到真正上線，真的是一件很困難的事。除了模型的調整是一種近乎經驗及直覺的調校過程以外，最難的莫過於Andrew說的，你的系統的穩健性能有多好？也就是說，打從一開始模型的設計，若是就沒有特別想過這個系統對整個環境及運行時間的相容性問題，一個你花費大把心血的AI系統就會變得脆弱不堪…

#TheBatch#machinelearning

2019/11/19

SharpWriter(周乃宏)的沙龍

[The Batch] 星海爭霸２ x 素描變照片 x 搖桿玩手臂

#TheBatch#machinelearning

2019/11/19

SharpWriter(周乃宏)的沙龍

[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

到目前為止，機器學習確實達成了許多以往看來不可能的任務，但如同Andrew所述，其實開發的過程非但不容易，還很容易觸法。由於遊戲往往是一個有明確規則的產物，而在製作過程中的規格變化又是那麼頻繁，因此機器學習在遊戲業界的應用更是難上加難，希望Andrew接下來的分析能有所幫助。

#TheBatch#machinelearning

2019/10/31

SharpWriter(周乃宏)的沙龍

[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

#TheBatch#machinelearning

2019/10/31

SharpWriter(周乃宏)的沙龍

The AI@Unity interns help shape the world

Unity這篇文章講述了在遊戲產品中如何使用機器學習，在遊戲測試加速，擬玩家NPC，ML-Agent的訓練加速及內容生成這些領域來應用，對我來說含金量是相當高的。雖然我很早就開始都有接觸機器學習領域，也一直都有關注相關的新聞，但始終找不到在遊戲產品的有力應用點…

#MLAgent#machinelearning#Unity

2019/10/23

SharpWriter(周乃宏)的沙龍

The AI@Unity interns help shape the world

#MLAgent#machinelearning#Unity

2019/10/23

SharpWriter(周乃宏)的沙龍

[The Batch] 自動駕駛 x 家居機器人 x 持續成長的AI新創公司

AI雖然現在還在萌芽期，不時有一些新鮮的技術出來，但多半面臨真實世界的考驗時，不是實用程度不夠，就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命，網路革命到現在的AI革命，哪一次沒有伴隨道德問題出來呢？這也是科技最有趣的地方…

#TheBatch#AI#machinelearning

2019/10/13

SharpWriter(周乃宏)的沙龍

[The Batch] 自動駕駛 x 家居機器人 x 持續成長的AI新創公司

#TheBatch#AI#machinelearning

2019/10/13

吐納商業評論的沙龍

為什麼瞭解AI機器人必須從倉庫自動化開始？／Bastiane Huang

本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中，我們談到AI機器人和傳統機器人最大的不同在於自主學習能力，而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用？對各個產業又會有什麼影響？

#BastianeHuang#AI#人工智慧

2019/10/01

吐納商業評論的沙龍

為什麼瞭解AI機器人必須從倉庫自動化開始？／Bastiane Huang

#BastianeHuang#AI#人工智慧

2019/10/01

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News