[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

更新於 發佈於 閱讀時間約 10 分鐘

原文:The Batch: Robot Hand Works Rubik’s Cube, Self-Driving Tanks Roll Toward Battle, Face Rec Dataset Sparks Lawsuit, Bayes Finds Wonder Material

Preface

最近事情多,這篇就晚了。這篇完稿的當天,下一篇「The Batch」已經出爐了,希望我還是能咬緊牙關趕快補上。到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。

由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。

Andrew Says

我已在好多公司聽過這樣的對話:

機器學習工程師:看我在測試資料集內驗證效果多好!

企業主:但你的機器學習系統完全沒辦法使用啊,它太糟了!

機器學習工程師:但你看,在測試資料集內驗證效果多好!

為什麼AI專案會失敗?上週我在我們的「Pie & AI」議程中提出了這個題目。 我們與來自於西班牙的Logroño,比利時的Ghent,倫敦及柏林等10個城市的觀眾,進行了激烈的討論。

我對AI產業仍是一派的樂觀,但我也都看到許多AI專案還在掙扎。和軟體工程不同,AI系統的開發過程還不是那麼成熟,而且研發團隊尚未瞭解常見的缺陷以及如何避開這些陷阱。

常見的問題是三個:穩健性不足,數據集太小以及工作流不佳。你可以從這幾個面向來分析你的AI專案,來增加成功的機率,我將在接下來的幾週提供一些我的想法,敬請關注。

How Neural Networks Generalize

人類是由抽象概念來理解這個世界的:如果你掌握了抓取一根木棍的要領,很快的你就能學會如何抓住一顆球。新的研究探索了深度學習中學員對同一件事情的「重做能力」– 一個讓它們的能力「通用化」的重要面向。

What’s new

心理學家稱呼這種思考能力為「系統推理」。來自DeepMind,Standford及London大學的研究員,研究了這種在深度學習中可與環境互動並完成任務的能力。

Key insight

Felix Hill和同事訓練了一個模型,把物件1置放到位置1這個動作做為範例。在測試期,他們要求這個模型把物件2置放到位置2,而這個要求並未被訓練過。所以這就是一個能通用化的理解「置放」的意義及完成任務的模型。

How it works

該模型隨著任務指示(搜尋物件,放到正確的位置),可獲得環境資訊。模型就開始分別處理這些資訊,然後把對它們個別的理解組合起來,去確認一連串能完成任務的動作組合。

  • 這個模型包括了3個元件(一個影像處理的通用選擇,文字理解及流程決策):一個處理環境資訊的CNN,一個解譯任務說明的LSTM,以及一個由CNN及LSTM的輸出合併而來的一個隱藏的LSTM層。這三個元件可用來追蹤進程並完成任務。
  • 該模型透過執行「置放物件」或「尋找物件」的任務過程中,學習透過名字來關聯這些不同的物件。
  • 研究員們把測試集及訓練集的物件分開,他們先在訓練集中訓練模型去尋找及置放物件。
  • 最終為了測量系統推理的程度,他們就會開始要求模型要在測試集執行同樣的任務。

Results

研究員在模擬的2D及3D環境訓練該模型的複本,在兩個環境都有91%找到新物件的成功率,然而在置放物件的成功率都掉到約50%。

Yes, but

當移除了任務描述及LSTM元件後,並沒有降低太多任務成功的比例。這意思是說,雖然「置放」及「尋找」對人們理解神經網路是如何系統化運作並執行任務的,但這些語言對執行的成功率而言就不是重點了。

Why it matters

神經網路看來是可以通用化的,但我們對於要怎麼做到還不那麼完整。這份研究提供了一個方向來評估「系統推理」的角色,而這份研究成果暗示了具有「系統推理」能力的模型,比較有可能能通用化。

Takeaway

預先以基礎知識來訓練好的語言模型,能讓他們完成許多不同種類的任務,而不用從頭開始再訓練。系統推理可讓神經網路不論在特定領域,或是跳脫出來到自然語言,都能達到更好的表現。

New Materials Courtesy of Bayes

你喜歡能裝到口袋裡的雨傘嗎?研究員用機器學習發明了一種結實但可折疊的材質,可用來創造這種神奇的產品。

What’s new

來自於 Netherlands’ Delft 科技大學的研究員,用「Bayesian」模型去找出一種脆型聚合物的排列,使其結實,輕量,可壓縮且可彈回原形狀。機器學習演算法讓設計及生產這種材質的過程,無須再經過以往的物理試誤實驗。

How it works

首席研究員Miguel Bessa設計了一種結構模型,其中有兩個通過撓性桿或縱梁連接的圓盤,當兩個圓盤擠壓在一起的時候,中間的撓性桿會以螺旋狀的方式折疊起來。

  • Bassa在模擬器中,透過100,000不同的材質組合,來對他的結構模型進行仿真測試。
  • 然後他用一個神經網路模型來對能符合他條件的那些組合來分類,主要是那些能在壓縮後再回復到原形狀的縱梁。
  • 最終他定案了兩種設計,建立微型及人體大小的可壓縮桅杆原型。

Results

微型版本的雛型十分堅挺,可完全壓縮,並在承受強烈壓力而不扭曲。而人體大小的版本則是在幾近被機器壓平的狀況下,仍然順利的彈回它原來的樣子。

Why it matters

從事超材料(以現有的材質去重組,以展現自然界尚未被發現的特徵)的科學家們,可改變材料的幾何形狀,大小及方向,來產生新的特性。以往,這需要許多的試誤,而透過機器學習可協助找出許多正確的屬性組合,讓研究員專心在挑選最有希望的候選者。

We’re thinking

從材料科學到藥物設計,蠻力實驗在前沿科學仍然是很重要的角色,但AI驅動的篩選能力已開始能為研究員找到通往Eureka(註:是一個源自希臘用以表達發現某件事物、真相時的感嘆詞。)更短的路徑。

Public Access, Private Faces

作為訓練臉部辨識系統的最大資料集,其中之一就起源於流行的照片分享服務。但使用這些資料的公司卻有可能因此要付出數百萬的法律賠償。

What’s new

根據New York Times的報導,許多Flickr的用戶在被記者告知,他們及他們的子女或家庭成員的相似性,是公開資料庫的一部分,用以訓練臉部辨識系統時,感到驚訝及不安。這種訓練可能會違反Illinois法庭正在測試中的數位隱私法。

Tracing the data

MegaFace,則是從Flickr的近4,000,000張照片描繪了672,000人,這些照片的創作者已在Creative Commons的智財許可下取得了商用授權。

  • Yahoo從2007年就持有Flickr到2017年,而在2014年的時候,這個網路巨人釋出了1,000,000張Flickr的照片,供機器學習者來訓練圖片分類。
  • 次年,華盛頓大學的研究員就開始發布MegaFace子資料集。
  • 從那時開始,Amazon, Google, Mitsubishi, SenseTime, Tencent及其他公司,就使用MegaFace的資料來訓練臉部辨識軟體。

Legal jeopardy

在2008年,Illinois通過了「生物識別訊息隱私法(Biometric Information Privacy Act)」,來預防商業單位在未經同意的狀況下,去頡取,購買或其他方式來取得個人肖像。而個人肖像在未經許可下被使用的話,有權在每次使用時獲得$1,000到$5,000的金額賠償。

Court action

Illinois的法案已在Facebook的集體訴訟中取得35,000,000,000美元,因Facebook在服務中提供了自動的臉部辨識功能。

  • Facebook辨稱在圖片中的人沒有起訴的理由,因為這項服務並沒有造成他們的經濟損失。
  • 美國第9巡迴法院駁回了此反對意見,並援引了早期Illinois最高法院的裁決,認為光是侵犯隱私就足於違反法律。
  • 該案子將由聯邦法院的陪審團來裁決,時間表尚未公佈。

Why it matters

MegaFace服務仍是可用的,根據2016年的華盛頓大學論文記載,而且至少有300個以上的組織用它的資料來訓練自己的模型。但任何用MegaFace的資料來盈利的組織,都會在Illinois的法案裁決上付出金額賠償。

We’re thinking

全球有約200個國家,美國有50個州,在不同司法管轄區中的監管失衡似乎是無法避免。用戶隱私及資料權是重要的,但法律要求應儘可能的清楚及通順,才能以更積極的方式推動科技進步。

留言
avatar-img
留言分享你的想法!
avatar-img
SharpWriter(周乃宏)的沙龍
34會員
69內容數
Google實驗室Area120釋出了一個「製作遊戲」的遊戲叫「Game Builder」。 主要的用戶是遊戲編導,方便他們以拖拉卡片的型式來驗證遊戲性好不好。 因此這個專題就是「Game Builder」的"真心話(好用難用都會說)"和"大冒險(真的來挑戰看看能做什麼遊戲)"囉!
2024/11/21
引文中最後的那句「大疆成立至今將近20年,在無人機應用上仍舊保有競爭力」,如果認真想想就會意識到那有多恐怖. 那20年專注在無人機的功力,已經不只是創辦人眼光的問題了...
Thumbnail
2024/11/21
引文中最後的那句「大疆成立至今將近20年,在無人機應用上仍舊保有競爭力」,如果認真想想就會意識到那有多恐怖. 那20年專注在無人機的功力,已經不只是創辦人眼光的問題了...
Thumbnail
2024/11/01
品質才是決定工作生產力的重點。
2024/11/01
品質才是決定工作生產力的重點。
2024/10/27
「不批評,不指責,不抱怨」三大核心精神,真的是「不可能」的嗎?
Thumbnail
2024/10/27
「不批評,不指責,不抱怨」三大核心精神,真的是「不可能」的嗎?
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
AI 的進展通常分為四個階段: 被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)
Thumbnail
AI 的進展通常分為四個階段: 被動機器 (Reactive machines) 有限的記憶體 (Limited memory) 心智理論 (Theory of mind) 自我意識 (Self aware)
Thumbnail
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
Thumbnail
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
Thumbnail
這是一本講述人工智慧的發展,以及企業在導入人工智慧會遇到的困境,和擁抱人工智慧所需要具備的條件,給身在台灣的各位一個思考的方向,是一本很值得一讀的書。
Thumbnail
這是一本講述人工智慧的發展,以及企業在導入人工智慧會遇到的困境,和擁抱人工智慧所需要具備的條件,給身在台灣的各位一個思考的方向,是一本很值得一讀的書。
Thumbnail
發揮一下想像力,這是您在一家金屬製造工廠工作的第一天,它已經實現無紙化,並且似乎正在順利連接機器並成為真正的數位製造工廠。在整個工廠中,您會看到精心佈置的儀表板,每個儀表板都顯示目前工作的進度;是否生產週期會提前、會準時或是落後於計劃。一切都在滴答作響,盡可能順利。 然後警報響起,每個人都聽到一聲巨
Thumbnail
發揮一下想像力,這是您在一家金屬製造工廠工作的第一天,它已經實現無紙化,並且似乎正在順利連接機器並成為真正的數位製造工廠。在整個工廠中,您會看到精心佈置的儀表板,每個儀表板都顯示目前工作的進度;是否生產週期會提前、會準時或是落後於計劃。一切都在滴答作響,盡可能順利。 然後警報響起,每個人都聽到一聲巨
Thumbnail
麻省理工學院史隆管理學院首席研究科學家,安德魯.麥克費在這篇2017年發表的文章中,說明了人工智慧對於組織與企業來說,能做到、不能做到什麼,以及帶來哪些新的風險與機會?
Thumbnail
麻省理工學院史隆管理學院首席研究科學家,安德魯.麥克費在這篇2017年發表的文章中,說明了人工智慧對於組織與企業來說,能做到、不能做到什麼,以及帶來哪些新的風險與機會?
Thumbnail
AI系統從創建,調整到真正上線,真的是一件很困難的事。除了模型的調整是一種近乎經驗及直覺的調校過程以外,最難的莫過於Andrew說的,你的系統的穩健性能有多好?也就是說,打從一開始模型的設計,若是就沒有特別想過這個系統對整個環境及運行時間的相容性問題,一個你花費大把心血的AI系統就會變得脆弱不堪…
Thumbnail
AI系統從創建,調整到真正上線,真的是一件很困難的事。除了模型的調整是一種近乎經驗及直覺的調校過程以外,最難的莫過於Andrew說的,你的系統的穩健性能有多好?也就是說,打從一開始模型的設計,若是就沒有特別想過這個系統對整個環境及運行時間的相容性問題,一個你花費大把心血的AI系統就會變得脆弱不堪…
Thumbnail
到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。 由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。
Thumbnail
到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。 由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。
Thumbnail
Unity這篇文章講述了在遊戲產品中如何使用機器學習,在遊戲測試加速,擬玩家NPC,ML-Agent的訓練加速及內容生成這些領域來應用,對我來說含金量是相當高的。雖然我很早就開始都有接觸機器學習領域,也一直都有關注相關的新聞,但始終找不到在遊戲產品的有力應用點…
Thumbnail
Unity這篇文章講述了在遊戲產品中如何使用機器學習,在遊戲測試加速,擬玩家NPC,ML-Agent的訓練加速及內容生成這些領域來應用,對我來說含金量是相當高的。雖然我很早就開始都有接觸機器學習領域,也一直都有關注相關的新聞,但始終找不到在遊戲產品的有力應用點…
Thumbnail
AI雖然現在還在萌芽期,不時有一些新鮮的技術出來,但多半面臨真實世界的考驗時,不是實用程度不夠,就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命,網路革命到現在的AI革命,哪一次沒有伴隨道德問題出來呢?這也是科技最有趣的地方…
Thumbnail
AI雖然現在還在萌芽期,不時有一些新鮮的技術出來,但多半面臨真實世界的考驗時,不是實用程度不夠,就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命,網路革命到現在的AI革命,哪一次沒有伴隨道德問題出來呢?這也是科技最有趣的地方…
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News