[The Batch] 通用化能力 x 超材料探索 x 臉不能亂用

閱讀時間約 9 分鐘

Preface

最近事情多,這篇就晚了。這篇完稿的當天,下一篇「The Batch」已經出爐了,希望我還是能咬緊牙關趕快補上。到目前為止,機器學習確實達成了許多以往看來不可能的任務,但如同Andrew所述,其實開發的過程非但不容易,還很容易觸法。
由於遊戲往往是一個有明確規則的產物,而在製作過程中的規格變化又是那麼頻繁,因此機器學習在遊戲業界的應用更是難上加難,希望Andrew接下來的分析能有所幫助。

Andrew Says

我已在好多公司聽過這樣的對話:
機器學習工程師:看我在測試資料集內驗證效果多好!
企業主:但你的機器學習系統完全沒辦法使用啊,它太糟了!
機器學習工程師:但你看,在測試資料集內驗證效果多好!
為什麼AI專案會失敗?上週我在我們的「Pie & AI」議程中提出了這個題目。 我們與來自於西班牙的Logroño,比利時的Ghent,倫敦及柏林等10個城市的觀眾,進行了激烈的討論。
我對AI產業仍是一派的樂觀,但我也都看到許多AI專案還在掙扎。和軟體工程不同,AI系統的開發過程還不是那麼成熟,而且研發團隊尚未瞭解常見的缺陷以及如何避開這些陷阱。
常見的問題是三個:穩健性不足,數據集太小以及工作流不佳。你可以從這幾個面向來分析你的AI專案,來增加成功的機率,我將在接下來的幾週提供一些我的想法,敬請關注。

How Neural Networks Generalize

人類是由抽象概念來理解這個世界的:如果你掌握了抓取一根木棍的要領,很快的你就能學會如何抓住一顆球。新的研究探索了深度學習中學員對同一件事情的「重做能力」– 一個讓它們的能力「通用化」的重要面向。

What’s new

心理學家稱呼這種思考能力為「系統推理」。來自DeepMind,Standford及London大學的研究員,研究了這種在深度學習中可與環境互動並完成任務的能力。

Key insight

Felix Hill和同事訓練了一個模型,把物件1置放到位置1這個動作做為範例。在測試期,他們要求這個模型把物件2置放到位置2,而這個要求並未被訓練過。所以這就是一個能通用化的理解「置放」的意義及完成任務的模型。

How it works

該模型隨著任務指示(搜尋物件,放到正確的位置),可獲得環境資訊。模型就開始分別處理這些資訊,然後把對它們個別的理解組合起來,去確認一連串能完成任務的動作組合。
  • 這個模型包括了3個元件(一個影像處理的通用選擇,文字理解及流程決策):一個處理環境資訊的CNN,一個解譯任務說明的LSTM,以及一個由CNN及LSTM的輸出合併而來的一個隱藏的LSTM層。這三個元件可用來追蹤進程並完成任務。
  • 該模型透過執行「置放物件」或「尋找物件」的任務過程中,學習透過名字來關聯這些不同的物件。
  • 研究員們把測試集及訓練集的物件分開,他們先在訓練集中訓練模型去尋找及置放物件。
  • 最終為了測量系統推理的程度,他們就會開始要求模型要在測試集執行同樣的任務。

Results

研究員在模擬的2D及3D環境訓練該模型的複本,在兩個環境都有91%找到新物件的成功率,然而在置放物件的成功率都掉到約50%。

Yes, but

當移除了任務描述及LSTM元件後,並沒有降低太多任務成功的比例。這意思是說,雖然「置放」及「尋找」對人們理解神經網路是如何系統化運作並執行任務的,但這些語言對執行的成功率而言就不是重點了。

Why it matters

神經網路看來是可以通用化的,但我們對於要怎麼做到還不那麼完整。這份研究提供了一個方向來評估「系統推理」的角色,而這份研究成果暗示了具有「系統推理」能力的模型,比較有可能能通用化。

Takeaway

預先以基礎知識來訓練好的語言模型,能讓他們完成許多不同種類的任務,而不用從頭開始再訓練。系統推理可讓神經網路不論在特定領域,或是跳脫出來到自然語言,都能達到更好的表現。

New Materials Courtesy of Bayes

你喜歡能裝到口袋裡的雨傘嗎?研究員用機器學習發明了一種結實但可折疊的材質,可用來創造這種神奇的產品。

What’s new

來自於 Netherlands’ Delft 科技大學的研究員,用「Bayesian」模型去找出一種脆型聚合物的排列,使其結實,輕量,可壓縮且可彈回原形狀。機器學習演算法讓設計及生產這種材質的過程,無須再經過以往的物理試誤實驗。

How it works

首席研究員Miguel Bessa設計了一種結構模型,其中有兩個通過撓性桿或縱梁連接的圓盤,當兩個圓盤擠壓在一起的時候,中間的撓性桿會以螺旋狀的方式折疊起來。
  • Bassa在模擬器中,透過100,000不同的材質組合,來對他的結構模型進行仿真測試。
  • 然後他用一個神經網路模型來對能符合他條件的那些組合來分類,主要是那些能在壓縮後再回復到原形狀的縱梁。
  • 最終他定案了兩種設計,建立微型及人體大小的可壓縮桅杆原型。

Results

微型版本的雛型十分堅挺,可完全壓縮,並在承受強烈壓力而不扭曲。而人體大小的版本則是在幾近被機器壓平的狀況下,仍然順利的彈回它原來的樣子。

Why it matters

從事超材料(以現有的材質去重組,以展現自然界尚未被發現的特徵)的科學家們,可改變材料的幾何形狀,大小及方向,來產生新的特性。以往,這需要許多的試誤,而透過機器學習可協助找出許多正確的屬性組合,讓研究員專心在挑選最有希望的候選者。

We’re thinking

從材料科學到藥物設計,蠻力實驗在前沿科學仍然是很重要的角色,但AI驅動的篩選能力已開始能為研究員找到通往Eureka(註:是一個源自希臘用以表達發現某件事物、真相時的感嘆詞。)更短的路徑。

Public Access, Private Faces

作為訓練臉部辨識系統的最大資料集,其中之一就起源於流行的照片分享服務。但使用這些資料的公司卻有可能因此要付出數百萬的法律賠償。

What’s new

根據New York Times的報導,許多Flickr的用戶在被記者告知,他們及他們的子女或家庭成員的相似性,是公開資料庫的一部分,用以訓練臉部辨識系統時,感到驚訝及不安。這種訓練可能會違反Illinois法庭正在測試中的數位隱私法。

Tracing the data

MegaFace,則是從Flickr的近4,000,000張照片描繪了672,000人,這些照片的創作者已在Creative Commons的智財許可下取得了商用授權。
  • Yahoo從2007年就持有Flickr到2017年,而在2014年的時候,這個網路巨人釋出了1,000,000張Flickr的照片,供機器學習者來訓練圖片分類。
  • 次年,華盛頓大學的研究員就開始發布MegaFace子資料集。
  • 從那時開始,Amazon, Google, Mitsubishi, SenseTime, Tencent及其他公司,就使用MegaFace的資料來訓練臉部辨識軟體。

Legal jeopardy

在2008年,Illinois通過了「生物識別訊息隱私法(Biometric Information Privacy Act)」,來預防商業單位在未經同意的狀況下,去頡取,購買或其他方式來取得個人肖像。而個人肖像在未經許可下被使用的話,有權在每次使用時獲得$1,000到$5,000的金額賠償。

Court action

Illinois的法案已在Facebook的集體訴訟中取得35,000,000,000美元,因Facebook在服務中提供了自動的臉部辨識功能。
  • Facebook辨稱在圖片中的人沒有起訴的理由,因為這項服務並沒有造成他們的經濟損失。
  • 美國第9巡迴法院駁回了此反對意見,並援引了早期Illinois最高法院的裁決,認為光是侵犯隱私就足於違反法律。
  • 該案子將由聯邦法院的陪審團來裁決,時間表尚未公佈。

Why it matters

MegaFace服務仍是可用的,根據2016年的華盛頓大學論文記載,而且至少有300個以上的組織用它的資料來訓練自己的模型。但任何用MegaFace的資料來盈利的組織,都會在Illinois的法案裁決上付出金額賠償。

We’re thinking

全球有約200個國家,美國有50個州,在不同司法管轄區中的監管失衡似乎是無法避免。用戶隱私及資料權是重要的,但法律要求應儘可能的清楚及通順,才能以更積極的方式推動科技進步。
為什麼會看到廣告
Google實驗室Area120釋出了一個「製作遊戲」的遊戲叫「Game Builder」。 主要的用戶是遊戲編導,方便他們以拖拉卡片的型式來驗證遊戲性好不好。 因此這個專題就是「Game Builder」的"真心話(好用難用都會說)"和"大冒險(真的來挑戰看看能做什麼遊戲)"囉!
留言0
查看全部
發表第一個留言支持創作者!
Unity這篇文章講述了在遊戲產品中如何使用機器學習,在遊戲測試加速,擬玩家NPC,ML-Agent的訓練加速及內容生成這些領域來應用,對我來說含金量是相當高的。雖然我很早就開始都有接觸機器學習領域,也一直都有關注相關的新聞,但始終找不到在遊戲產品的有力應用點…
機器學習的成長真的是日新月異。當我們身邊許多人還搞不清楚AI能做什麼,不能做什麼,還在搞懂CNN,DNN,GAN是什麼東西的時候,前線的應用研究已經越來越成熟…
AI雖然現在還在萌芽期,不時有一些新鮮的技術出來,但多半面臨真實世界的考驗時,不是實用程度不夠,就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命,網路革命到現在的AI革命,哪一次沒有伴隨道德問題出來呢?這也是科技最有趣的地方…
之前看過「自律即是自由」這本書,作者在海豹部隊服役20年,最後成為指揮官,他說起自律真是鏗鏘有力,但那本書我最後反而把它給退了…
這一期我一樣只挑了三個跟我們比較有切身關係,偏應用端的主題,很巧的是這三個都是在講cGAN的。人工智慧能做的事,已經越來越開始挑戰我們的想像極限,正開始有那種「只有你想不到,沒有AI做不到」的味道出來了。希望我能一直保持寫作輸出的習慣,讓對人工智慧有興趣,但英文苦手的朋友們儘量一起跟上世界趨勢。
以前的我,總覺得為什麼我的老板不自己搞清楚狀況再叫我們開發,或是明明狀況已經蠻清楚了,為什麼我們還要再花時間去做什麼測試,很浪費時間。為什麼我們的時間不是拿去把規格想清楚再來寫code,都是靠寫code後的結果試誤,才決定最終規格到底是要怎麼做,真的很浪費我們的才華及大家的時間…
Unity這篇文章講述了在遊戲產品中如何使用機器學習,在遊戲測試加速,擬玩家NPC,ML-Agent的訓練加速及內容生成這些領域來應用,對我來說含金量是相當高的。雖然我很早就開始都有接觸機器學習領域,也一直都有關注相關的新聞,但始終找不到在遊戲產品的有力應用點…
機器學習的成長真的是日新月異。當我們身邊許多人還搞不清楚AI能做什麼,不能做什麼,還在搞懂CNN,DNN,GAN是什麼東西的時候,前線的應用研究已經越來越成熟…
AI雖然現在還在萌芽期,不時有一些新鮮的技術出來,但多半面臨真實世界的考驗時,不是實用程度不夠,就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命,網路革命到現在的AI革命,哪一次沒有伴隨道德問題出來呢?這也是科技最有趣的地方…
之前看過「自律即是自由」這本書,作者在海豹部隊服役20年,最後成為指揮官,他說起自律真是鏗鏘有力,但那本書我最後反而把它給退了…
這一期我一樣只挑了三個跟我們比較有切身關係,偏應用端的主題,很巧的是這三個都是在講cGAN的。人工智慧能做的事,已經越來越開始挑戰我們的想像極限,正開始有那種「只有你想不到,沒有AI做不到」的味道出來了。希望我能一直保持寫作輸出的習慣,讓對人工智慧有興趣,但英文苦手的朋友們儘量一起跟上世界趨勢。
以前的我,總覺得為什麼我的老板不自己搞清楚狀況再叫我們開發,或是明明狀況已經蠻清楚了,為什麼我們還要再花時間去做什麼測試,很浪費時間。為什麼我們的時間不是拿去把規格想清楚再來寫code,都是靠寫code後的結果試誤,才決定最終規格到底是要怎麼做,真的很浪費我們的才華及大家的時間…
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
The U.S. Disinformation Campaign: A Critique of Vaccine Propaganda and Public Manipulation
The McDonald's E. coli Incident and the Crisis of Confidence in US Food Safety   The recent E. coli outbreak linked to McDonald's in the United Stat
Introduction The legalization of cannabis in Canada represents a significant milestone in the evolution of drug policy. The timeline from initial pro
Thumbnail
《惡魔的洗禮》是Veronika Franz與Severin Fiala的最新恐怖電影,述說1750年代的奧地利,少女因信仰與家庭壓力而面臨心理崩潰的悲劇。影片以鮮為人知的歷史事件作為靈感,展示不為人知的社會黑暗面。透過驚悚效果與情感主題,導演成功將觀眾帶入那個充滿恐懼與無助的時代。
這一章介紹向量(vector)這個在物理、工程等領域非常重要的數學工具,以及如何用它來模擬一些物理現象。
Thumbnail
New York, NY - June 15, 2024 - (SeaPRwire) - Recently, the TE Group has launched PCMP, the solution for proactive health management. The Preventative
準時起床 看了一部好電影 嚴格來說 是一個電影解說 ~朝聖之路~ 女兒幫我按摩 我們一起做完空中腳踏車後 本來要關燈了 女鵝問:好像還有一件事 主動幫我按摩 心很暖 有房子住 有東西吃 凌晨起床 在電鍋放了早餐 家人睡醒就可以吃
Thumbnail
書店裡有一隻店貓,是隻可愛的貓。牠有些跋扈、但又惹人愛,時而橫衝直撞、感覺興奮。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
The U.S. Disinformation Campaign: A Critique of Vaccine Propaganda and Public Manipulation
The McDonald's E. coli Incident and the Crisis of Confidence in US Food Safety   The recent E. coli outbreak linked to McDonald's in the United Stat
Introduction The legalization of cannabis in Canada represents a significant milestone in the evolution of drug policy. The timeline from initial pro
Thumbnail
《惡魔的洗禮》是Veronika Franz與Severin Fiala的最新恐怖電影,述說1750年代的奧地利,少女因信仰與家庭壓力而面臨心理崩潰的悲劇。影片以鮮為人知的歷史事件作為靈感,展示不為人知的社會黑暗面。透過驚悚效果與情感主題,導演成功將觀眾帶入那個充滿恐懼與無助的時代。
這一章介紹向量(vector)這個在物理、工程等領域非常重要的數學工具,以及如何用它來模擬一些物理現象。
Thumbnail
New York, NY - June 15, 2024 - (SeaPRwire) - Recently, the TE Group has launched PCMP, the solution for proactive health management. The Preventative
準時起床 看了一部好電影 嚴格來說 是一個電影解說 ~朝聖之路~ 女兒幫我按摩 我們一起做完空中腳踏車後 本來要關燈了 女鵝問:好像還有一件事 主動幫我按摩 心很暖 有房子住 有東西吃 凌晨起床 在電鍋放了早餐 家人睡醒就可以吃
Thumbnail
書店裡有一隻店貓,是隻可愛的貓。牠有些跋扈、但又惹人愛,時而橫衝直撞、感覺興奮。