方格精選

[The Batch] 無人機競速 x 框架衝突 x 更精準的結果

更新於 2024/10/17發佈於 2019/10/18閱讀時間約 10 分鐘

TensorFlow Versus PyTorch, Autonomous Drone Races, State-of-the-Art with Less Compute, NLP for Rare Languages

機器學習的成長真的是日新月異。當我們身邊許多人還搞不清楚AI能做什麼，不能做什麼，還在搞懂CNN,DNN,GAN是什麼東西的時候，前線的應用研究已經越來越成熟。不管是哪種架構的神經網路，正在快要變得像軟體IC，像函式庫，像元件一樣的可以組合使用，創造出更powerful的應用。同時，這些完成品也開始往行動平台在移動，追求一樣的表現，更少的耗能及算力需求。

而Framework的多樣性也開始正在收斂：來自於社群研究為主的PyTorch及企業優先採用的TensorFlow，是將來的唯二選擇。就像遊戲引擎最終會只剩下3種一樣，多樣性是必要的，但不能是持續的，不然就會失去可靠性及應用場景(想想Linux桌面系統就知道了)。這對急需趕上AI應用的台灣絕對是好事，接下來就看誰能真正端出產品了。

Andrew Says

我最近換了使用2年的手機，正在搞清楚如何在低光源的狀況下，用長曝光的方式拍Nova睡覺的照片。這帶給我許多意想不到的樂趣。

上週我寫了關於AI界的道德問題，以及如何在AI工程中提煉出可執行的一些道德原則。知名的整理專家「近虅麻理惠」說，若這東西不再讓你感到心動，獲得熱情，你就該丟了它。這就讓我想到，當我們建立任何AI系統時，它們能讓用戶感到心動或獲得熱情嗎？

這確實有許多解釋的空間。我在努力工作，幫助他人，增進人類處事效率及學習的過程中找到熱情，而在這些令人上癮的電子產品上則不會。我並不期望任何人都能在這個過程得到同樣的價值，當你在難以決定要投注心力在哪個專案的過程，這個問題也許會有幫助：你的機器學習專案，能給用戶帶來熱情或心動的感覺嗎？

這當然不是完整的答案，但可以是一個有用的起頭。

Autonomous Drones Ready to Race

駕駛員以每小時120公里的速度，操作著加強性的四軸無人機進行障礙越野賽。但很快的他們可能要失去這份工作了，因為協會正準備試著用AI來取代駕駛員，看能不能增添點趣味。

What’s new

無人機競速聯盟(Drone Racing League，簡稱DRL)最近舉辦了一場比賽，他們稱這是未來運動，同時，他們也發表了新的飛行器「RacerAI」。它搭載了Nvidia的Jetson AGX推論引擎，4個立體視覺攝影機，而螺旋槳可輸出20磅的推力。

What’s happening

RacerAI是由DRL及Lockheed Martin兩大AlphaPilot競賽團隊所贊助構建的AI模型平台：

有420個團隊在這個平台的模擬賽道，測試它們的模型。
虛擬的測試會將參賽者篩選到剩下9隊，然後在2019年秋季進行4場比賽。
來自南韓凱斯大學的USRG團隊，於10/8贏得了第一場比賽，第二場比賽預定在11/2於華盛頓舉行。
系列賽的冠軍可得100萬獎金。在2020年初這個冠軍模型將面對最頂尖的真人對手，以爭取額外的25萬獎金。

Behind the news

DRL的駕駛員使用的是由協會建造及維護的標準無人機，而且是使用相同的模擬器以訓練「RacerAI」。實際比賽通常是1英哩長，而且會在美國及歐洲的活動空間中舉行。

Why it matters

無人機競速是很有趣的比賽，但這些無人機習得的自動駕駛技能，是可以應用在真實世界的，比如說自動遞送。

We’re thinking

近期DRL釋出的一段影片顯示，現在的模型即便是要高速穿過圓環，也還有很大的改善空間。所以真人駕駛員「目前」還是有很顯著的優勢的。

Clash of the Frameworks

多數的深度學習應用是在TensorFlow或PyTorch框架上的，一份最新的分析報告指出，它們的受眾相當不同。

What’s new

康乃爾大學的研究員，在過去一年間從公開資訊比較了TensorFlow及PyTorch的使用量。根據「The Gradient」的報告指出，PyTorch在社群的研究用途快速增長，而TensorFlow仍是企業應用的首選。

(工商一下：您現在看的「The Batch」是由「deeplearning.ai」提供的，而我們在Coursera有提供TensorFlow專家課程哦！)

Findings

Horace He使用的是代理資料來判斷，這些用戶是來自於企業界還是純社群研究：

研究界的狀況是，他調查了提交給2018年前五大AI論譠的論文摘要數量，他發現這一年中，PyTorch的用戶平均增加了275%，TensorFlow的用戶減少了0.5%。
企業界的狀況是，他分析了3000份職位列表。企業要求有TensorFlow的經驗人數，遠超過要有PyTorch的人數。他還對LinkedIn的文章進行了調查，發現TensorFlow比PyTorch的比例是3230:1200。
TensorFlow在GitHub上存放的倉庫數，也是遠超過PyTorch的，他認為這是實務使用的關鍵指標。

Competitive strengths

TensorFlow擁有大量的用戶基礎，而企業採用新技術的步調都較慢。
TensorFlow比PyTorch更有效率，即便是節省了一點點模型運行時間，也有助於公司提高利潤。
Pytorch深度整合了Python，這使得Python的源碼更容易使用及除錯。
根據Horace He的調查，多數的研究者仍然比較喜歡PyTorch的API，因為它從2016以來就維持著一致的框架架構。

We’re thinking

對於要選用哪一個頂級框架，很快地我們就得仔細籌算了。新釋出的TensorFlow 2.0新增了許多PyTorch用戶喜歡的功能，特別是和Python的整合以及預設使用Eager模式執行。然而多數的深度學習是由研究員驅動發展的，因此多數的畢業生都會帶著PyTorch技能進入職場。

Two Steps to Better Summaries

在自然語言處理領域中，匯整文章大意是一個長期未能有所突破的問題。而最近，研究員們在朝向人類水平的路上更進一步了。他們的摘要提到：「比起之前我們從原文抽取文句的方法，我們建立了一個模型，可直接”產生”出來的方式，來產出抽象大意」。

What’s new

來自於ElementAI及Montreal的學習算法研究所的研究員，並不直接產出抽象的大意，而是先抽取大意後，來指導產出的文字(大意)內容。

Key insight

提供這種抽取出來的大意，再搭配原文，可有效幫助預先訓練好的語言模型，來產出品質更好的抽象大意。

How it works

「大意化」的程序分為兩步：抽取及抽象

研究員訓練一個神經網路來找出文中最重要的句子。本質上，他們是基於全文所有句子的關係，為每一條句子分配分數(包括內容及風格)，所以抽取出來的大意就是分數最高的那些句子。
透過像GPT架構的對抗式神經網路，持續以人類寫過的抽象大意來訓練後，就可以依據原文的字詞關係，一個字一個字的產出抽象大意的預期結果。

Results

作者測試了4個語料庫，所有語料庫均包括人工撰寫的摘要：arXiv（研究論文），PubMed（醫學研究論文），bigPatent（專利文件）和Newsroom（新聞文章）。這些作者都採用了ROUGE來比較他們寫的和產生的摘要分數。其中3個語料庫產生的大意，並不只是從原文複製一些句子出來而已，已具有相當高的完成度。唯有在Newsroom的ROUGE評分上，還是以抽取式的大意獲得較高的分數。

Why it matters

自動產出高品質的抽象摘要的AI能力，對只是把原文提取長句後，再替換成精簡的摘要文字的工作者來說，可說是提升了極大的產出率。真是太棒了！我們希望這不會讓「The Batch」的團隊失業…

High Accuracy, Low Compute

隨著神經網路越來越精準，它們的模型大小及算力要求也像吹氣球般變得更大。這些完美的模型要在手機或是那些低功耗的裝置上運行，就變得不那麼容易了。這裡有一個新技巧，能讓卷積神經網路能在不嚴重降低表現的情況下，減少更多算力需求。

What’s new

來自於北京大學的游忠惠和自動駕駛新創公司Momenta，提出了一種新方法，能移除那些對模型效能影響不大的參數：「Gate Decorator」。

Key insight

這個新技術是直接移除一整個功能群組的參數(特別是卷積網路中的那些篩選器)，而不是單個單個的移除。

How it works

Gate Decorator會為模型加入一個比例因子，來表示每一個篩選器對模型輸出的重要性。評分的標準是來自於模型的損失函數，因此最沒影響力的篩選器就會被移除。

Gate Decorator模型會處理訓練用資料集的子集，來學習找出各篩選器的比例因子影響值，而原模型還是不做任何更動。
一開始每個比例因子的值是亂數分配的，而Gate Decorator模型是被鼓勵去學習找出最小的比例因子，再乘上篩選器的輸出後，可以使最終表現影響最小。
用戶找出來影響最小比例因子的篩選器會開始被刪除，修剪過的網路會整個資料集的環境下再做優化調整。
整個過程會依照用戶指定的次數進行數次迭代。

Results

研究員比較了原版和修剪過後的算力成本及精準度。Gate Decorator減少了基於ImageNet訓練出來的ResNet約55%的算力，以及基於CIFAR訓練出來的ResNet約70%。但精準度的部分，前者降低了0.67%，後者反而還增加了0.03%。

Why it matters

和權重修剪的技法不同，Gate Decorator完全是依據實際結果來調整而獲得成效，而不是只依據理論。而且，裁剪篩選器的模型仍可運行既有的演算法，但若是在密集互連的神經網路移除權重的話，最終我們會再需要尋找特化後的演算法。

We’re thinking

像這樣的修剪法或許可和其他參數組一併使用，以降低CNN體系以外的算力需求。最終的模型更可以再被像是「量子化」的方法壓縮變得更小。

為什麼會看到廣告

#TheBatch

SharpWriter(周乃宏)的沙龍

34會員

69內容數

Google實驗室Area120釋出了一個「製作遊戲」的遊戲叫「Game Builder」。主要的用戶是遊戲編導，方便他們以拖拉卡片的型式來驗證遊戲性好不好。因此這個專題就是「Game Builder」的"真心話(好用難用都會說)"和"大冒險(真的來挑戰看看能做什麼遊戲)"囉！

留言0

查看全部

發表第一個留言支持創作者！

SharpWriter(周乃宏)的沙龍的其他內容

[The Batch] 自動駕駛 x 家居機器人 x 持續成長的AI新創公司

AI雖然現在還在萌芽期，不時有一些新鮮的技術出來，但多半面臨真實世界的考驗時，不是實用程度不夠，就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命，網路革命到現在的AI革命，哪一次沒有伴隨道德問題出來呢？這也是科技最有趣的地方…

#TheBatch #AI #machinelearning

自律就是「做自己」

之前看過「自律即是自由」這本書，作者在海豹部隊服役20年，最後成為指揮官，他說起自律真是鏗鏘有力，但那本書我最後反而把它給退了…

#自律

[The Batch] 變臉 x 籃球戰術 x 文字產生器

這一期我一樣只挑了三個跟我們比較有切身關係，偏應用端的主題，很巧的是這三個都是在講cGAN的。人工智慧能做的事，已經越來越開始挑戰我們的想像極限，正開始有那種「只有你想不到，沒有AI做不到」的味道出來了。希望我能一直保持寫作輸出的習慣，讓對人工智慧有興趣，但英文苦手的朋友們儘量一起跟上世界趨勢。

你是外包還是正職？

以前的我，總覺得為什麼我的老板不自己搞清楚狀況再叫我們開發，或是明明狀況已經蠻清楚了，為什麼我們還要再花時間去做什麼測試，很浪費時間。為什麼我們的時間不是拿去把規格想清楚再來寫code，都是靠寫code後的結果試誤，才決定最終規格到底是要怎麼做，真的很浪費我們的才華及大家的時間…

[寫作練習] 用WebRTC框架，讓瀏覽器即時渲染高品質圖像

來源：Stream high-quality real-time graphics through your browser with our new WebRTC framework 透過Unity先進的圖像串流技術，你可以不再受限於裝置的硬體效能，設計畫面更炫麗的遊戲了！

#Unity #WebRTC

真正的專業，背後都有不討喜的文字

幾個月前，我訂了人生第一個付費文章「科技島讀」。本來是從Podcast聽到的，聽著覺得真不錯，作者深入精闢的商業及科技分析，都讓我聽到許多印象深刻的觀點。後來…

#writing

[The Batch] 自動駕駛 x 家居機器人 x 持續成長的AI新創公司

#TheBatch #AI #machinelearning

自律就是「做自己」

之前看過「自律即是自由」這本書，作者在海豹部隊服役20年，最後成為指揮官，他說起自律真是鏗鏘有力，但那本書我最後反而把它給退了…

#自律

[The Batch] 變臉 x 籃球戰術 x 文字產生器

你是外包還是正職？

[寫作練習] 用WebRTC框架，讓瀏覽器即時渲染高品質圖像

你可能也想看

Tengr.ai 咒語：Sentinel Drone 方法：圖生圖

#AI概念 #AI繪圖 #3D建模

烏托邦邦的沙龍

2024/08/06

『人工智能』AI的崛起早已對人類產生威脅？！

人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.

當全球正在嘗試如何 AI 畫圖、寫文章的時候，烏克蘭對 AI 有更迫切的用途，那就是用於讓無人機能更有效的打擊俄軍，如今多家烏克蘭新創公司正在努力開發無人機的 AI，以在俄烏戰爭中能取得科技的優勢。

談心說地

2024/07/14

AI的世界：創新與潛力

AI的世界充滿了創新和潛力，涵蓋了許多領域，包括但不限於機器學習，自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的，既帶來了巨大的機遇，也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡，確保AI技術的應用能夠真正造福人類。

#學習 #人類 #機器人

真師傅的AI沙龍

2024/07/02

未來10年的熱門產業和其對應的相關科系與證照

以下是未來10年可能具有良好前景的產業：生成式人工智慧：預計到2026年，超過八成的企業會在生產環境中導入生成式AI。量子科技：量子電腦具有強大的運算力，可望優化AI語言模型的訓練效率。低軌衛星：隨著5G和其他通訊技術的發展，低軌衛星通訊可能成為新的商機。無人機：無人機在軍事和民用領

Will 進步本

2024/05/11

拐點 #002: 大語言模型的基本原理與工作方式

在人工智能的發展歷程中，早期的研究主要側重於將解決問題的規則輸入計算機，試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而，這條路逐漸變得艱難，因為規則過於繁多，無法應對複雜的情境和語境。在這個背景下，一些科學家轉向了神經網絡算法，試圖模擬人腦的感知能力。

#AI #拐點 #GPT

阿財科技分享的沙龍

2024/05/03

中國大陸自動駕駛技術真的太卷啦！(硬體軟體通通捲起來)

這陣子在研究自動駕駛技術，還記得2021年我當時分享了特斯拉的自動駕駛技術，那時候特斯拉還有雷達、沒有occupancy networks、自動標記算法和虛擬場景構建算法都沒有現在完善，那個時候特斯拉使用BEV鳥瞰圖來進行感知融合計算深度，再配上蒙地卡羅決策樹的方法來進行道路決策，後面一步步提升感知

無人機是什麼？從2022年俄烏戰爭爆發，到去年的以巴衝突、近日的以伊衝突，全球地緣政治緊張局勢升溫，讓軍工、國防產業備受關注，其中又以無人機最受矚目。無人機顧名思義就是不需駕駛員就能夠升空的飛行器，通常利用遙控、導引或是自動駕駛等方式進行操作，用途上分為軍用和民用兩種。軍用無人機可以用於

#無人機 #AI #科技

全球財經專業評論的沙龍

2024/04/06

無人機產業大幅擴張，雷虎、漢翔坐擁發展良機

臺灣近年來大力發展軍工產業，無人機產業也是其中的重點之一。Droneii調研機構指出，至2030年全球無人機產值將上看546億美元。臺灣已經在南臺灣成立亞洲無人機AI創新應用研發中心，並吸引了多家相關企業的加入。雷虎、漢翔等軍工翹楚，致力爭取各大合作案，國防部的70億元大標案吸引相關企業的競相投入。

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

Tengr.ai 咒語：Sentinel Drone 方法：圖生圖

#AI概念 #AI繪圖 #3D建模

烏托邦邦的沙龍

2024/08/06

『人工智能』AI的崛起早已對人類產生威脅？！

#人工智能 #ai #科技

Baozilla, Let's go!

2024/08/02