方格精選

[The Batch] 無人機競速 x 框架衝突 x 更精準的結果

更新於 發佈於 閱讀時間約 10 分鐘
機器學習的成長真的是日新月異。當我們身邊許多人還搞不清楚AI能做什麼,不能做什麼,還在搞懂CNN,DNN,GAN是什麼東西的時候,前線的應用研究已經越來越成熟。不管是哪種架構的神經網路,正在快要變得像軟體IC,像函式庫,像元件一樣的可以組合使用,創造出更powerful的應用。同時,這些完成品也開始往行動平台在移動,追求一樣的表現,更少的耗能及算力需求。
而Framework的多樣性也開始正在收斂:來自於社群研究為主的PyTorch及企業優先採用的TensorFlow,是將來的唯二選擇。就像遊戲引擎最終會只剩下3種一樣,多樣性是必要的,但不能是持續的,不然就會失去可靠性及應用場景(想想Linux桌面系統就知道了)。這對急需趕上AI應用的台灣絕對是好事,接下來就看誰能真正端出產品了。

Andrew Says

我最近換了使用2年的手機,正在搞清楚如何在低光源的狀況下,用長曝光的方式拍Nova睡覺的照片。這帶給我許多意想不到的樂趣。
上週我寫了關於AI界的道德問題,以及如何在AI工程中提煉出可執行的一些道德原則。 知名的整理專家「近虅麻理惠」說,若這東西不再讓你感到心動,獲得熱情,你就該丟了它。這就讓我想到,當我們建立任何AI系統時,它們能讓用戶感到心動或獲得熱情嗎?
這確實有許多解釋的空間。我在努力工作,幫助他人,增進人類處事效率及學習的過程中找到熱情,而在這些令人上癮的電子產品上則不會。我並不期望任何人都能在這個過程得到同樣的價值,當你在難以決定要投注心力在哪個專案的過程,這個問題也許會有幫助:你的機器學習專案,能給用戶帶來熱情或心動的感覺嗎?
這當然不是完整的答案,但可以是一個有用的起頭。

Autonomous Drones Ready to Race

駕駛員以每小時120公里的速度,操作著加強性的四軸無人機進行障礙越野賽。但很快的他們可能要失去這份工作了,因為協會正準備試著用AI來取代駕駛員,看能不能增添點趣味。

What’s new

無人機競速聯盟(Drone Racing League,簡稱DRL)最近舉辦了一場比賽,他們稱這是未來運動,同時,他們也發表了新的飛行器「RacerAI」。它搭載了Nvidia的Jetson AGX推論引擎,4個立體視覺攝影機,而螺旋槳可輸出20磅的推力。

What’s happening

RacerAI是由DRL及Lockheed Martin兩大AlphaPilot競賽團隊所贊助構建的AI模型平台:
  • 有420個團隊在這個平台的模擬賽道,測試它們的模型。
  • 虛擬的測試會將參賽者篩選到剩下9隊,然後在2019年秋季進行4場比賽。
  • 來自南韓凱斯大學的USRG團隊,於10/8贏得了第一場比賽,第二場比賽預定在11/2於華盛頓舉行。
  • 系列賽的冠軍可得100萬獎金。在2020年初這個冠軍模型將面對最頂尖的真人對手,以爭取額外的25萬獎金。

Behind the news

DRL的駕駛員使用的是由協會建造及維護的標準無人機,而且是使用相同的模擬器以訓練「RacerAI」。實際比賽通常是1英哩長,而且會在美國及歐洲的活動空間中舉行。

Why it matters

無人機競速是很有趣的比賽,但這些無人機習得的自動駕駛技能,是可以應用在真實世界的,比如說自動遞送。

We’re thinking

近期DRL釋出的一段影片顯示,現在的模型即便是要高速穿過圓環,也還有很大的改善空間。所以真人駕駛員「目前」還是有很顯著的優勢的。

Clash of the Frameworks

多數的深度學習應用是在TensorFlow或PyTorch框架上的,一份最新的分析報告指出,它們的受眾相當不同。

What’s new

康乃爾大學的研究員,在過去一年間從公開資訊比較了TensorFlow及PyTorch的使用量。根據「The Gradient」的報告指出,PyTorch在社群的研究用途快速增長,而TensorFlow仍是企業應用的首選。
(工商一下:您現在看的「The Batch」是由「deeplearning.ai」提供的,而我們在Coursera有提供TensorFlow專家課程哦!)

Findings

Horace He使用的是代理資料來判斷,這些用戶是來自於企業界還是純社群研究:
  • 研究界的狀況是,他調查了提交給2018年前五大AI論譠的論文摘要數量,他發現這一年中,PyTorch的用戶平均增加了275%,TensorFlow的用戶減少了0.5%。
  • 企業界的狀況是,他分析了3000份職位列表。企業要求有TensorFlow的經驗人數,遠超過要有PyTorch的人數。他還對LinkedIn的文章進行了調查,發現TensorFlow比PyTorch的比例是3230:1200。
  • TensorFlow在GitHub上存放的倉庫數,也是遠超過PyTorch的,他認為這是實務使用的關鍵指標。

Competitive strengths

  • TensorFlow擁有大量的用戶基礎,而企業採用新技術的步調都較慢。
  • TensorFlow比PyTorch更有效率,即便是節省了一點點模型運行時間,也有助於公司提高利潤。
  • Pytorch深度整合了Python,這使得Python的源碼更容易使用及除錯。
  • 根據Horace He的調查,多數的研究者仍然比較喜歡PyTorch的API,因為它從2016以來就維持著一致的框架架構。

We’re thinking

對於要選用哪一個頂級框架,很快地我們就得仔細籌算了。新釋出的TensorFlow 2.0新增了許多PyTorch用戶喜歡的功能,特別是和Python的整合以及預設使用Eager模式執行。然而多數的深度學習是由研究員驅動發展的,因此多數的畢業生都會帶著PyTorch技能進入職場。

Two Steps to Better Summaries

在自然語言處理領域中,匯整文章大意是一個長期未能有所突破的問題。而最近,研究員們在朝向人類水平的路上更進一步了。他們的摘要提到:「比起之前我們從原文抽取文句的方法,我們建立了一個模型,可直接”產生”出來的方式,來產出抽象大意」。

What’s new

來自於ElementAI及Montreal的學習算法研究所的研究員,並不直接產出抽象的大意,而是先抽取大意後,來指導產出的文字(大意)內容。

Key insight

提供這種抽取出來的大意,再搭配原文,可有效幫助預先訓練好的語言模型,來產出品質更好的抽象大意。

How it works

「大意化」的程序分為兩步:抽取及抽象
  • 研究員訓練一個神經網路來找出文中最重要的句子。本質上,他們是基於全文所有句子的關係,為每一條句子分配分數(包括內容及風格),所以抽取出來的大意就是分數最高的那些句子。
  • 透過像GPT架構的對抗式神經網路,持續以人類寫過的抽象大意來訓練後,就可以依據原文的字詞關係,一個字一個字的產出抽象大意的預期結果。

Results

作者測試了4個語料庫,所有語料庫均包括人工撰寫的摘要:arXiv(研究論文),PubMed(醫學研究論文),bigPatent(專利文件)和Newsroom(新聞文章)。這些作者都採用了ROUGE來比較他們寫的和產生的摘要分數。其中3個語料庫產生的大意,並不只是從原文複製一些句子出來而已,已具有相當高的完成度。唯有在Newsroom的ROUGE評分上,還是以抽取式的大意獲得較高的分數。

Why it matters

自動產出高品質的抽象摘要的AI能力,對只是把原文提取長句後,再替換成精簡的摘要文字的工作者來說,可說是提升了極大的產出率。真是太棒了!我們希望這不會讓「The Batch」的團隊失業…

High Accuracy, Low Compute

隨著神經網路越來越精準,它們的模型大小及算力要求也像吹氣球般變得更大。這些完美的模型要在手機或是那些低功耗的裝置上運行,就變得不那麼容易了。這裡有一個新技巧,能讓卷積神經網路能在不嚴重降低表現的情況下,減少更多算力需求。

What’s new

來自於北京大學的游忠惠和自動駕駛新創公司Momenta,提出了一種新方法,能移除那些對模型效能影響不大的參數:「Gate Decorator」。

Key insight

這個新技術是直接移除一整個功能群組的參數(特別是卷積網路中的那些篩選器),而不是單個單個的移除。

How it works

Gate Decorator會為模型加入一個比例因子,來表示每一個篩選器對模型輸出的重要性。評分的標準是來自於模型的損失函數,因此最沒影響力的篩選器就會被移除。
  • Gate Decorator模型會處理訓練用資料集的子集,來學習找出各篩選器的比例因子影響值,而原模型還是不做任何更動。
  • 一開始每個比例因子的值是亂數分配的,而Gate Decorator模型是被鼓勵去學習找出最小的比例因子,再乘上篩選器的輸出後,可以使最終表現影響最小。
  • 用戶找出來影響最小比例因子的篩選器會開始被刪除,修剪過的網路會整個資料集的環境下再做優化調整。
  • 整個過程會依照用戶指定的次數進行數次迭代。

Results

研究員比較了原版和修剪過後的算力成本及精準度。Gate Decorator減少了基於ImageNet訓練出來的ResNet約55%的算力,以及基於CIFAR訓練出來的ResNet約70%。但精準度的部分,前者降低了0.67%,後者反而還增加了0.03%。

Why it matters

和權重修剪的技法不同,Gate Decorator完全是依據實際結果來調整而獲得成效,而不是只依據理論。而且,裁剪篩選器的模型仍可運行既有的演算法,但若是在密集互連的神經網路移除權重的話,最終我們會再需要尋找特化後的演算法。

We’re thinking

像這樣的修剪法或許可和其他參數組一併使用,以降低CNN體系以外的算力需求。最終的模型更可以再被像是「量子化」的方法壓縮變得更小。
為什麼會看到廣告
Google實驗室Area120釋出了一個「製作遊戲」的遊戲叫「Game Builder」。 主要的用戶是遊戲編導,方便他們以拖拉卡片的型式來驗證遊戲性好不好。 因此這個專題就是「Game Builder」的"真心話(好用難用都會說)"和"大冒險(真的來挑戰看看能做什麼遊戲)"囉!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
AI雖然現在還在萌芽期,不時有一些新鮮的技術出來,但多半面臨真實世界的考驗時,不是實用程度不夠,就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命,網路革命到現在的AI革命,哪一次沒有伴隨道德問題出來呢?這也是科技最有趣的地方…
之前看過「自律即是自由」這本書,作者在海豹部隊服役20年,最後成為指揮官,他說起自律真是鏗鏘有力,但那本書我最後反而把它給退了…
這一期我一樣只挑了三個跟我們比較有切身關係,偏應用端的主題,很巧的是這三個都是在講cGAN的。人工智慧能做的事,已經越來越開始挑戰我們的想像極限,正開始有那種「只有你想不到,沒有AI做不到」的味道出來了。希望我能一直保持寫作輸出的習慣,讓對人工智慧有興趣,但英文苦手的朋友們儘量一起跟上世界趨勢。
以前的我,總覺得為什麼我的老板不自己搞清楚狀況再叫我們開發,或是明明狀況已經蠻清楚了,為什麼我們還要再花時間去做什麼測試,很浪費時間。為什麼我們的時間不是拿去把規格想清楚再來寫code,都是靠寫code後的結果試誤,才決定最終規格到底是要怎麼做,真的很浪費我們的才華及大家的時間…
來源:Stream high-quality real-time graphics through your browser with our new WebRTC framework 透過Unity先進的圖像串流技術,你可以不再受限於裝置的硬體效能,設計畫面更炫麗的遊戲了!
幾個月前,我訂了人生第一個付費文章「科技島讀」。本來是從Podcast聽到的,聽著覺得真不錯,作者深入精闢的商業及科技分析,都讓我聽到許多印象深刻的觀點。後來…
AI雖然現在還在萌芽期,不時有一些新鮮的技術出來,但多半面臨真實世界的考驗時,不是實用程度不夠,就是有道德問題。Andrew這次提到的跟前陣子的「明星換臉」就是類似的問題。不過從以前的工業革命,網路革命到現在的AI革命,哪一次沒有伴隨道德問題出來呢?這也是科技最有趣的地方…
之前看過「自律即是自由」這本書,作者在海豹部隊服役20年,最後成為指揮官,他說起自律真是鏗鏘有力,但那本書我最後反而把它給退了…
這一期我一樣只挑了三個跟我們比較有切身關係,偏應用端的主題,很巧的是這三個都是在講cGAN的。人工智慧能做的事,已經越來越開始挑戰我們的想像極限,正開始有那種「只有你想不到,沒有AI做不到」的味道出來了。希望我能一直保持寫作輸出的習慣,讓對人工智慧有興趣,但英文苦手的朋友們儘量一起跟上世界趨勢。
以前的我,總覺得為什麼我的老板不自己搞清楚狀況再叫我們開發,或是明明狀況已經蠻清楚了,為什麼我們還要再花時間去做什麼測試,很浪費時間。為什麼我們的時間不是拿去把規格想清楚再來寫code,都是靠寫code後的結果試誤,才決定最終規格到底是要怎麼做,真的很浪費我們的才華及大家的時間…
來源:Stream high-quality real-time graphics through your browser with our new WebRTC framework 透過Unity先進的圖像串流技術,你可以不再受限於裝置的硬體效能,設計畫面更炫麗的遊戲了!
幾個月前,我訂了人生第一個付費文章「科技島讀」。本來是從Podcast聽到的,聽著覺得真不錯,作者深入精闢的商業及科技分析,都讓我聽到許多印象深刻的觀點。後來…
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Tengr.ai 咒語:Sentinel Drone 方法:圖生圖
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
當全球正在嘗試如何 AI 畫圖、寫文章的時候,烏克蘭對 AI 有更迫切的用途,那就是用於讓無人機能更有效的打擊俄軍,如今多家烏克蘭新創公司正在努力開發無人機的 AI,以在俄烏戰爭中能取得科技的優勢。
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
以下是未來10年可能具有良好前景的產業: 生成式人工智慧:預計到2026年,超過八成的企業會在生產環境中導入生成式AI。 量子科技:量子電腦具有強大的運算力,可望優化AI語言模型的訓練效率。 低軌衛星:隨著5G和其他通訊技術的發展,低軌衛星通訊可能成為新的商機。 無人機:無人機在軍事和民用領
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
這陣子在研究自動駕駛技術,還記得2021年我當時分享了特斯拉的自動駕駛技術,那時候特斯拉還有雷達、沒有occupancy networks、自動標記算法和虛擬場景構建算法都沒有現在完善,那個時候特斯拉使用BEV鳥瞰圖來進行感知融合計算深度,再配上蒙地卡羅決策樹的方法來進行道路決策,後面一步步提升感知
Thumbnail
無人機是什麼? 從2022年俄烏戰爭爆發,到去年的以巴衝突、近日的以伊衝突,全球地緣政治緊張局勢升溫,讓軍工、國防產業備受關注,其中又以無人機最受矚目。 無人機顧名思義就是不需駕駛員就能夠升空的飛行器,通常利用遙控、導引或是自動駕駛等方式進行操作,用途上分為軍用和民用兩種。軍用無人機可以用於
Thumbnail
臺灣近年來大力發展軍工產業,無人機產業也是其中的重點之一。Droneii調研機構指出,至2030年全球無人機產值將上看546億美元。臺灣已經在南臺灣成立亞洲無人機AI創新應用研發中心,並吸引了多家相關企業的加入。雷虎、漢翔等軍工翹楚,致力爭取各大合作案,國防部的70億元大標案吸引相關企業的競相投入。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
Tengr.ai 咒語:Sentinel Drone 方法:圖生圖
Thumbnail
人工智能:革命性技術的崛起與挑戰 1. 什麼是人工智能? 人工智能(AI)是指由人類創造的機器或系統,能夠模仿人類智能,執行通常需要人類智能才能完成的任務。這包括學習、問題解決、語言理解、視覺感知等能力。AI系統可以處理大量數據,識別模式,並根據這些信息做出決策或預測。 2.
Thumbnail
當全球正在嘗試如何 AI 畫圖、寫文章的時候,烏克蘭對 AI 有更迫切的用途,那就是用於讓無人機能更有效的打擊俄軍,如今多家烏克蘭新創公司正在努力開發無人機的 AI,以在俄烏戰爭中能取得科技的優勢。
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
以下是未來10年可能具有良好前景的產業: 生成式人工智慧:預計到2026年,超過八成的企業會在生產環境中導入生成式AI。 量子科技:量子電腦具有強大的運算力,可望優化AI語言模型的訓練效率。 低軌衛星:隨著5G和其他通訊技術的發展,低軌衛星通訊可能成為新的商機。 無人機:無人機在軍事和民用領
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
這陣子在研究自動駕駛技術,還記得2021年我當時分享了特斯拉的自動駕駛技術,那時候特斯拉還有雷達、沒有occupancy networks、自動標記算法和虛擬場景構建算法都沒有現在完善,那個時候特斯拉使用BEV鳥瞰圖來進行感知融合計算深度,再配上蒙地卡羅決策樹的方法來進行道路決策,後面一步步提升感知
Thumbnail
無人機是什麼? 從2022年俄烏戰爭爆發,到去年的以巴衝突、近日的以伊衝突,全球地緣政治緊張局勢升溫,讓軍工、國防產業備受關注,其中又以無人機最受矚目。 無人機顧名思義就是不需駕駛員就能夠升空的飛行器,通常利用遙控、導引或是自動駕駛等方式進行操作,用途上分為軍用和民用兩種。軍用無人機可以用於
Thumbnail
臺灣近年來大力發展軍工產業,無人機產業也是其中的重點之一。Droneii調研機構指出,至2030年全球無人機產值將上看546億美元。臺灣已經在南臺灣成立亞洲無人機AI創新應用研發中心,並吸引了多家相關企業的加入。雷虎、漢翔等軍工翹楚,致力爭取各大合作案,國防部的70億元大標案吸引相關企業的競相投入。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。