近日OpenAI與蘋果合作,美國新創產業研究公司PitchBook數據,今年NVIDIA也持續押注,參與韓國新創Twelve Labs的A輪募資,投資約5,000萬美元(約新台幣16億元),大大幫助Twelve Labs開發AI。
Twelve Labs的AI專攻影片分析,用戶只要說:「幫我找到狗狗打滾的影片。」AI就能馬上找到。看似簡單,其實背後需要理解影片個動作、聲音和情緒代表的意思,背後是Twelve Labs僅花兩年就推出的AI模型。
其實Google很早就推出MUM AI模型,能了解人類語言不同情況有不同意思,如「住在這很方便」和「我去方便一下」,兩句話的「方便」意思就不同。
去年Twelve Labs推出第一個AI模型Pegasus,成功將長短影片和語言生成AI結合,從4秒到20分鐘影片都能讓使用者與AI文字對話,請AI回答影片所有問題。今年3月又推出第二個AI模型Marengo,經歷訓練6千萬支影片及5億多張圖片,可回答更多影片圖片和聲音等多模型AI。
Twelve Labs創辦至今兩年多,完成兩個AI模型。
Jae Lee和Twelve Labs技術長Aiden Lee也從最初集合五位核心成員成長到40人團隊,並陸續從歐洲創投Index Ventures和加拿大投資公司Radical Ventures等募得3,000萬美元(約新台幣9億元)種子資金,更在近兩年與NVIDIA、英特爾和三星建立合作關係,後續將用NVIDIA這筆資金,持續研發精進AI模型。
兩年半開發兩個 AI 模型,獲 NVIDIA 千萬美元投資的 Twelve Labs 強在哪?
生成式 AI 技術普及令假資訊和詐騙等問題變得更加嚴重,要如何判斷內容是否 AI 生成已經成爲一個備受關注的問題。有開發公司最近推出新型的 AI 聲音偵測模型,據稱其準確度可達 94%。
Resemble AI 最近發表的新一代 DeepFake 偵測模型 Detect-2B 準確率據稱高達約 94%。Detect-2B 的架構基於 Mamba-SSM 或狀態空間模型開發,採用隨機概率模型,能更好地配合音頻訊號的變化。模型在包含未見過的說話者、DeepFake AI 生成聲音和不同語言的測試集上都表現出色,在六種不同語言中檢測 DeepFake 聲音的準確率至少達到 93%。
Resemble AI 表示,Detect-2B 的子模型「由一個凍結的音頻表示模型和插入其關鍵層的適應模組組成」。適應模組可以將模型的焦點轉向人工生成痕跡,這些偶然出現的「瑕疵」能有助區分真實聲音和假聲音。模型可以在不需要每次聆聽新片段時重新訓練的情況下,預測音頻中 AI 生成的部分。Resemble AI 表示,他們將繼續改進 Detect-2B,專注於表示學習、先進模型架構和數據擴展等範疇。
新開發 AI 聲音偵測模型登場,判斷聲音是否 AI 生成準確度達 94%
人工智慧(AI)題材帶動下,今年以來無論美股、台股,皆屢創新高,卻出現漲幅貢獻多來自大型科技股、AI 概念股的現象;與此同時,市場也開始擔心,AI 風潮是否已「過熱」,恐重演當年網路泡沫戲碼?
以美股為例,標普500、那斯達克指數,今年(至6月21日收盤)累計分別上漲14.57%和17.84%。據美媒CNBC統計,標普500指數已377天,沒出現幅度超過2.05%的拋售,是2008年金融海嘯以來,持續最長的一段時間。
有些投資人把當前AI熱潮,和過去的網路泡沫相比擬。自1995年起,投機炒作使許多空有其名卻無實績的網路概念股陸續起漲,那斯達克指數在2000年3月來到高峰,累計漲幅達400%。
值得注意的是,雖然Fed最關注的通膨指標、個人消費支出物價指數(PCE)年增率,已從2022年6月的直逼7%,一路降至今年4月的2.7%,但看在Fed主席鮑爾眼中,還是太高。
AI 概念股恐重演當年網路泡沫?當股市漲幅集中少數個股,牛市能延續?
最近 AI 音樂平台遭多家唱片公司控告侵權,令人再次注意到生成式 AI 背後版權爭議。YouTube 正與唱片公司商討 AI 授權,希望避免法律問題。
YouTube 與唱片公司商討授權音樂以訓練 AI 工具,用正規方式支付授權費以緩解音樂業對 AI 的抗拒。YouTube 準備今年推出新生成式 AI 工具「Dream Track」專案,用戶可以文字指示創作音樂,但去年公布後只有十名歌手如 Charli XCX 和 John Legend 願意參加。
YouTube 目標是與「數十名」歌手簽約以新 AI 音樂產生器創作,並與唱片公司商討合作,YouTube 表示,「我們一直在測試新想法並實驗中學習;這是我們創新過程的重要部分」。
YouTube 與唱片公司商討 AI 授權,避免生成式 AI 工具產生法律爭議
輝達(Nvidia)今年乘著人工智慧浪潮,市值一舉贏過蘋果和微軟,躍居全球市值第一高公司,市值突破 3.4 兆美元的晶片巨頭不僅引領 AI 發展,也成為眾多求職者夢寐以求的職場。
輝達全球招募副總裁杜蘭強調,輝達要找的人要有強大數理背景,求職者一定要擅長某技術領域,或有某領域專業知識:機器學習、人工智慧、電腦視覺化、程式設計、深度學習演算法、資料處理或GPU應用等。
匿名工程師也強調,必須具扎實數據結構(data structures)與演算法知識,因輝達最初幾輪面試,寫Code等技術測驗占相當高比例,也會為之後面試大大加分。專業技術測驗不僅是要解決問題,還是展現邏輯思維與拆解複雜難題的機會。
所以不要怕開口,如果能好好運用人脈,請朋友或認識的人「內舉不避親」,不失為很有效的好方法,也為自己爭取多一次機會。杜蘭指出,輝達有非常強大的「員工推薦計畫」,公司也經常參考此計畫做最終決定。
能自信且有條理將之前工作經歷對面試官侃侃而談,是成功的關鍵。匿名工程師說,面試官很看重求職者「說故事的能力」,因此應多在履歷或自我介紹運用「STAR原則」:Situation(情境)、Task(任務)、Action(行動)、Result(結果),好好描述個人故事。
如不要只說製造某樣東西,而是告訴面試官「為什麼」我的團隊能正確打造成果。不只紙上工夫,也必須了解每項專案的實際商業應用,這顯示你不只有解決問題的能力,也能幫公司創造特定價值和潛力。
https://technews.tw/2024/06/30/how-to-get-a-job-at-nvidia/
當中國遊戲界靠〈原神〉大放異彩,台灣遊戲廠商近年卻少有佳作,難以取得銷售佳績。曾推出多款經典遊戲,取得大中華市場眾多玩家的台灣遊戲 IP,如今面臨什麼挑戰?
但市場「武俠沒有死,華人市場對武俠(遊戲)的需求還在」。洪英超指,即使中國遊戲公司,遊戲營收貢獻「仙俠、武俠占比還是高」。以中國遊戲公司網易開發的〈逆水寒〉為例,這款開放世界武俠遊戲,今年初手機遊戲玩家總數破億,顯示玩家對武俠類遊戲的熱情仍在。
只是,如何把武俠遊戲做好,卻比過去難數倍。台灣遊戲產業振興會理事長、宇峻奧汀董事長劉信舉例,以〈仙劍〉所屬的角色扮演遊戲看,「招式打得精采不夠,很多人想看到『虐戀』,〈仙劍〉第一代就是虐了一堆人。」所謂虐戀劇情是種過程曲折、百轉千迴的感情發展,但如今遊戲內容發展成熟、更有串流影音各類影劇影響,要做出讓人驚喜的故事越來越難。「像韓劇常用的車禍、癌症、失憶,看久都會膩,遊戲也不能太公式。」
https://finance.technews.tw/2024/06/30/tw-games-industry/
巴羅神經研究所(Barrow Neurological Institute)執行長 Michael Lawton 表示,美國新創公司 Neuralink 原計畫上週一將設備植入第二名患者體內,但因為患者的健康狀況暫停手術。
Lawton 指出,這名患者的健康狀況不適合參加 Neuralink 的實驗性研究,替補人選預計下個月在巴羅醫院接受手術,「選擇合適的病人非常重要,每個參與其中的人,無論是臨床醫生還是手術醫生,都想把它做好」。Neuralink 沒有對此進行回覆。
這間新創公司設備正處於臨床試驗的早期階段,目的是恢復癱瘓病人的功能。第一位植入該設備的患者是亞利桑那州男性 Noland Arbaugh,他 2016 年因為脊髓受傷四肢癱瘓,如今可用他的意念玩電玩。
本週取消手術的患者患有肌萎縮性脊髓側索硬化症,俗稱「漸凍症」,這種病會導致脊柱和大腦中的神經細胞退化,最終導致肌肉癱瘓。
科羅拉多大學神經外科副教授、前美國食品和藥物管理局官員 Cristin Welle 表示,在不同病因的運動障礙患者身上測試該設備非常有用,了解它在不同情況下的工作原理很有價值。此外,Neuralink 的研究人員還可以招募更多的患者。
https://technews.tw/2024/06/29/neuralink-surgery-brain-implant/