WWDC 2023:蘋果沒說的 AI,早已融入生活當中

2023/06/11閱讀時間約 5 分鐘
每年我最期待的科技盛會,就是蘋果於 6 月初舉行的 WWDC(Worldwide Developers Conference),每次看完 Keynote 跟相關報導、評測之後,總會有種「我們生活的世界又要被改變」的衝擊感。
此次 WWDC 最受到大家矚目的莫過於 Vision Pro 空間電腦裝置,雖然價格、電源等因素讓不少人不看好 Vision Pro 的前景,不過我認為,相較於其他廠商的 VR / AR 頭盔,我從 Vision Pro 當中還是看到了蘋果一貫以來對於產品「高品質」的堅持,以及各項細節的縝密設計。
Tim Cook 在 WWDC23 發表 Apple Vision Pro,象徵空間運算時代的到來。(Apple 提供)

最受矚目的 AI 呢?

綜觀這次發表會,蘋果幾乎沒有提到AI(人工智慧),而是多以 Intelligence(智慧 / 智能)、Machine Learning(機器學習)等名詞稱呼,不過,仔細觀察 iOS 17、macOS Sonoma 的新功能,卻處處可見 AI 蹤影。

語音轉文字(STT)

在發表會進入介紹 iOS 的段落時,蘋果軟體工程資深副總裁 Craig Federighi 表示,電話、FaceTime、訊息等 3 個通訊 App 迎來了大更新。電話的部分,現在可以透過語音轉文字(Speech-to-Text)技術,在不方便接聽的情況下「閱讀」對方的留言;訊息 App 也有類似應用,當對方傳來語音訊息時,iMessage 一樣會透過 STT 技術,把錄音內容轉換成文字,方便瀏覽。
這讓我回想起過去在金融業 IT 部門從事 AI 專案開發的經歷,當時其中一項 AI 專案就是 STT,我因為比較晚加入團隊,所以沒有接觸到該專案,不過我常聽當時的主管提到,為了從事「資料標註」(編按:幫音訊檔案標上文字)的工作,大家耗費了不少耳力、眼力與時間。
反觀現在,STT 技術在一台 3、4 萬元的智慧型手機當中,就已經取得了優異表現,OpenAI 的 WhisperAPI 語音轉文字應用也早已行遍天下,不曉得我當年從事 STT 的勇者同事們現在的心情如何!

鍵盤自動修正(Autocorrect

另一個蘋果宣稱改善的應用是鍵盤自動修正功能,發表會上表示,它的底層使用的是一個名為 Transformer 的模型。沒錯,就是 ChatGPT 的 T 本人!
Transformer 是 2017 年由 Google 提出的一個深度學習模型,後來更衍生出諸如 BERT、GPT 等大型語言模型,成為了建構現在生成式語言模型的重要基礎架構。蘋果雖然沒有像微軟一樣,大張旗鼓地說要讓 Windows 作業系統上面的 Cortana 退場、改以 GPT 模型為基礎的 Copilot 登場,不過新版的 iOS、macOS 等卻處處藏著生成式語言模型的應用。
根據蘋果發表會影片指出,鍵盤自動修正功能除了會根據使用者打字偏好,更有智慧地給予選字建議之外,甚至也會「預測」使用者接下來可能會輸入的文字。
說真的,看到這項功能時,我非常期待,正如前陣子我所撰寫的〈談談「威注音輸入法」的強大之處〉一文指出,由於 Mac 內建注音輸入法實在是不太聰明,造成打字上的諸多困擾,因此我非常期待新版 iOS 17、macOS Sonoma 推出之後,在 AI 的加持下,Mac 內建注音輸入法能夠變得更聰明!

蘋果的 AI 無所不在,融入在你我生活當中

除了上述幾點引起我關注的應用之外,事實上 AI 應用在蘋果生態系裡早已無所不在,尤其自從蘋果裝置全面更換為自家 Apple Silicon 處理器之後,拜「神經網路引擎」所賜,AI 應用愈來愈多元,在 iPhone、iPad、Mac 上面都能得到更加一致的高效表現與卓越效果。
例如這次發表會當中提到的原況貼圖(Live Sticker),基本上就是沿襲去年 iOS 16 的「主體」功能,在「神經網路引擎」驅動下,小小一台手機就能輕鬆執行「物件偵測」的 AI 任務,找出照片中的主體、去除背景,製作成客製化貼圖。
另外,蘋果在視訊軟體上面推出的新功能「發表人覆疊」(Presenter Overlay),能夠讓發表者置於共享畫面的正上方,或是在視訊過程中比讚時,觸發各種特效。這些功能的背後也都是仰賴 AI 運算,尤其是前者,AI 必須清楚知道發表者主體為何,將發表者本人與背景抽離,才能製造出發表者置於畫面正上方、背景置於底層的效果。
左下角為「發表人覆疊」(Presenter Overlay)功能示意圖(Apple 提供)
蘋果並未特別像 Google、微軟一樣,在自家開發者大會上大量提及人工智慧等字詞,而是多番強調使用者隱私與安全,將所有涉及 AI 運算的應用都保留在裝置端執行、透過端對端加密的方式保存,我認為這是因為蘋果一方面不想掉入與其他科技巨頭的 AI 之爭,二方面也是立足於自己長久以來的主場優勢:對於「隱私」議題的重視,走出自己的核心價值。
不過與此同時,蘋果也沒有放棄 AI 應用,而是透過更加生活化、貼近使用者的方式,將 AI 潛移默化地帶入我們的生活中。相較於微軟近期在未經使用者同意的情況下,自動在 Windows 桌面安裝 Bing 搜尋引擎、希望使用者多多使用 Bing AI 問問題,我倒覺得將 AI 融入生活才是最好的應用,畢竟需求是被創造出來的,即便 Bing 搜尋引擎活生生橫躺在我眼前,但如果我沒有發問需求的話,它就只會是一個佔據我桌面空間的垃圾。
總結 2023 年 WWDC,除了令人驚豔的 Vision Pro 之外,蘋果在 AI 戰場的後續發展仍舊值得關注,期待 9 月份新系統上線之後,能帶給使用者嶄新且流暢的體驗!
為什麼會看到廣告
23會員
19內容數
屬於小柏的城邦,他在這裡做自己的主人。
留言0
查看全部
發表第一個留言支持創作者!