這是無限思維的第一篇,這篇文章我會跟大家介紹無限思維的初步概念,預計還會有很多篇,無限思維這個詞是微軟CEO Satya Nadella在訪談中引用Notion CEO的新概念,喬布斯曾經用思維的腳踏車比喻電腦,比爾蓋茲曾說電腦是觸手可及的資訊,微軟CEO則說我們當前需要一個新的比喻,而他認為最恰當的比喻是我們即將成為「無限思維的管理者」(Manager of Infinite Mind)。
我們來做個思想實驗,當你的工作可以指派給程式、人工智慧、agent執行,那你的工作就會變成思維的管理者,未來的工作將會變成「宏觀指導」、「微觀指派」,整個工作流程會引入大量的自動化,人類或人工智慧會將工作拆小後指派給人工智慧,人類負責審查人工智慧的成果,在進行指導修正不滿意或是錯誤的部分。
實際上這已不是思想實驗,而是已經存在的現實。
過去數十年,知識型工作者的價值建立在「處理資訊的熟練度」上,我們閱讀、摘錄、分析、撰寫,周而復始。然而,當生成式 AI 以前所未有的速度跨越了「結構化」與「非結構化」資訊的鴻溝時,人類工作的本質發生了範式轉移(Paradigm Shift)。
在知識密集的勞動中,工作的本質就是處理資訊,舉例而言:律師接受客戶的委託,溝通釐清客戶的需求,這個行為本身就是將聲音在腦中抽象化成文字,修剪不重要的部分,釐清客戶的「語意」。閱讀相關的法條與判例,抽出其中的語意,接著根據直覺與專業,在腦中檢索可用的法條與判例,替客戶辯護。
現實生活中的所有工作都跟資訊有關,但資訊的性質與類別各有不同,要更詳細的探討什麼是資訊才能夠理解什麼是無限思維。
資訊的本質
資訊基本上可以分為結構化與非結構化的,表格類就是高度結構化的,文字訊息則沒有那麼結構化。但這樣的二分化仍然不足以使我們理解事物的本質,我們需要更細分的性質去描述資訊。
傳統資訊科學中將「資料」轉化為「資訊」的線性描述,已不足以支撐我們在 AI 時代對工作的理解。在過去,我們習慣將一切未整理的雜訊視為資料,整理後的成果視為資訊,但這種分類忽略了資訊內部的層次感。同樣一份資料在不同維度的觀察下,會呈現完全不同的意義與處理難度。例如:一張發票在計算機眼中只是二進位的像素點(物理結構),在視覺算法眼中是線條與區塊的組合(模式結構),但在律師或會計師眼中,它卻是支撐某項辯護或財務決策的關鍵證據(語義結構)。
唯有透過「物理、模式、語義」這三重結構的拆解,我們才能看清:為什麼人類過去感到疲憊,是因為我們被迫在底層的物理與模式處理中耗費了大量生命,而無限思維的核心,正是要將這些低維度的負擔交還給系統,讓人類重回語義的殿堂。
以發票為例,最底層的物理結構就像是無數漂浮的原子或光子,將發票歸檔時,我們會把發票拍起來,此時發票變成一張帶有幾百萬個 RGB 像素的圖片。對電腦來說,資訊是完全散亂的,電腦只負責儲存哪個像素在哪個位置,一張發票的照片跟一張可愛的貓咪照片,在本質上是一樣的,只是一堆數字的排列組合。
但當我們進入模式結構時,這些像素不再是孤立的點,它們透過排列組合,形成了一條橫線、一個矩形方框,或者是特定形狀的色塊。我們開始可以辨識出照片裡面有文字,照片裡是一隻動物。多模態人工智慧與人類都能夠抽取模式結構,你知道發票上是一堆數字與文字,你知道貓咪有一對耳朵。看到照片中就可以在我們的思維中形成分類。不過這仍然不夠,我們還要繼續從照片中抽取語意,理解語意才會形成現實世界中的因果關係。
最後我們來到了語義結構,這才是資訊真正的靈魂所在。這是將辨識出的模式,強行映射到現實世界的因果網絡中。語義結構回答的是「這件事與我有什麼關係」。那張發票是我昨天買晚餐的時候拿到的,這張貓咪的照片是我的寵物。現實生活中有經濟價值的活動大部分都與語意有關,而AI特別擅長抽取語意。
AI擅長什麼
希臘神話中,存在著一種半人半馬的怪物,他們的上半身是人的軀幹,下半身則是馬身,也包括腰部和四腿,亦稱人頭馬、山杜爾族。他們大多是蠻橫不講道理,粗俗的代表。但在AI時代,半人馬式的協作反而是最有效率的。
半人馬式的協作代表,使用AI的人清楚AI擅長與不擅長什麼。知道人類與AI的能力互補之處,在處理資訊的時候,將瑣碎消耗認知的事情指派給AI,在需要因果推理的部分人類拿回主導權,人工智慧將成為你手跟腳,而要用手腳做什麼是仍然是大腦來掌控。

鋸齒狀智慧
當前的人工智慧被稱為AJI (Artificail Jagged Intelligence),藍色的圓圈是人類的能力覆蓋範圍,鋸齒狀的則是人工智慧的能力範圍,隨著訓練與研究進步,人工智慧的覆蓋範圍越來越大,在某些部分遠超人類,但有些對人類來說很簡單的事情,人工智慧表現得又完全不如人類。
以下是我認為大語言模型擅長的工作
- 資料搜集
- 語意壓縮、語意擴增
- 非結構化資料轉結構化 (圖片轉表格)
- 模糊意圖的形式化 (自然語言轉程式碼)
大語言模型的本質是透過將海量資料學習到的文字分佈壓縮近無數個參數中,當你今天不太確定一些工作會用到什麼概念時,只要你想搜集的資料都在預訓練資料內,LLM可以快速幫你釐清你需要知道的。當不在預訓練資料內時,只要外掛搜集引擎的工具給LLM調用,比如說你想知道一個近期發佈的新產品好不好用時,LLM可以透過搜尋引擎大量查閱相關評論與介紹,接著將那些的「語意」壓縮給你,讓你不用每一個文章都點進去看。
雖然看起來三個類別有點少,但如果仔細想,我們人類的工作就是由這幾種工作的排列組合組出來的。當我們有意識的認知到哪些工作可以交給人工智慧的時候,工作的生產力會快速提升。過去半人馬的形象是粗俗蠻橫不講理,但作為一個無限思維的管理者,半人馬的工作模式反而成為一種典範。
值得注意的是,很多人可能覺得人工智慧有很多事情還做不到,有三種可能。
- 指令不夠精準
- 流程定義不明確
- 人工智慧真的還做不到
對大多數人的案例來說,都是前兩者,只要你的任務不是什麼複雜的問題(數學上不是NP-Hard),只要你能夠把問題拆成足夠的小問題,接著把小問題的流程接起來,只要不存在安全性考量的情況下,基本上多數人的工作都可以被一個完整的工作流取代。很多人可能覺得AI會取代人類,錯了,是會用AI的人會取代你。每個人的工作都是部份能被AI取代的,隨著職業差別比例有所不同,如果我們懂的利用AI超越人類的能力,將消耗認知的部分交給人工智慧,人類則可以將更多的心力放在更高價值的問題上。
在未來每個人都會是指揮家。
這個沙龍之後應該會轉型成專注於科普人工智慧,分享好用的工具與工作流程,協助大家搭建自動化的工作流,教大家判別什麼工作應該交給AI,也會定期分享Antrophic跟OpenAI的研究報告,還有人工智慧領域的大神他們怎麼看待人工智慧的。如果你對這個議題感興趣的話,可以加入我的會員。我會定期更新無限思維這個主題。















