對 AI 模型進行「人類的最後考試」（目前 DeepSeek 還無法勝出）

發佈於AI

2025/02/05 更新2025/02/05 發佈閱讀 2 分鐘

人類最後的考試（Humanity's Last Exam），這是一個處於人類知識前沿的多模態基準測試，旨在成為同類型中最後一個封閉式學術基準測試，並涵蓋廣泛的學科範圍。該資料集包含來自 100 多個學科的 3,000 道高難度問題。

原文：https://agi.safe.ai/

真的非常困難

可以參考其中提到的範例問題：

屬於雨燕目（Apodiformes）的蜂鳥（Hummingbirds）獨特地擁有一塊雙側成對的橢圓形籽骨（sesamoid），該籽骨嵌入擴展的十字形肌腱膜（cruciate aponeurosis）內，位於尾部下壓肌（m. depressor caudae）附著處的尾側外部（caudolateral portion）。這塊籽骨支撐了多少對肌腱？請以數字作答
- Edward V
Massachusetts Institute of Technology

再看一下裡面提到的測試結果：

目前 DeepSeek 還無法勝出

看來現在已經從晶片戰爭進入 AI 戰爭了

我的想法：

科技巨頭為了維持優勢，必須持續投入高資本訓練更優秀的模型，目前還沒有看到會被取代的可能。
低成本 DeepSeek 能夠讓 AI 深入尋常百姓家，可預見的未來是將會完全普及，成為基本款。
未來的 AI 戰場不在中低階應用，全是高階，或是專業領域的專用模型。只要是領域的專家又斜槓 AI，就會吃到紅利。

歡迎交流。

Mr. Colin 清醒者的現實校準室AI

留言

Mr. Colin 清醒者的現實校準室

43會員

212內容數

外商職場文化與趨勢觀察，分享成長型思維觀點；記錄「男生也要好好保護自己」的保護令申請經過、訴訟對抗《不合理的》最小變動與幼兒從母原則；串連菁英大腦，歡迎加入交流，或贊助支持 Mr. Colin。

Mr. Colin 清醒者的現實校準室的其他內容

2025/02/01

LinkedIn Learning 證書第一張入手

這個農曆年假期受到 DeepSeek 新聞的刺激我完成了第一堂由微軟跟領英合開的線上課程：Career Essentials in Generative AI 並且通過測驗取得領英跟微軟共同頒發的證書

2025/02/01

LinkedIn Learning 證書第一張入手

2023/04/23

看清AI時代下的稀缺

在大者恆大的世界裡，各項資源分配的集中度已經逐漸移往極端值的兩側，而現行已經掌握注意力分配的資訊曝光平台、技術或服務公司、政府、社交媒體，未來AI的運用會加強對於受眾或使用者的黏著度，而當注意力已經習慣性被集中時，未來稀缺的資源將由注意力轉移到信任感。因為信任感，自然能帶來注意力的紅利。

2023/04/23

看清AI時代下的稀缺

2023/04/19

人工智慧博覽會 AI EXPO Taiwan 2023/4/19 - 半導體相關演講摘要

只參加有興趣的半導體相關演講，第一手摘要：地點：台北華山文創園區 Legacy 10:00-10:20 生成式 AI - 驅動創新的全新動能 NVIDIA資深協理康勝閔 10:40-11:00 AI 開啟 IC半導體黃金時代聯發科技股份有限公司前瞻技術平台資深處長梁伯嵩博士

2023/04/19

人工智慧博覽會 AI EXPO Taiwan 2023/4/19 - 半導體相關演講摘要

看更多

你可能也想看

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

若鴉漫飛

了解人工智慧的第一本書

或說，把這本書取名為「猴子也能懂的人工智慧」也有過之而無不及。作者松尾豐教授長年深耕人工智慧的研究與開發，並且經歷AI發展史上的大起大落。之所以著作本書，與其說是推廣或科普人工智慧的知識，不如說是提供務實的資訊與評估，讓那些拿著大把鈔票的資本家們，不會抱有過高的期待，反而耽誤了人工智慧的發展...

2023/01/17

2023/01/17

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11