📝📝:AI 生成的科學論文首度通過同行審查|AI 科學家 v2 將導入加速科學界的研究

更新於 發佈於 閱讀時間約 5 分鐘
由 Leonardo AI 生成

由 Leonardo AI 生成



本文翻譯自日本 AI 新創公司 Sakana AI(サカナAI)的兩篇研究,分別是《The AI Scientist Generates its First Peer-Reviewed Scientific Publication》以及《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery


AI 與科學研究領域迎來了一個劃時代的時刻。

由 AI 科學家(The AI Scientist V2)完全生成的一篇論文成功通過了 2025 年國際學習表徵會議(International Conference on Learning Representations, ICLR)研討會的同行評審過程。

據開發者 Sakana.ai 所述,這是第一篇完全由 AI 生成並經過標準同行評審程序的論文,這項成就展現了 AI 在學術研究中的日益增強的能力,並引發了關於 AI 在科學發現中的未來角色的重要討論。

這篇論文是由 AI 科學家(The AI Scientist)的升級版本 — — AI 科學家 v2 所生成的。




本次實驗是在 ICLR 領導層、研討會組織者以及英屬哥倫比亞大學(University of British Columbia, UBC)機構審查委員會(IRB)的全力合作下進行的。

此研究不僅展示了 AI 生成研究的潛力,也強調了 AI 科學家在學術界接受度方面的倫理考量。


同行評審過程:AI vs. 人類研究

為了評估 AI 生成研究的品質,研究團隊向 ICLR 研討會提交了三篇完全由 AI 生成的論文。

評審員被告知可能有 AI 生成的論文,但並不知道自己審閱的論文是否由 AI 撰寫。AI 科學家 v2 負責整個研究過程,包括假設生成、實驗設計、程式執行、數據分析及論文撰寫,全程沒有任何人工干預,除了選定研究主題。

在提交的三篇 AI 生成論文中,有一篇獲得了超過接受門檻的評分,具體評分如下:

  • 評分:6 略高於接受門檻(Marginally above acceptance threshold)
  • 評分:7 優秀論文,應該接受(Good paper, accept)
  • 評分:6 略高於接受門檻(Marginally above acceptance threshold)


這些評分使 AI 生成論文排名前 45%,高於研討會內許多人類撰寫並被接受的論文。然而,根據實驗協議,所有 AI 生成論文在發表前均被撤回,以維護研究的透明性與倫理性。

AI 科學家 v2 負責整個研究過程,包括假設生成、實驗設計、程式執行、數據分析及論文撰寫。由 Leonardo AI 生成

AI 科學家 v2 負責整個研究過程,包括假設生成、實驗設計、程式執行、數據分析及論文撰寫。由 Leonardo AI 生成


AI 科學家的倫理考量與透明度

這項研究引發了關於 AI 生成科學研究的倫理和程序性問題。

儘管 AI 科學家 v2 能夠達到同行評審標準,但科學界尚未決定是否應將 AI 生成的論文與人類撰寫的論文一同發表。透明度仍是關鍵,未來的討論應關注 AI 生成內容應如何揭露,以及應如何與人類撰寫的研究進行評比。

為了確保透明度,這些 AI 生成的論文未在 OpenReview 平台公開。

這一決策是由 ICLR 組織者、研討會領導者和研究團隊共同作出的,目的是避免 AI 生成論文在學術界尚未制定明確規範之前,對同行評審程序產生潛在影響。



AI 生成研究的挑戰與局限

儘管這項研究取得了突破性進展,但 AI 生成論文仍然存在一定的局限性。

獲得接受的論文是提交至研討會(seminar),而非 ICLR 主會議。主會議的接受率約為 20–30%,而研討會的接受率則約為 60–70%。這表明 AI 生成的研究仍需進一步提升,才能達到頂級學術會議的標準。

此外,人類研究團隊對 AI 生成的三篇論文進行了內部審查,結果顯示沒有一篇符合 ICLR 主會議的標準。AI 科學家還出現了一些錯誤,例如在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow(2016),而非正確的作者 Hochreiter 和 Schmidhuber(1997)。

另一個局限性在於 AI 科學家主要基於最先進的大型語言模型(LLM)。其表現直接取決於這些基礎模型的發展。如果未來基礎模型持續進步,那麼 AI 科學家的研究能力也將隨之提高。

AI 科學家在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow(2016)。來源:Sakana.ai

AI 科學家在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow(2016)。來源:Sakana.ai





AI 在科學發現的未來

AI 科學家 v2 的成功代表了 AI 生成研究的一個重要進展,但這僅僅是開始。未來的 AI 研究助手可能能夠產出品質更高的論文,甚至達到人類研究員的水準,獲得頂級科學會議和權威期刊的認可。

最終目標並非用 AI 取代人類科學家,而是加速科學發現

如果 AI 能夠產生並驗證新的研究成果,可能促成醫學、物理學等領域的重大突破。未來的關鍵問題不僅在於 AI 生成的研究能否通過同行評審,更在於這些 AI 驅動的發現如何促進人類知識的進步與福祉

透過持續討論 AI 生成研究的透明性和倫理問題,科學界可以確保 AI 成為推動創新的工具,而非影響學術誠信的挑戰者。AI 科學的未來充滿潛力,在適當的指導下,將成為擴展人類知識疆界的重要夥伴。








留言
avatar-img
留言分享你的想法!
avatar-img
社會人的哲學沉思
132會員
280內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2025/04/25
大型語言模型以自然的節奏說話,表達好奇心,甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實: 這些 AI 系統根本不具備這些人類特質。
Thumbnail
2025/04/25
大型語言模型以自然的節奏說話,表達好奇心,甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實: 這些 AI 系統根本不具備這些人類特質。
Thumbnail
2025/04/22
「懶惰原住民」(the Lazy Native)的迷思並非自然形成,而是殖民當局帶著明確的意識形態意圖精心打造的。
Thumbnail
2025/04/22
「懶惰原住民」(the Lazy Native)的迷思並非自然形成,而是殖民當局帶著明確的意識形態意圖精心打造的。
Thumbnail
2025/04/18
KK 指出,AI 的長期影響將超過電力與火的發明,但這個變革需要數百年來逐步展現。
Thumbnail
2025/04/18
KK 指出,AI 的長期影響將超過電力與火的發明,但這個變革需要數百年來逐步展現。
Thumbnail
看更多
你可能也想看
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具,可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯
Thumbnail
這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具,可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News