測試爭議的核心

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

2026/03/24

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

2026/03/24

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

看完上篇 4 位新成員的靈魂拷問，是不是意猶未盡？別急，野格團新血的驚喜正接著登場！今天下篇接力的另外 4 位「個人主題專家」，戰力同樣驚人──領域從旅行美食、運動、商業投資到自我成長；這些人如何維持長跑般的創作動力？在爆紅的文章背後，又藏著哪些不為人知的洞察？5 大靈魂拷問繼續出擊

2026/03/25

【野格團開箱｜下篇】新血全線集結！5 題靈魂拷問，解鎖「個人主題專家」的創作原力💫

📝📝：測驗拿很高，現實卻無感｜AI 基準值測試仍與現實世界的複雜度不符

2026/03/25

社會人的哲學沉思

AI 基準測試（Benchmark）歷來無法捕捉現實世界中的複雜性，特別是針對 AI 系統可能執行的任務，經常導致對 AI 當前能力和未來影響產生誤導性結論。

#資訊#科技#數據

2025/04/11

社會人的哲學沉思

📝📝：測驗拿很高，現實卻無感｜AI 基準值測試仍與現實世界的複雜度不符

AI 基準測試（Benchmark）歷來無法捕捉現實世界中的複雜性，特別是針對 AI 系統可能執行的任務，經常導致對 AI 當前能力和未來影響產生誤導性結論。

#資訊#科技#數據

2025/04/11

分析師的市場觀點

DeepSeek為何被OpenAI說違法？

圍繞 DeepSeek AI 開發的爭議核心在於指控其從 OpenAI 的專有系統中進行模型蒸餾，引發了知識產權（IP）和 AI 倫理實踐的質疑。以下是詳細分析： OpenAI 的關鍵指控 OpenAI 聲稱 DeepSeek 使用「蒸餾」技術以極低成本複製了 GPT-4o 和 o1-pre

#DeepSeek#GPT-4o#ChatGPT

2025/02/03

分析師的市場觀點

DeepSeek為何被OpenAI說違法？

#DeepSeek#GPT-4o#ChatGPT

2025/02/03

2/3【看一眼 AI】OpenAI 執行長坦承在開源策略上「站在歷史錯誤的一邊」

⭐️ OpenAI 執行長坦承 DeepSeek 縮小 AI 差距，促使 OpenAI 重新思考模型的推理透明度及競爭策略 ⭐️ 由於擔憂用戶資料可能洩露給中國政府，美國已有數百家公司封鎖中國 AI 公司 DeepSeek ⭐️ ChatGPT 推出可以深入資料分析的「深度研究」功能

#AI#生成式AI#OpenAI

2025/02/03

2/3【看一眼 AI】OpenAI 執行長坦承在開源策略上「站在歷史錯誤的一邊」

#AI#生成式AI#OpenAI

2025/02/03

親閱誠福的沙龍

AI的進展到底是好事還是壞事？

OpenAI剛結束了為期十二天的直播，最後一天直接公布了強大的o3模型，在深度思考與推理領域獲得重大進展，甚至在「前沿數學（Frontier Mathematics）」答對25%的題目，之前幾乎所有公司的大模型在這個領域只能答對2%左右 Google也不甘示弱地在期間公布了Veo2，利用文本直

2024/12/30

2024/12/30

外資天風證券看OpenAI發布o3模型及Sora勁敵Veo2整理

-推理能力進一步大幅提升，大幅拉近與人類距離，AGI的重要節點 #推理能力真正接近人類： o3是OpenAI推出的最新大規模推理模型，經過強化學習(RL)訓練，作為o1的進階版本，在通用領域的推理能力上取得了重大突破。該模型在編程能力方面表現出色，CodeForces評分超過2700，達

#外資報告#OPENAI#LLM

2024/12/23

分析師的市場觀點

外資天風證券看OpenAI發布o3模型及Sora勁敵Veo2整理

#外資報告#OPENAI#LLM

2024/12/23

Baozilla, Let's go!

20241119_TechNEws

OpenAI 下代大語言模型「Orion」可能遇上前所未有的瓶頸。The Information 報導，OpenAI 員工稱 Orion 模型性能提升未達預期，與 GPT-3 到 GPT-4 升級相比，品質提升「小很多」。有 Orion 處理某些任務時不比前代 GPT-4 可靠。儘管 Orio

2024/11/19

2024/11/19

實測OpenAI的o1：真沒吹牛，奧數題高考題都能信手拈來了？

OpenAI的o1模型：從"鸚鵡學舌"到"謹慎思考"的AI革命還記得那些讓我們頭疼的奧數題和高考題嗎？現在，一個名為o1的AI模型正在向這些難題發起挑戰。 OpenAI新推出的o1系列模型，似乎預示著人工智能正邁向一個新的階段——從"鸚鵡學舌"到"謹慎思考"。o1模型的核心特徵是提升"高級推理能力

#AI#GPT#OpenAI

2024/09/29

dd luo的沙龍

實測OpenAI的o1：真沒吹牛，奧數題高考題都能信手拈來了？

#AI#GPT#OpenAI

2024/09/29

9/22【看一眼 AI 】來了｜AI教父擔心OpenAI最新的o1模型太會騙人

AI 教父對OpenAI最新的o1模型表達擔憂｜Google 執行長成立 1.2 億美元全球 AI 教育基金｜美國半數州正推動法案規範生成式AI在選舉中的使用

#AI#生成式AI#美國

2024/09/22