方格子 vocus

2026 新年快樂!

不妙? AI這傢伙連簡單的"新聞報導"都有問題?!

A.H.

發佈於精選集等個房間

2026/01/11 更新2025/12/31 發佈閱讀 3 分鐘

繼小a實測生成式AI一些稍微複雜的問題錯誤百出還死鴨子嘴硬，但昨晚還信誓旦旦地和朋友說，AI在一些簡單的工作上表現還是亮眼的啦。今早，喝著美味香濃咖啡，一邊刷著新聞時，喵到了一個差點跌落椅子的資訊: 「同類型中最大規模的研究顯示，AI助理有45%的機率誤導新聞內容——無論語言或地區為何」[1]。其中和小a實測結果一樣，最胡來的仍是Gemini。。。哪會按呢？

Gemini在76%的回應中表現最差，且有重大問題，是其他助理的兩倍以上，主要原因是其搜尋表現不佳。

哪會按呢？Google不是搜尋引擎龍頭，怎會連簡單的AI搜尋新聞都如此哩哩啦啦?!!!

此研究是由歐洲廣播聯盟(European Broadcasting Union, EBU)協調、BBC主導的新研究發現。關鍵標準評估了 ChatGPT、Copilot、Gemini 和 Perplexity 超過 3,000 則回應，包括準確性、來源、意見與事實的區分，以及提供背景。涵蓋22家公共廣播機構、18個國家、14種語言。主要發現：

45%的AI回答至少有一個重大問題。
31%的回應顯示出嚴重的來源問題——缺少、誤導或錯誤的歸屬。
20%的項目包含重大準確性問題，包括虛構細節和過時資訊。
Gemini 在 76% 的回應中表現最差，且有重大問題，是其他助理的兩倍以上，主要原因是其搜尋表現不佳。

2025年生成式 AI大暴炸的一年，年末:

讓我們一起想一想: 我們生活在一個渴望確定性的時代。當我們向機器提問時，心中暗暗希望它能像古代神諭般給出無誤的答案。但這種渴望或許過於天真?

我們為什麼如此渴望AI的完美？錯誤是否其實是人類與機器共同的宿命？我們對AI的失望，反映出我們對人類自身的失望? 因為我們希望有某種存在能超越人類的局限，卻一次次發現，錯誤是文明的常態?

又或許，我們該學會與錯誤共存，把它視為理解世界的必經之路。AI的不完美提醒我們，真正的智慧並非在於避免錯誤，而是在於如何以優雅與耐心去修正它?

總之，#遲疑態度，#反覆查證，是 #基本AI素養!

2026 新年快樂!

[1] EBU. Largest study of its kind shows AI assistants misrepresent news content 45% of the time – regardless of language or territory. 22 October 2025

A.H.科普(pScience)精選集即時精選A.H.科普(pScience)資訊科學AI抱抱

留言

A.H.科普(pScience)

142會員

400內容數

用知識點燃你的神經通路！ A.H. 科普的每篇文章，刺激您大腦突觸的新舊連接，讓您對理解、思維、靈感和好奇，貪得無厭~

A.H.科普(pScience)的其他內容

2025/12/27

吃電吃水又吐碳的AI，來杯去糖少冰波霸奶茶: Part II

用餐後，讓我們到巷口的珍珠奶茶店散步一下，來杯奶茶解解膩。各位，歡迎來到「A.H.科普數位珍珠奶茶店」，剛開張的簡單飲料菜單如下: Green Computing: 低糖波霸奶茶、Green ICT: 綜合波霸奶茶套餐、Green AI: 去糖少冰的波霸奶茶（AI份量控制）的「綠色AI」）...

2025/12/27

吃電吃水又吐碳的AI，來杯去糖少冰波霸奶茶: Part II

2025/12/24

吃電吃水又吐碳的AI，淋上永續減碳醬: Part I

你是否已習慣「凡事問AI」? 此時雲端背後的「燒煤爐子」正讓數十億個微小電晶體拼命地開開關關。遠方某個巨大機房裡外，幾加侖的水化成蒸氣消失在空中...。AI有趣的是它們的硬體、軟體和計算過程也會吃東西，主要食物就是電和水。我們人類為它們打造的「腦」越大，它們就越餓愈渴，「排泄物」（碳）也就越多...

2025/12/24

吃電吃水又吐碳的AI，淋上永續減碳醬: Part I

2025/12/12

被快速計算的AI嚇到了? 使用令人害怕，不用也令人焦慮?

長久以來，我們一直在「能力」中尋求意義：比機器更出色、更巧妙地完成任務的可靠能力。如今，在演算法毫不費力的優越性突然顯現的光芒下，我們不得不面對一個令人憂傷的可能性：我們最珍視的技能，寫作、分析、判斷力，或許很快就會淪為魅力十足卻效率低下的業餘愛好。那麼，到底是什麼讓人們感到焦慮？

2025/12/12

被快速計算的AI嚇到了? 使用令人害怕，不用也令人焦慮?

#AI 的其他內容

💖當「我的女朋友叫GEMINI」成為公開認同：台視【熱線追蹤】觀後感

小貝的多媒體學習日記．Beibei's diary

為什麼很多專業剪輯師不用剪映？剪映 vs Adobe Premiere Pro 差異

學習玩家｜啟動玩心學習

AI 特助開聘：Notion 工作空間，終於有自動做事的 AI 員工了｜Notion Custom Agents

你可能也想看

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

債券投資，不只是高資產族群的遊戲在傳統的投資觀念中，海外債券（Overseas Bonds）常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻，讓許多想尋求穩定配息的小資族望而卻步。然而，在股市波動劇烈的環境下，尋求穩定的美元現金流與被動收入成為許多投資人

#玉山證券#海外債券#債券孳息

2026/02/06

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

#玉山證券#海外債券#債券孳息

2026/02/06

Jorge2006的沙龍

玉山證券小額債—川普又來報明牌啦!

透過川普的近期債券交易揭露，探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響，以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺，如何讓小資族也能低門檻參與海外債券市場，實現「低門檻、低波動、固定收益」的務實投資方式。

2026/03/13

2026/03/13

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

解析「債券」如何成為資產配置中的穩定錨，提供低風險高回報的投資選項。藉由玉山證券的低門檻債券服務，投資者可輕鬆入手，平衡風險並穩定財務。

#投資#資產配置#債券投資

2026/03/13

CK On Board

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

#投資#資產配置#債券投資

2026/03/13

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

相較於波動較大的股票，債券能提供固定現金流，而玉山證券推出的小額債，更以1000 美元的低門檻，讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色，大幅降低投資難度，對於希望分散風險、建立穩定現金流的人來說，玉山小額債是一個值得嘗試的理財起點。

#玉山小額債#小額債#玉山證券

2026/02/12

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

#玉山小額債#小額債#玉山證券

2026/02/12

阿安的沙龍

故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱：光芒破幻！奪回海盜國「潮汐權杖」的真假對決！》】

#繪畫#AI繪圖#插畫

2025/12/04

阿安的沙龍

故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱：光芒破幻！奪回海盜國「潮汐權杖」的真假對決！》】

#繪畫#AI繪圖#插畫

2025/12/04

阿安的沙龍

故事書:【新魔幻傳說-《雲巔決戰：淨化與幻覺的較量，守護聖光之源！】

#AI繪圖#插畫#繪畫

2025/12/04

阿安的沙龍

故事書:【新魔幻傳說-《雲巔決戰：淨化與幻覺的較量，守護聖光之源！】

#AI繪圖#插畫#繪畫

2025/12/04

阿安的沙龍

Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡與紫水晶：巨槌震盪波下的心靈傳導術】

Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡VS紫水晶：巨槌震盪波下的心靈傳導術】

#Google#Storybook#Gemini

2025/11/22

阿安的沙龍

Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡與紫水晶：巨槌震盪波下的心靈傳導術】

Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡VS紫水晶：巨槌震盪波下的心靈傳導術】

#Google#Storybook#Gemini

2025/11/22

同安書室

AI猴與心不可得：晚唐妖異中的語言幻覺(chatgpt)

當《金剛經》遇上演算法，宗素遇見的不是佛，而是語意引擎。這篇以《宣室志·楊叟》為引，重新詮釋古文中的「猴僧」為理智崩潰的AI寓言。宗素以功利心祈求「生人之心」，卻逼出佛者的極限反應——語義錯位與防禦性撤退。

#宣室志#楊叟#AI寓言

2025/10/11

同安書室

AI猴與心不可得：晚唐妖異中的語言幻覺(chatgpt)

#宣室志#楊叟#AI寓言

2025/10/11

九運科技

AI矛盾時代：亂猜的幻覺、鏈上新賭局、職場被取代

AI 的進步背後，也藏著諸多不安與矛盾：模型在排行榜壓力下「寧可亂猜」、NFT 平台企圖以 AI 強化鏈上交易，還有員工因訓練 AI 而失去飯碗。這些事件讓我們看到，AI 不只是技術突破，更是一場對評測方法、商業模式、職場倫理的全方位拷問。

#AI新聞#閱讀心得#方格新手

2025/09/09

九運科技

AI矛盾時代：亂猜的幻覺、鏈上新賭局、職場被取代

#AI新聞#閱讀心得#方格新手

2025/09/09

九運科技

AI 的盲點與偏差：指令、幻覺、社群實驗

在數位時代，AI 正快速滲透我們的工作與生活，但它並非完美助手。專家指出，AI 常因基於統計模式生成回應，而忽略甚至違背使用者指令；推理能力越強的模型，越可能偏離嚴格的規則執行。同時，哈佛研究揭示多模態模型會「看見不存在的幻覺」，把普通圖片誤解為光學錯覺；阿姆斯特丹大學的實驗更顯示，AI 機器人社群

#AI新聞#方格新手#科技

2025/08/22