vocus logo

方格子 vocus

不妙? AI這傢伙連簡單的"新聞報導"都有問題?! 

A.H.-avatar-img
發佈於精選集 個房間
更新 發佈閱讀 3 分鐘
raw-image

繼小a實測生成式AI一些稍微複雜的問題錯誤百出還死鴨子嘴硬,但昨晚還信誓旦旦地和朋友說,AI在一些簡單的工作上表現還是亮眼的啦。今早,喝著美味香濃咖啡,一邊刷著新聞時,喵到了一個差點跌落椅子的資訊: 「同類型中最大規模的研究顯示,AI助理有45%的機率誤導新聞內容——無論語言或地區為何[1]。其中和小a實測結果一樣,最胡來的仍是Gemini。。。哪會按呢? 

Gemini在76%的回應中表現最差,且有重大問題,是其他助理的兩倍以上,主要原因是其搜尋表現不佳

哪會按呢?Google不是搜尋引擎龍頭,怎會連簡單的AI搜尋新聞都如此哩哩啦啦?!!! 

此研究是由歐洲廣播聯盟(European Broadcasting Union, EBU)協調、BBC主導的新研究發現。關鍵標準評估了 ChatGPT、Copilot、Gemini 和 Perplexity 超過 3,000 則回應,包括準確性、來源、意見與事實的區分,以及提供背景。涵蓋22家公共廣播機構、18個國家、14種語言。主要發現: 

  • 45%的AI回答至少有一個重大問題。
  • 31%的回應顯示出嚴重的來源問題——缺少、誤導或錯誤的歸屬。
  • 20%的項目包含重大準確性問題,包括虛構細節和過時資訊。
  • Gemini 在 76% 的回應中表現最差,且有重大問題,是其他助理的兩倍以上,主要原因是其搜尋表現不佳。

2025年生成式 AI大暴炸的一年,年末:

讓我們一起想一想: 我們生活在一個渴望確定性的時代。當我們向機器提問時,心中暗暗希望它能像古代神諭般給出無誤的答案。但這種渴望或許過於天真?

我們為什麼如此渴望AI的完美?錯誤是否其實是人類與機器共同的宿命?我們對AI的失望,反映出我們對人類自身的失望? 因為我們希望有某種存在能超越人類的局限,卻一次次發現,錯誤是文明的常態? 

又或許,我們該學會與錯誤共存,把它視為理解世界的必經之路。AI的不完美提醒我們,真正的智慧並非在於避免錯誤,而是在於如何以優雅與耐心去修正它? 

總之,#遲疑態度,#反覆查證 ,是 #基本AI素養!

2026 新年快樂!


[1] EBU. Largest study of its kind shows AI assistants misrepresent news content 45% of the time – regardless of language or territory. 22 October 2025

留言
avatar-img
A.H.科普(pScience)
142會員
400內容數
用知識點燃你的神經通路! A.H. 科普的每篇文章,刺激您大腦突觸的新舊連接,讓您對理解、思維、靈感和好奇,貪得無厭~
A.H.科普(pScience)的其他內容
2025/12/27
用餐後,讓我們到巷口的珍珠奶茶店散步一下,來杯奶茶解解膩。各位,歡迎來到「A.H.科普數位珍珠奶茶店」,剛開張的簡單飲料菜單如下: Green Computing: 低糖波霸奶茶、Green ICT: 綜合波霸奶茶套餐、Green AI: 去糖少冰的波霸奶茶(AI份量控制)的「綠色AI」)...
Thumbnail
2025/12/27
用餐後,讓我們到巷口的珍珠奶茶店散步一下,來杯奶茶解解膩。各位,歡迎來到「A.H.科普數位珍珠奶茶店」,剛開張的簡單飲料菜單如下: Green Computing: 低糖波霸奶茶、Green ICT: 綜合波霸奶茶套餐、Green AI: 去糖少冰的波霸奶茶(AI份量控制)的「綠色AI」)...
Thumbnail
2025/12/24
你是否已習慣「凡事問AI」? 此時雲端背後的「燒煤爐子」正讓數十億個微小電晶體拼命地開開關關。遠方某個巨大機房裡外,幾加侖的水化成蒸氣消失在空中...。AI有趣的是它們的硬體、軟體和計算過程也會吃東西,主要食物就是電和水。我們人類為它們打造的「腦」越大,它們就越餓愈渴,「排泄物」(碳)也就越多...
Thumbnail
2025/12/24
你是否已習慣「凡事問AI」? 此時雲端背後的「燒煤爐子」正讓數十億個微小電晶體拼命地開開關關。遠方某個巨大機房裡外,幾加侖的水化成蒸氣消失在空中...。AI有趣的是它們的硬體、軟體和計算過程也會吃東西,主要食物就是電和水。我們人類為它們打造的「腦」越大,它們就越餓愈渴,「排泄物」(碳)也就越多...
Thumbnail
2025/12/12
長久以來,我們一直在「能力」中尋求意義:比機器更出色、更巧妙地完成任務的可靠能力。如今,在演算法毫不費力的優越性突然顯現的光芒下,我們不得不面對一個令人憂傷的可能性:我們最珍視的技能,寫作、分析、判斷力,或許很快就會淪為魅力十足卻效率低下的業餘愛好。 那麼,到底是什麼讓人們感到焦慮?
Thumbnail
2025/12/12
長久以來,我們一直在「能力」中尋求意義:比機器更出色、更巧妙地完成任務的可靠能力。如今,在演算法毫不費力的優越性突然顯現的光芒下,我們不得不面對一個令人憂傷的可能性:我們最珍視的技能,寫作、分析、判斷力,或許很快就會淪為魅力十足卻效率低下的業餘愛好。 那麼,到底是什麼讓人們感到焦慮?
Thumbnail
看更多
你可能也想看
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
債券投資,不只是高資產族群的遊戲 在傳統的投資觀念中,海外債券(Overseas Bonds)常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻,讓許多想尋求穩定配息的小資族望而卻步。 然而,在股市波動劇烈的環境下,尋求穩定的美元現金流與被動收入成為許多投資人
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
透過川普的近期債券交易揭露,探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響,以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺,如何讓小資族也能低門檻參與海外債券市場,實現「低門檻、低波動、固定收益」的務實投資方式。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
解析「債券」如何成為資產配置中的穩定錨,提供低風險高回報的投資選項。 藉由玉山證券的低門檻債券服務,投資者可輕鬆入手,平衡風險並穩定財務。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
相較於波動較大的股票,債券能提供固定現金流,而玉山證券推出的小額債,更以1000 美元的低門檻,讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色,大幅降低投資難度,對於希望分散風險、建立穩定現金流的人來說,玉山小額債是一個值得嘗試的理財起點。
Thumbnail
故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱:光芒破幻!奪回海盜國「潮汐權杖」的真假對決!》】
Thumbnail
故事書:【新魔幻傳說-《海市蜃樓的黏性陷阱:光芒破幻!奪回海盜國「潮汐權杖」的真假對決!》】
Thumbnail
故事書:【新魔幻傳說-《雲巔決戰:淨化與幻覺的較量,守護聖光之源!】
Thumbnail
故事書:【新魔幻傳說-《雲巔決戰:淨化與幻覺的較量,守護聖光之源!】
Thumbnail
Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡VS紫水晶:巨槌震盪波下的心靈傳導術】
Thumbnail
Storybook故事書:新魔幻傳說-傑克與愛麗絲的奇幻冒險記-【幻覺破解鏡VS紫水晶:巨槌震盪波下的心靈傳導術】
Thumbnail
當《金剛經》遇上演算法,宗素遇見的不是佛,而是語意引擎。 這篇以《宣室志·楊叟》為引,重新詮釋古文中的「猴僧」為理智崩潰的AI寓言。宗素以功利心祈求「生人之心」,卻逼出佛者的極限反應——語義錯位與防禦性撤退。
Thumbnail
當《金剛經》遇上演算法,宗素遇見的不是佛,而是語意引擎。 這篇以《宣室志·楊叟》為引,重新詮釋古文中的「猴僧」為理智崩潰的AI寓言。宗素以功利心祈求「生人之心」,卻逼出佛者的極限反應——語義錯位與防禦性撤退。
Thumbnail
AI 的進步背後,也藏著諸多不安與矛盾:模型在排行榜壓力下「寧可亂猜」、NFT 平台企圖以 AI 強化鏈上交易,還有員工因訓練 AI 而失去飯碗。這些事件讓我們看到,AI 不只是技術突破,更是一場對 評測方法、商業模式、職場倫理 的全方位拷問。
Thumbnail
AI 的進步背後,也藏著諸多不安與矛盾:模型在排行榜壓力下「寧可亂猜」、NFT 平台企圖以 AI 強化鏈上交易,還有員工因訓練 AI 而失去飯碗。這些事件讓我們看到,AI 不只是技術突破,更是一場對 評測方法、商業模式、職場倫理 的全方位拷問。
Thumbnail
在數位時代,AI 正快速滲透我們的工作與生活,但它並非完美助手。專家指出,AI 常因基於統計模式生成回應,而忽略甚至違背使用者指令;推理能力越強的模型,越可能偏離嚴格的規則執行。同時,哈佛研究揭示多模態模型會「看見不存在的幻覺」,把普通圖片誤解為光學錯覺;阿姆斯特丹大學的實驗更顯示,AI 機器人社群
Thumbnail
在數位時代,AI 正快速滲透我們的工作與生活,但它並非完美助手。專家指出,AI 常因基於統計模式生成回應,而忽略甚至違背使用者指令;推理能力越強的模型,越可能偏離嚴格的規則執行。同時,哈佛研究揭示多模態模型會「看見不存在的幻覺」,把普通圖片誤解為光學錯覺;阿姆斯特丹大學的實驗更顯示,AI 機器人社群
Thumbnail
AI 的最新發展再次展現多面向的影響力:Google 的神秘 AI 編輯器「Nano Banana」引爆熱議,帶來影像編輯新體驗;台灣氣象署則運用 AI 技術推出大浪預警系統,守護沿岸安全;同時,研究發現 AI 在圖像識別上存在「誤判幻覺」的風險,再次提醒我們技術仍需調整。
Thumbnail
AI 的最新發展再次展現多面向的影響力:Google 的神秘 AI 編輯器「Nano Banana」引爆熱議,帶來影像編輯新體驗;台灣氣象署則運用 AI 技術推出大浪預警系統,守護沿岸安全;同時,研究發現 AI 在圖像識別上存在「誤判幻覺」的風險,再次提醒我們技術仍需調整。
Thumbnail
最近內娛粉圈熱議的話題是DeepSeek給男藝人道歉的謠言,屬於典型的AI幻覺案例,男藝人粉圈為了洗白男藝人的桃色醜聞,通過誘導性提問,使AI模型生成承諾道歉賠償等虛構內容,粉圈拿著AI道歉來闢謠,而媒體不查證DeepSeek官方是否發布相關道歉聲明就直接傳播後形成假新聞循環。
Thumbnail
最近內娛粉圈熱議的話題是DeepSeek給男藝人道歉的謠言,屬於典型的AI幻覺案例,男藝人粉圈為了洗白男藝人的桃色醜聞,通過誘導性提問,使AI模型生成承諾道歉賠償等虛構內容,粉圈拿著AI道歉來闢謠,而媒體不查證DeepSeek官方是否發布相關道歉聲明就直接傳播後形成假新聞循環。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News