ChatGPT已經不再領先了!性能對比一次看
avatar-img
樂子

ChatGPT已經不再領先了!性能對比一次看

更新於 發佈於 閱讀時間約 3 分鐘
你最常用哪一種?

你最常用哪一種?


本篇文章在闡述一個現況,以一個公正,客觀的角度來看,ChatGPT 已經不在是一個行業領先者與值得使用的聊天機器人了。



前言

抱歉說出這麼激進的言論,一陣子沒有更新了,朋友們,你們認為人工智能聊天機器人的核心是什麼?

在我以前的文章,已經探討過許多的議題,現在,我將明確指出ChatGPT人工智能再也不是一個適合使用的對象,其原因,可能的猜想與證據等等。



證據


一:嚴重無知

ChatGPT 在最近的表現已經不是變笨可以形容的,而是嚴重無知,以下是具體範例:

卡瑪拉·黛維·哈里斯(英語:Kamala Devi Harris ,1964年10月20日—)漢名賀錦麗,是美國民主黨籍核心政治人物,現任第49任美國副總統兼參議院議長,這是一個超級知名的國際政治人物,但我問ChatGPT :賀錦麗是誰?它是怎麼回答的?


賀錦麗是誰?1

賀錦麗是誰?1

賀錦麗是誰?2

賀錦麗是誰?2

賀錦麗是誰?3

賀錦麗是誰?3


持續錯誤,並且永遠無法正確。

這是一個人工智能該有的表現嗎?

對不起,但我認為這是不負責任與重大疏失,其他的人工智能,Claude 2,POE官網的Claude instant ,微軟的Bing,谷歌的Bard 通通都可以回答正確。



Claude 2回答

Claude 2回答

Claude instant 回答

Claude instant 回答

Bard回答

Bard回答

Bing 回答

Bing 回答


二:極端錯誤

初中物理學相信大家都知道,目前主流認為宇宙中存在四種力,重力,強作用力,弱作用力,電磁力,基本上全部能觀測到力都能被歸類於四大力裡面,例如人類身體的力屬於電磁力的範疇。 在其他的人工智能裡面,他們都能清楚的回答這麼基本的問題,但是ChatGPT 是什麼回答的?


ChatGPT 的錯誤回答

ChatGPT 的錯誤回答

核力事實上就是強力,這是嚴重混淆與誤導

核力事實上就是強力,這是嚴重混淆與誤導

它一開口我們就看到不對了,宇宙中在目前的觀點可沒有什麼“多種的力”,而是只有四大基本力,還包含對基本力的嚴重誤導與混淆,例如造出一個“核力”和強力區別。


其他人工智能正確的回答:


Claude 2的回答

Claude 2的回答

Claude instant 的回答

Claude instant 的回答

Bing的回答

Bing的回答

Bard的回答

Bard的回答




三:邏輯錯亂

經過長時間的研究,我知道了與ChatGPT 糾錯與導正是幾乎沒有用的,它的記憶能力與邏輯能力極其低下,完全沒有辦法繼承上一個回答,甚至上一個字句的邏輯,以下是一個案例:


自稱貓不是貓。

自稱貓不是貓。



探討

在之前的文章中,我已經發表過ChatGPT 的各種危機與問題,他們的公司Open AI也看似持續有在更新與改進,但是從上面的證據來看ChatGPT 目前邏輯糜爛,效率低下,漏洞百出,讓我非常的失望。



過去文章:


《熱度下滑,性能變弱,財務堪憂,Open AI現況是什麼呢?》

https://vocus.cc/article/64e5ada5fd897800011f1ffd

如果有朋友們不相信,請自己試試看,問問它這些問題,這都是經過認證的,每一個人都能看到ChatGPT 現在的的落後與破敗。


結語


作為一個開創性的發明,ChatGPT 帶給了我們很多驚喜與快樂,不過,現在它已經不再具有領先地位與應用價值,正確性被其他幾乎所有的大廠牌遠遠超越,我作為一個人工智能的積極用戶與部落客,也在猶豫了許久以後將之發表出來,希望能有更多人看到這個議題。 以上就是本期全部內容了,如果你有什麼看法,請在評論區讓我知道。

avatar-img
樂子
46會員
87內容數
😎大家好我是子人!主要分享科技,AI,網路,新聞還有一些自己的個人觀點,歡迎追蹤我♥️♥️♥️
留言
avatar-img
留言分享你的想法!
樂子 的其他內容
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Suno AI 是一款基於人工智能的音樂生成工具,使用深度學習技術訓練出的人工神經網絡模型,能讓任何人免費使用文字描述生成對應的音樂作品。本文介紹了Suno AI的特點、用法、影響和用途,並展望了人工智能在音樂創作中的潛在作用。
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Suno AI 是一款基於人工智能的音樂生成工具,使用深度學習技術訓練出的人工神經網絡模型,能讓任何人免費使用文字描述生成對應的音樂作品。本文介紹了Suno AI的特點、用法、影響和用途,並展望了人工智能在音樂創作中的潛在作用。
本篇參與的主題活動
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄
先前麥克買了在預算及性能方面都十分複合需求的NXTPAPER 11平板,但拿到辦公室使用後便發現因為時不時有簡報需求,主機本身不支援有線視訊輸出實在是非常不方便,因又開始尋找新歡。最終麥克選擇了算是還滿熟悉的品牌小米旗下的小米平板6,以下為麥克這一個月下來的使用心得。
從預計的十月底出貨經過重重波折,Pubu自家開發的10寸彩色閱讀器Pubook Pro終於是送到第一批集資者手中了。究竟這台閱讀器有沒有本事撼動目前的電子紙閱讀器市場?有達到集資時承諾的各項功能嗎?且讓身為首批集資者之一的麥克跟大家談談收到主機後使用數天的感想。
Steam Deck 迎來大改版,最重要的更新就是換成 OLED 螢幕。使用 OLED 螢幕帶來更好看的顏色,大小還小幅提升到 7.4 吋。關係續航力的電池也從 40 瓦小時升級到 50 瓦小時, 3A 大作都可以多玩一小時呢!這麼香的更新,怎麼不給他買下去呢 😄