「雪球滾滾」方格子專欄致力於知識與資訊的交流,未有推介股票之意圖與行為,亦未對證券價值進行分析,內容絕無任何目標價及買賣建議,也未有招收會員或開設付費群組。
請讀者務必詳閱「免責聲明」,投資有風險,本文內容不建議作為投資行為之最終依據,投資前請審慎評估並自負盈虧。
請記得追蹤「雪球滾滾」臉書、IG、以及Threads,雪大將不定期分享更多觀點與資訊。
最近確實被Deepseek刷屏了,雪大在春節期間老早就把她下載到自己的手機上,用了幾天,感覺還是非常不錯的。
坦白說這是我第一次深入使用大陸產的AI,之前一直是用chatgpt。
我不是那種喜歡嘗新,喜歡評測的博主,我的原則是只選擇市場上口碑和品質最好的產品。
不過Deepseek作為chatgpt的平替,還是很香的,對很多問題的解答都超出我的預期。
當然,部分任務依然是取代不了chatgpt的,比如Deepseek無法生成圖片,以及無法進行語音交互,但因為它回答速度足夠快而且品質足夠好,仍然足以成為我日常用的AI工具之一。
爆紅之後雪大也看到不少專業人士的解讀,一些國外的評測和市場上的高光表現,相信讀者朋友從其他管道也都瞭解了,我就不再轉述了。
那麼就有一種觀點突然出現了: 這是不是大陸AI逆轉美國的時刻?
說真的,挺超出我預期的,我也沒想到大陸AI的表現能如此驚豔。
然後我就反思過去對於大陸AI領域發展的心得,有些邏輯我認為依然是成立的。
大陸的AI和美國相比,存在四點差距。
其一,演算法,這個是可以追的,也是差距最小的。
其二,算力,算力不只是資金的問題,因為先進的GPU晶片已經禁止向大陸出售,這個差距目前相對還不算很大,未來可能會越來越大。
其三,語料,中文語料在科技領域和英文依然存在相當差距。
其四,合規,不可否認大陸的合規成本更高。
關於演算法,我一直認為這是我們差距最小的,是可以追的,但是說真的,即便如此,我還是低估了大陸的AI工作者。
這次Deepseek的驚豔表現,通過網上對他們論文的解讀,應該說,在優化能力和訓練成本上,遠遠優於美國同行。
那麼根據一些技術解讀,我的理解是這樣的,Deepseek自身也承認,他們是基於chatgpt公開的一些演算法思想研發的。
所以說她仍然是站在巨人的肩上,當然chatgpt沒有開源,所以只是借鑒了對方的思想,主要是基於對方論文的描述,進行了完美的複刻。
然後在這個基礎上,又加上了自己革命性的創新,系統的自我激勵機制可以在更少的訓練資料和訓練資源情況下實現所謂湧現。
或者說,英文原文說的是,Aha moment。
這個詞很有意思,其實我覺得更精確的描述應該叫做頓悟。
講白了就是在學習和推理的過程中,突然間把一些相關的邏輯鏈打通了,能夠正確的理解一些複雜的因果,實現合理的問題解讀和判斷分析。
那麼chatgpt的頓悟是基於巨大的訓練成本和資源,而Deepseek明顯極大降低了這個門檻,以至於可以在一些普通的學校實驗室,甚至家用高配電腦裡自行訓練實現頓悟。
我已經看到很多學校和科研機構,他們對Deepseek也是讚不絕口,如獲至寶。
必須說,華人在優化方面的天賦還是非常強的。
由於演算法上超出尋常的優化能力,算力上的短板問題就很容易被克服了。
所謂算力短板,是跟美國AI巨頭相比,確實差距蠻大。
語料這塊,我猜測大陸所有大模型的基本邏輯,科學技術相關的知識儲備,基本上都是英文語料訓練出來的。
其實早期很多大陸的大模型都爆露過類似問題,比如去年有案例,你說滑鼠它給出的是老鼠。
我個人傾向于認為,英文語料訓練依然是品質的保障,中文語料當然針對大陸很多場景有價值,但對於一些深入探索的技術問題,可能依然需要更多英文語料才能達到足夠的效果。
所以感謝能提供覆蓋全球的高品質語料資料的供應商吧,這也是大陸大模型能快速成長的幕後英雄。
然後就是合規,我真的也調戲了一下Deepseek,問了不少按理說不該問的問題。
當然,有些問題肯定是不能直接問,但可以通過某種方式繞過問題本身的檢測。
在這種情況下,它經常是先輸出一段內容,然後涉及到某些可能敏感的內容時,突然快速回滾,然後切換到一段標準正能量文字。
可以看出系統的審核架構,是在輸出的同時進行校驗的。
其實這個問題倒還好,但是現在美國有很多人都在使用,這裡就肯定存在某些合規的問題。
我還有一個疑問,就是它的聯網搜索功能,到底是有沒有受到大陸互聯網環境的制約?
Deepseek是否做了人群和地區切分,海外和國內是否用的同一套架構,同樣的伺服器資源,這些我沒有驗證,但這裡多多少少都會存在很多合規風險。
不過目前還好,因為產品表現非常驚豔,特別是能打美國政策的臉,同樣的還有小紅書。
未來做全球合規的難度依然很高,相信也是他們目前最大的挑戰之一,也希望他們能順利過渡。
回到最初的問題,這算是逆轉美國的AI創新了麼?
我覺得至少目前還不能算,畢竟它還是站在巨人的肩膀上,雖然有自己非常優秀的演算法創新,但還談不上那種不可超越的領先優勢。
在綜合效果上,追平甚至超越了chatgpt免費版本,但還真不能說已經完全超越了chatgpt,以及我們都知道chatgpt有更強大的版本並沒有公開出來。
而且開源之後,國外巨頭也會快速跟進,在這種情況下,想要維持演算法領先的難度也很高。
但我也希望這個開源項目能夠在全球技術人才的共同努力下能快速進步,也許未來有一天,最大的貢獻者並非來自這家大陸公司。
但也是很值得慶祝的事情。基於開源社區的力量幹翻chatgpt,其實也是很有可能的。
很期待,未來這個開源項目的貢獻者名單裡會出現分佈在全球的各種頂級天才。
那麼另一個最大的風險在於,這個團隊的成績太驚豔了,以至於團隊成員被巨頭挖角的概率大大增加了。
已經有新聞出來小米用千萬年薪挖走了一個核心的95後技術天才,據說是給出了之前4倍的年薪。
我必須承認,Deepseek技術團隊的薪酬水準還是很高的,不弱於國內互聯網巨頭。
相信很多獵頭都已經動起來了,很多巨頭都在努力的下offer,動輒幾倍薪資來挖人 ,對一些年輕的技術從業者來說,還是很有吸引力的。
其實openAI也遇到了類似的問題,當然,這也是一個好事情,優秀的技術人才可以靠自己的技術能力實現財富自由,我一直認為這才是很正能量的事情。
所以Deepseek團隊是否還能維持足夠的凝聚力和戰鬥力,也是需要持續觀察的。
最後, Deepseek會展示它的推理過程,這一點很酷,而且很有借鑒意義。
我測試了一些比較複雜的數學題,注意到它的推理過程會不斷否定自己,重新審視自己。
可以說,就算作為人類而言,都會覺得它的思維方式非常的有借鑒意義。
那麼普通人普通人對於Deepseek的重大誤解到底又是什麼呢?
如欲解鎖剩下內容,推薦你們首月體驗價最低只要88元的「新超級菁英方案」,確定喜歡再繼續訂閱就好。
比較大方且有財力的讀者朋友,建議請直接選擇2025超級菁英方案,她只有年訂閱這個方案,價格是4680元。
精算之後你會發現她雖然看似比較貴,但是卻很值得,因為對長期主義的讀者來說,更划算一些。
工商時間結束,不多說廢話進入正題。