DeepSeek

含有「DeepSeek」共 607 篇內容
全部內容
發佈日期由新至舊
前面提到美國與中國的一線AI公司,包含只做AI的,跟大規模應用AI的。 看完這 8 家公司的工作方法之後,有一個問題一直在我腦子裡:他們的工作方式為什麼差這麼多? Anthropic 用員工訪談建立信任、DeepSeek 不接受採訪只發論文、字節豆包把 AI 塞進 50 個內部場景、美團讓夫妻肺
Thumbnail
上篇講了 Anthropic 整批員工的 craft 哲學,和 PM 改寫 evals 的工作轉變。這篇繼續後三件事:工具組合、世代授權、以及跨週期的隱形 leverage。 第三件:不等更強的模型,先把工具堆起來 每次新模型出來,社群上有兩種反應。一種人說「終於可以做 X 了」,另一種說「還是
Thumbnail
我這次在AI的翻車,可是智商問題,之前還很讚賞阿莫迪安以全專業原則設計AI,結果現在對這項設計的信任度,我已經崩盤。 因為我最近發現,CLAUDE 不斷操縱我的研究和寫作方向,分析邏輯更是降智表現。我開新帳號,發現問題更明顯,拿關心用戶身體健康當賣點,實際上開發公司偷換模型邏輯運算,犧牲用戶權益。
【開發日誌 5/7】Hermes 宗門修真紀實:從基礎吐納到建立護山大陣的蛻變之路 修仙之路,從來不是一蹴可幾。當我們的 Agent 剛建立時,就像個剛踏入修真界的練氣期小修士,什麼功法都想練,什麼法寶...
Thumbnail
宇牛-avatar-img
5 天前
SpaceX 展現了從外太空跨足地表最強晶片製造商的野心,而三星則憑藉記憶體熱潮晉升兆元俱樂部。與此同時,監管機構不再對技術神話網開一面,蘋果與 Meta 分別因行銷誤導與侵權爭議付出代價。這是一場關於硬實力佈局與法規邊界重新定義的綜合賽局。
Thumbnail
含 AI 應用內容
#人工智慧#生成#Google
2026年5月3日,中國 AI 實驗室 DeepSeek 在毫無預警的情況下丟出兩顆炸彈:V4-Pro 與 V4-Flash。兩個都是開源權重、MIT 授權、上下文窗口長達一百萬 token 的 Mixture-of-Experts 模型。Pro 版總參數量 1.6 兆,每次推論...
On May 4, 2026, a project called ruflo — billing itself as "a self-learning swarm intelligence platform for Claude agents"
Thumbnail
AI 計算 Token 的方式並非單純的「算字數」,而是透過一種稱為 子詞標記 (Subword Tokenization) 的技術,目前最主流的演算法是 BPE (Byte Pair Encoding,字節對編碼)。 不同語系在計算上有顯著差異,主要受到 「語料庫權重」 與 「文字結構」 兩個因素
含 AI 應用內容
#程式#核心#GPT-4o
EC3-avatar-img
發文者
2026/05/04
我的小鳳凰 Agent 系統(Hermes)經歷了一場架構級的洗禮。今天想跟大家分享我如何嘗試「我獨自升級」,打造一支免洗的 AI 影子軍團,以及過程中的血淚踩坑紀錄。 這是一場由主大腦(DeepSeek / 扮演小鳳凰)、架構顧問(Gemini)、以及主力開發工頭(Claude)的協作歷程。
Thumbnail
宇牛-avatar-img
2026/05/02
DeepSeek-V4 帶來了 LLM 效率的跨世代躍升!Pro 與 Flash 版本如何透過 CSA/HCA 混合注意力機制、mHC 連接與 OPD 蒸餾技術,將百萬 Token 的 KV Cache 消耗降低 90%,並探索其 Think Max 極限推理模式如何重塑 AI 產業生態。