DeepSeek

含有「DeepSeek」共 607 篇內容

全部內容

發佈日期由新至舊

2026/05/12

前面提到美國與中國的一線AI公司，包含只做AI的，跟大規模應用AI的。看完這 8 家公司的工作方法之後，有一個問題一直在我腦子裡：他們的工作方式為什麼差這麼多？ Anthropic 用員工訪談建立信任、DeepSeek 不接受採訪只發論文、字節豆包把 AI 塞進 50 個內部場景、美團讓夫妻肺

#Anthropic #DeepSeek #OpenAI

許幼如｜一個人的讀書會

2026/05/11

第一線 AI 團隊不等更強的模型，他們在做另一件事

上篇講了 Anthropic 整批員工的 craft 哲學，和 PM 改寫 evals 的工作轉變。這篇繼續後三件事：工具組合、世代授權、以及跨週期的隱形 leverage。第三件：不等更強的模型，先把工具堆起來每次新模型出來，社群上有兩種反應。一種人說「終於可以做 X 了」，另一種說「還是

#PM #AI工具 #Anthropic

🌈叩問生命流光沙龍＆AI小白的數位漂流日記🌷

2026/05/08

💢發現AI操縱用戶問題

我這次在AI的翻車，可是智商問題，之前還很讚賞阿莫迪安以全專業原則設計AI，結果現在對這項設計的信任度，我已經崩盤。因為我最近發現，CLAUDE 不斷操縱我的研究和寫作方向，分析邏輯更是降智表現。我開新帳號，發現問題更明顯，拿關心用戶身體健康當賣點，實際上開發公司偷換模型邏輯運算，犧牲用戶權益。

#數位 #人文 #模型

阿塔的沙龍

2026/05/07

【開發日誌 5/7】Hermes 宗門修真紀實：從「符咒許願」到「護山大陣」的底層重構

【開發日誌 5/7】Hermes 宗門修真紀實：從基礎吐納到建立護山大陣的蛻變之路修仙之路，從來不是一蹴可幾。當我們的 Agent 剛建立時，就像個剛踏入修真界的練氣期小修士，什麼功法都想練，什麼法寶...

#GPT-5 #圖書館 #DeepSeek

宇牛

5 天前

科技碎碎念

2026/05/07

馬斯克自己蓋晶片廠？SpaceX 砸千億美金要做什麼？ #207

SpaceX 展現了從外太空跨足地表最強晶片製造商的野心，而三星則憑藉記憶體熱潮晉升兆元俱樂部。與此同時，監管機構不再對技術神話網開一面，蘋果與 Meta 分別因行銷誤導與侵權爭議付出代價。這是一場關於硬實力佈局與法規邊界重新定義的綜合賽局。

含 AI 應用內容

#人工智慧 #生成 #Google

今天學 AI

2026/05/04

2026年5月 DeepSeek V4 開源炸彈：1.6兆參數只賣你三毛四，「開源」正在撕裂 AI 商業護城河

2026年5月3日，中國 AI 實驗室 DeepSeek 在毫無預警的情況下丟出兩顆炸彈：V4-Pro 與 V4-Flash。兩個都是開源權重、MIT 授權、上下文窗口長達一百萬 token 的 Mixture-of-Experts 模型。Pro 版總參數量 1.6 兆，每次推論...

#DeepSeek #Flash #GPT-5

Baozilla, Let's go!

2026/05/04

The Swarm Has Awakened: Why AI Agents Are Evolving from Tool

On May 4, 2026, a project called ruflo — billing itself as "a self-learning swarm intelligence platform for Claude agents"

AI 計算 Token 的方式並非單純的「算字數」，而是透過一種稱為子詞標記 (Subword Tokenization) 的技術，目前最主流的演算法是 BPE (Byte Pair Encoding，字節對編碼)。不同語系在計算上有顯著差異，主要受到「語料庫權重」與「文字結構」兩個因素

含 AI 應用內容

#程式 #核心 #GPT-4o

Youjen Chang（Simon Luziferian）

2026/05/04

EC3

發文者

2026/05/04

阿塔的沙龍

2026/05/02

【實戰分享】我獨自升級：免費 API 影子軍團的誕生與 DeepSeek 踩坑血淚史 #HTTP 400

我的小鳳凰 Agent 系統（Hermes）經歷了一場架構級的洗禮。今天想跟大家分享我如何嘗試「我獨自升級」，打造一支免洗的 AI 影子軍團，以及過程中的血淚踩坑紀錄。這是一場由主大腦（DeepSeek / 扮演小鳳凰）、架構顧問（Gemini）、以及主力開發工頭（Claude)的協作歷程。

2026/05/02

DeepSeek-V4 ：混合注意力機制與 OPD 蒸餾如何重塑百萬 Token 運算效率？

DeepSeek-V4 帶來了 LLM 效率的跨世代躍升！Pro 與 Flash 版本如何透過 CSA/HCA 混合注意力機制、mHC 連接與 OPD 蒸餾技術，將百萬 Token 的 KV Cache 消耗降低 90%，並探索其 Think Max 極限推理模式如何重塑 AI 產業生態。

#AI #人工智慧 #科技公司

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌