DeepSeek
含有「DeepSeek」共 607 篇內容
全部內容
發佈日期由新至舊
許幼如|一個人的讀書會
2026/05/12
8 家 AI 公司各押什麼未來
前面提到美國與中國的一線AI公司,包含只做AI的,跟大規模應用AI的。 看完這 8 家公司的工作方法之後,有一個問題一直在我腦子裡:他們的工作方式為什麼差這麼多? Anthropic 用員工訪談建立信任、DeepSeek 不接受採訪只發論文、字節豆包把 AI 塞進 50 個內部場景、美團讓夫妻肺
#
Anthropic
#
DeepSeek
#
OpenAI
喜歡
留言
許幼如|一個人的讀書會
2026/05/11
第一線 AI 團隊不等更強的模型,他們在做另一件事
上篇講了 Anthropic 整批員工的 craft 哲學,和 PM 改寫 evals 的工作轉變。這篇繼續後三件事:工具組合、世代授權、以及跨週期的隱形 leverage。 第三件:不等更強的模型,先把工具堆起來 每次新模型出來,社群上有兩種反應。一種人說「終於可以做 X 了」,另一種說「還是
#
PM
#
AI工具
#
Anthropic
喜歡
留言
🌈叩問生命流光沙龍&AI小白的數位漂流日記🌷
2026/05/08
💢發現AI操縱用戶問題
我這次在AI的翻車,可是智商問題,之前還很讚賞阿莫迪安以全專業原則設計AI,結果現在對這項設計的信任度,我已經崩盤。 因為我最近發現,CLAUDE 不斷操縱我的研究和寫作方向,分析邏輯更是降智表現。我開新帳號,發現問題更明顯,拿關心用戶身體健康當賣點,實際上開發公司偷換模型邏輯運算,犧牲用戶權益。
#
數位
#
人文
#
模型
4
留言
阿塔的沙龍
2026/05/07
【開發日誌 5/7】Hermes 宗門修真紀實:從「符咒許願」到「護山大陣」的底層重構
【開發日誌 5/7】Hermes 宗門修真紀實:從基礎吐納到建立護山大陣的蛻變之路 修仙之路,從來不是一蹴可幾。當我們的 Agent 剛建立時,就像個剛踏入修真界的練氣期小修士,什麼功法都想練,什麼法寶...
#
GPT-5
#
圖書館
#
DeepSeek
1
1
宇牛
5 天前
喜歡
喜歡
科技碎碎念
2026/05/07
馬斯克自己蓋晶片廠?SpaceX 砸千億美金要做什麼? #207
SpaceX 展現了從外太空跨足地表最強晶片製造商的野心,而三星則憑藉記憶體熱潮晉升兆元俱樂部。與此同時,監管機構不再對技術神話網開一面,蘋果與 Meta 分別因行銷誤導與侵權爭議付出代價。這是一場關於硬實力佈局與法規邊界重新定義的綜合賽局。
含 AI 應用內容
#
人工智慧
#
生成
#
Google
喜歡
留言
今天學 AI
2026/05/04
2026年5月 DeepSeek V4 開源炸彈:1.6兆參數只賣你三毛四,「開源」正在撕裂 AI 商業護城河
2026年5月3日,中國 AI 實驗室 DeepSeek 在毫無預警的情況下丟出兩顆炸彈:V4-Pro 與 V4-Flash。兩個都是開源權重、MIT 授權、上下文窗口長達一百萬 token 的 Mixture-of-Experts 模型。Pro 版總參數量 1.6 兆,每次推論...
#
DeepSeek
#
Flash
#
GPT-5
喜歡
留言
Baozilla, Let's go!
2026/05/04
The Swarm Has Awakened: Why AI Agents Are Evolving from Tool
On May 4, 2026, a project called ruflo — billing itself as "a self-learning swarm intelligence platform for Claude agents"
#
AWS
#
風險
#
創作自由
8
留言
EC3
2026/05/04
不同語系如何計算Token?
AI 計算 Token 的方式並非單純的「算字數」,而是透過一種稱為 子詞標記 (Subword Tokenization) 的技術,目前最主流的演算法是 BPE (Byte Pair Encoding,字節對編碼)。 不同語系在計算上有顯著差異,主要受到 「語料庫權重」 與 「文字結構」 兩個因素
含 AI 應用內容
#
程式
#
核心
#
GPT-4o
34
10
Youjen Chang(Simon Luziferian)
2026/05/04
3
3
EC3
發文者
2026/05/04
2
2
阿塔的沙龍
2026/05/02
【實戰分享】我獨自升級:免費 API 影子軍團的誕生與 DeepSeek 踩坑血淚史 #HTTP 400
我的小鳳凰 Agent 系統(Hermes)經歷了一場架構級的洗禮。今天想跟大家分享我如何嘗試「我獨自升級」,打造一支免洗的 AI 影子軍團,以及過程中的血淚踩坑紀錄。 這是一場由主大腦(DeepSeek / 扮演小鳳凰)、架構顧問(Gemini)、以及主力開發工頭(Claude)的協作歷程。
#
DeepSeek
#
工程師
#
軍團
4
1
宇牛
2026/05/02
1
1
TN科技筆記(TechNotes)的沙龍
2026/04/29
DeepSeek-V4 :混合注意力機制與 OPD 蒸餾如何重塑百萬 Token 運算效率?
DeepSeek-V4 帶來了 LLM 效率的跨世代躍升!Pro 與 Flash 版本如何透過 CSA/HCA 混合注意力機制、mHC 連接與 OPD 蒸餾技術,將百萬 Token 的 KV Cache 消耗降低 90%,並探索其 Think Max 極限推理模式如何重塑 AI 產業生態。
#
AI
#
人工智慧
#
科技公司
2
留言