小模

含有「小模」共 8 篇內容
全部內容
發佈日期由新至舊
在家用 GPU(例如 RTX 3060 / 4070 / 4090) 是可以訓練「小型 LLM」的 —— 但要方法正確。 我給你一個完整可執行流程圖。 🎯 先講現實 ❌ 你做不到的 從零訓練 7B 模型 用幾 TB 數據做 pretraining
Thumbnail
楊子認為與家人相處,每天至少維持一小時的真心相待,所以早晨以素與母親相約,夜晚以豐盛與父親相遇。
Thumbnail
Anthropic因極度重視AI安全與國安風險,擴大禁止中國等威權國家使用其Claude模型,以防被用於「知識蒸餾」。知識蒸餾能讓小模型快速複製大模型的邏輯與能力,成為國安風險。小模型雖不如老師模型全面,但在特定任務上表現優秀且成本低,。對Anthropic而言,蒸餾已是政治問題而非單純技術。
Thumbnail
黎星羽-avatar-img
2025/11/23
付費限定
十七★眼鏡戴不牢,貞操就不保         褪去黑色直條紋的浴衣後,夏思密將之細心摺好。中規中矩地打溼身體,他才優雅泡入庭院的石池中。         池旁放著自行備好的涼茶。在這棟家主遺留下來的日式建築中穿著合宜的浴衣、喝著日式茶品,一向是夏思密的龜毛性格使然,晚輩們也認真奉行此項細節。
付費限定
在大型語言模型(LLM)如 GPT-4、Claude 3、Gemini 正在改寫生產力的同時,另一股勢力也正在悄悄崛起──小模型(Small Language Models, SLM)。
Thumbnail
暑假小小模特兒課程|體驗模特兒技能與專業服裝秀成果展,打造自信舞台魅力 暑假來臨,想讓孩子擁有專業且多元的模特兒學習體驗嗎? 今年夏天,我推出兩個暑假小小模特兒課程,讓孩子從基礎台步、拍照技巧,到肢體開發、表情管理,一步步成為舞台上的小明星!
Thumbnail
微軟Phi系列小語言模型在過去一年中取得了顯著進展,最新的Phi-4模型在STEM領域問答能力超越GPT-4,並支援多模態輸入,展現小模型的巨大潛力。其成功關鍵在於高質量訓練數據,且透過Azure AI Foundry、Hugging Face和Ollama等平臺開放獲取,方便開發者使用。
Thumbnail
老玄出來辦事那麼久,經常有人來問我兩個問題:「老玄啊,你收徒弟了嗎?」或者說「老玄啊,可以拜你為師嗎?」 當然不行,我什麼咖,收徒?回去不被老大們跟師叔師伯打死才怪!但是如果有心修行或修心的朋友,我依然很樂意跟大家聊上幾句粗淺的心得。 但實不相瞞,老玄確實有收了一位記名弟子,但這中間卻是有一段因
Thumbnail