Transformer
#
Transformer
含有「Transformer」共 8 篇內容
全部內容
發佈日期由新至舊
LLM 006|BERT與GPT是怎麼從Transformer演化來的?
在上一期「LLM 005|大語言模型是如何利用Transformer理解語言的?」我們提到,Transformer是大語言模型理解語言的關鍵。 而Transformer架構兩個主要的後代是BERT以及GPT。 BERT是bidirectional encoder representati
2024-04-28
8
#
大語言模型
#
ChatGPT
#
GPT
LLM 005|大語言模型是如何利用Transformer理解語言的?
現代大語言模型建構於Transformer結構。 Transformer結構是源自於2017年著名論文 Attention Is All You Need的深度神經網路結構。 原始的Trasformer是為了機器翻譯發展,當初的任務是將英文翻譯成德文與法文。 Transformer
2024-04-27
7
#
大語言模型
#
Transformer
#
ChatGPT
LLM 004|創建大語言模型需要哪兩個關鍵階段?
從頭開始寫大語言模型的程式碼, 是最好理解大語言模型的機制與限制的方風。 從頭開始寫大語言模型的程式碼,可以幫助我們得到預訓練與微調整開源大語言模型架構所需要的知識,並應用到特定領域的數據及以及任務。 客製化大語言模型一般來說比起通用大語言模型有更好的表現。 一個具體的例子是
2024-04-26
4
#
大語言模型
#
ChatGPT
#
Transformer
簡單解釋 SORA 工作原理
關於 SORA 技術原理的圖像式解說,內容從通用型人工智慧到生成運算的原理以及相關的技術研究成果。 提供了使用生成運算方式的 Diffusion Transformer 介紹和進階閱讀的指路。分享 AI 研究領域的開放性和合作精神,以及對視覺產業可能帶來的影響。
2024-03-18
2
#
模型
#
人工智慧
#
公開
2024:On-Device AI 發展到哪?
2024 年,AI Boom 的第二年,我們總算可以撥開 AI 迷霧,逐一聊聊大型語言模型 (LLM) 的實際應用。On-Device AI 正快速進化,Google Gemini Nano 正式部署上手機,Apple 也發布最新論文彎道超車,改變了手機 AI 的未來發展。
2024-02-15
4
#
DRAM
#
Pixel 8 Pro
#
模型
隨心所欲的生成短影音,Zero-Shot VideoPoet by Google Research
Google Research 在2024年給出了令人滿意的新年禮物,這篇論文內的方法,若持續發展下去,可望顛覆整個影音創作產業,未來製作生動的影音動畫,不再是令人頭痛與耗費心力的一件事情,是不是很酷,讓我們一起看看到底是如何做到的。
2024-02-04
8
#
GoogleResearch
#
文圖音生短影音
#
VideoPoet
用一張圖片生成多視角3D,LRM by Hong et al.
Transformer被廣泛運用在各種生成式AI,激起了本篇作者的好奇心,是否能用Transformer學到所有先驗知識,足以讓它由一張2D圖片還原3D物件。本篇也從Github上面找到由ZexinHe開源的LRM實作程式,讓有興趣的人可以深入研究。
2024-01-08
11
#
openLRM
#
Transformer
#
ViT
請看懂智慧的本質:GTP4的「人工通用智能」(AGI)落後人類有多遠?─學習的本質(22)
作者:陳華夫 GPT-4具有推理、創造力和演繹等核心心智能力,顯示出了人工通用智能(AGI)火花,但轉換器神經網絡所展現的思考遠遠落後人類腦神經記憶網絡的思考,人工通用智能(AGI)的研發將是耗費鉅資的美夢。
2023-04-16
8
#
湧現能力
#
人工通用智能
#
AGI