粗淺的認識ggml 與llama.cpp

iBonnie_愛邦尼

發佈於AI領域展開等個房間

更新於 2024/07/09發佈於 2024/03/07閱讀時間約 1 分鐘

ggml 是一個通用的機器學習框架，它可以應用於多種模型。它主要使用純 C 語言，並且輕量且適用於 Apple 裝置。ggml 支援許多模型，包括文字和圖片語音相關的模型，如 GPT-2、Llama、CLIP、Whisper 和 Stable Diffusion。
llama.cpp 則是基於 ggml 開發的專案，專注於實現 LLaMA 模型架構。它具有高速讀取模型、低硬體需求和極低位元量化等功能。雖然 llama.cpp 適用於特定模型架構，但它已經在 GitHub 上引起了廣泛關注。

iBonnie_愛邦尼AI領域展開iBonnie_愛邦尼iLLM

iBonnie_愛邦尼

5會員

75內容數

記錄生活與技術的小細節

留言0

查看全部

發表第一個留言支持創作者！

iBonnie_愛邦尼的其他內容

Deepfake as A Service(DAAS): SORA, 最近AI界的紅話題, 眼見不一定為憑!

Sora 是一個 AI 模型，可以根據文字指令創建現實且富有想像的場景。Sora 可以產生長達一分鐘的Video。官網上的幾個例子: Prompt: Several giant wooly mammoths approach treading through a snowy meado

#OpenAI #Sora #AI

新增Anaconda虛擬環境

列表看看 conda env list 一開始只有base # conda environments: # base * /home/business/anaconda3 新增一個別的環境 conda create --name py39_env p

Ubuntu Server 24.04|22.04|20.04|18.04 安裝 Anaconda

sudo apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 安裝版本查找: http

ESXI8-Ubuntu24.04|22.04 ,4090_4080_4070_4060.直通_GPU passthru

本文介紹了GPU在ESXI上的三種使用方式: 直通、vGPU、Bitfusion。針對一般使用者可以輕易取得的消費者端顯示卡進行了直通的例子和設定步驟。文章詳細介紹了BIOS、 ESXI HOST和虛擬機的設定以及需要注意的各種細節。提供了最新的nvidia驅動下載連結，並分享了測試的方法。

#GPU #分享 #下載

可以單機操作的類chatGPT:text-generation-webui安裝後的模型使用

本文介紹了text-generation-webui的安裝方法和模型的選擇，包括模型的下載和擺放位置，並提供了相關的連結和建議。

#模型 #安裝 #下載

Docker_NVIDIA Container Enable_以Ubuntu24.04|22.04為例

當你安裝完docker，並且設定好所有相關程序後。你正要使用docker去進行操作，讓專案可以在容器哩，方便平台移轉、備份、共用等等等等等;如果你遇到CUDA docker runtime 的問題時，這篇正適合你閱讀。開始之前，如果你要參考怎麼安裝docker，設定docker環境，請參考:

#docker #nvidia #ubuntu

Deepfake as A Service(DAAS): SORA, 最近AI界的紅話題, 眼見不一定為憑!

#OpenAI #Sora #AI

新增Anaconda虛擬環境

列表看看 conda env list 一開始只有base # conda environments: # base * /home/business/anaconda3 新增一個別的環境 conda create --name py39_env p

Ubuntu Server 24.04|22.04|20.04|18.04 安裝 Anaconda

sudo apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 安裝版本查找: http

ESXI8-Ubuntu24.04|22.04 ,4090_4080_4070_4060.直通_GPU passthru

#GPU #分享 #下載

可以單機操作的類chatGPT:text-generation-webui安裝後的模型使用

本文介紹了text-generation-webui的安裝方法和模型的選擇，包括模型的下載和擺放位置，並提供了相關的連結和建議。

#模型 #安裝 #下載

Docker_NVIDIA Container Enable_以Ubuntu24.04|22.04為例

#docker #nvidia #ubuntu

你可能也想看

Google News 追蹤

阿翰的沙龍

2025/02/06

從創作到理財：如何在生活中找到你的美感心法？

在創作的路上真的很多人問我說到底要怎麼做出符合自己期待但又可以表現得很有美感的作品？🥹 這個問題真的應該是每個創作者都一直在學習的課題吧！

#創作 #理財 #國泰世華

♡ 後沙發的會客廳 ♡

2025/01/11

《表達與社交學》95 抱怨者嚇走強者，提問者吸引強者，所以貴人運天差地遠

提問的內容越是清晰，強者、聰明人越能在短時間內做判斷、給出精準的建議，他們會對你產生「好印象」，認定你是「積極」的人，有機會、好人脈會不自覺地想引薦給你

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明，有一個很重要的結論：最適合您的模型不一定是排行榜上最好的模型，您需要學習 NLP 評

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/10

AI說書 - 從0開始 - 81

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。延續xxxx，ChatGPT 產生的程式，我們將它匯入 Colab 執行看看 ( Colab 使用教學見使用Meta釋出的模型，實作Chat GPT - Part 0

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/06/15

AI說書 - 從0開始 - 18

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們已經在AI說書 - 從0開始 - 17中，介紹了大型語言模型 (LLM)世界裡面常用到的Token，現在我們來談談OpenAI的GPT模型如何利用Inference

#AI #ai #PromptEngineering

朵小芸的草味沙龍

2024/06/06

SLM是什麼？探索小型語言模型的未來趨勢

在AI時代中，GPT技術正在改變我們的生活。然而，SLM（小型語言模型）也開始受到關注，具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。

#SLM #LLM #大語言模型

Learn AI 不 BI

2024/04/28

使用Meta釋出的模型，實作Chat GPT - Part 2

接著載入Part 2需要的相關依賴，其分別為： from torch import cuda, bfloat16import import transformers 然後選擇我們要的Meta模型，這邊可以是Llama 2或者是Llama 3，後者是Meta最新釋出的模型。同時我們也讓系統自

#自然語言處理 #NLP #Huggingface

Learn AI 不 BI

2024/04/27

使用Meta釋出的模型，實作Chat GPT - Part 1 | HuggingFace權限開啟教學

第一步先在Python環境中安裝本次專案需要用到的Library，相關指令如下： !pip install accelerate==0.21.0 !pip install transformers==4.31.0 !pip install tokenizers==0.13.3 !pip insta

#自然語言處理 #NLP #HuggingFace

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

大語言模型能夠生成文本，因此被認為是生成式人工智慧的一種形式。人工智慧的學科任務，是製作機器，使其能執行需要人類智慧才能執行的任務，例如理解語言，便是模式，做出決策。除了大語言模型，人工智慧也包含了深度學習以及機器學習。機器學習的學科任務，是透過演算法來實踐AI。特別

#大語言模型 #ChatGPT #人工智慧

Marcos的方格子

2024/03/09

大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」，然而，它們並非真正理解語言。除了在上篇介紹的技巧可以協助我們在使用 LLM 時給予指示之外，今天我們會介紹使用 LLM 的框架。

#PromptPattern #LLM #ChatGPT

Everything ✨

2024/02/24

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

大型語言模型(LLM)是基於深度學習的自然語言處理模型，而多模態模型(LMM)能處理多種資料型態。這些模型將對未來帶來重大改變。LLM 專注於理解和生成自然語言，LMM 能夠處理跨模態的內容，並整合多種資料的能力，有望成為未來趨勢。

#ChatGPT #AI #人工智慧

Marcos的方格子

2024/02/13

大型語言模型常用的 Design Pattern | Coursera 課程回顧(上)

大型語言模型（Large Language Model，LLM）是一項人工智慧技術，其目的在於理解和生成人類語言，可將其想像成一種高階的「文字預測機器」。 Prompt Pattern 是給予LLM的指示，並確保生成的輸出擁有特定的品質（和數量）。

#PromptPattern #LLM #chatgpt

阿翰的沙龍

2025/02/06

從創作到理財：如何在生活中找到你的美感心法？

#創作 #理財 #國泰世華

♡ 後沙發的會客廳 ♡

2025/01/11

《表達與社交學》95 抱怨者嚇走強者，提問者吸引強者，所以貴人運天差地遠

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/07/10

AI說書 - 從0開始 - 81

#AI #ai #PromptEngineering

Learn AI 不 BI

2024/06/15

AI說書 - 從0開始 - 18

#AI #ai #PromptEngineering

使用Meta釋出的模型，實作Chat GPT - Part 2

#自然語言處理 #NLP #Huggingface

Learn AI 不 BI

2024/04/27

使用Meta釋出的模型，實作Chat GPT - Part 1 | HuggingFace權限開啟教學

#自然語言處理 #NLP #HuggingFace

王啟樺的沙龍

2024/04/25

LLM 003｜人工智慧如何從數據中學習？

#大語言模型 #ChatGPT #人工智慧

Marcos的方格子

2024/03/09

大型語言模型常用的提詞框架 | Coursera 課程回顧(下)

#PromptPattern #LLM #ChatGPT

Everything ✨

2024/02/24

AI 模型的進化｜從大型語言模型LLM 到多模態模型LMM

#ChatGPT #AI #人工智慧

Marcos的方格子

2024/02/13

大型語言模型常用的 Design Pattern | Coursera 課程回顧(上)

#PromptPattern #LLM #chatgpt