解決 NVIDIA GPU 驅動 libnvidia-ml.so 錯誤訊息

更新於 發佈於 閱讀時間約 2 分鐘

在這篇文章中,將分享最近遇到 NVIDIA GPU driver 的問題,這可能對面臨類似問題的人有所幫助~話不多說,直接開始正文!

raw-image

問題描述

當我嘗試使用 nvidia-smi 工具來檢查我的 NVIDIA GPU 狀態時,我遇到了一個錯誤訊息:NVIDIA-SMI couldn't find libnvidia-ml.so library in your system。這意味著系統無法找到 libnvidia-ml.so,這是 NVIDIA 驅動的一個關鍵庫文件,用於監控和管理 NVIDIA GPU。

這個問題通常指向 NVIDIA 驅動未正確安裝,或者系統無法正確定位到驅動的庫文件。

解決步驟

為了解決這個問題,我採取了以下步驟:

  1. 定位到庫文件目錄: 首先,我切換到包含 NVIDIA 驅動庫文件的目錄:如果不確定路徑在哪,可以先移動到根目錄,再用 find 指令去找
    cd /usr/lib/x86_64-linux-gnu
  2. 備份並替換 libcuda.so: 接著備份了 libcuda.so 文件,然後創建了一個指向 libcuda.so.1 的符號鏈接:
    cp libcuda.so libcuda.so.backup
    rm libcuda.so
    ln -s libcuda.so.1 libcuda.so
  3. 處理 libcuda.so.1: 我也備份並替換了 libcuda.so.1,以指向特定版本的庫文件:這裡的 libcuda.so.535.54.03 版本號碼,需配合硬體
    cp libcuda.so.1 libcuda.so.1.backup
    rm libcuda.so.1
    cp libcuda.so.535.54.03 libcuda.so.1
  4. 處理 libnvidia-ml.so.1: 最後,我對 libnvidia-ml.so.1 進行了類似的操作:
    cp libnvidia-ml.so.1 libnvidia-ml.so.1.backup
    rm libnvidia-ml.so.1
    ln -s libnvidia-ml.so.535.54.03 libnvidia-ml.so.1
  5. 測試更改: 完成這些操作後,我再次執行 nvidia-smi 來確認問題是否得到解決。出現這個畫面,表示有呼叫成功,就可以使用 GPU 繼續進行模型訓練。
nvidia-smi

nvidia-smi

結論

通過這些步驟,成功解決了 nvidia-smi 無法找到 libnvidia-ml.so 的問題。面對驅動相關問題時,有時候需要手動去管理 package 的連接與指向,不過這可能是暫時的解決方法,未來更新驅動可能都還要再次調整,最好的方式還是確保驅動正確安裝。

avatar-img
33會員
43內容數
歡迎來到《桃花源記》專欄。這裡不僅是一個文字的集合,更是一個探索、夢想和自我發現的空間。在這個專欄中,我們將一同走進那些隱藏在日常生活中的"桃花源"——那些讓我們心動、讓我們反思、讓我們找到內心平靜的時刻和地方
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Karen的沙龍 的其他內容
前言 前幾篇分享了 IBM Watsonx.ai 平台,以及在平台上使用 LLM 完成客戶體驗分析、與LLM串連處理較複雜的問題。在這一篇中,我們想來嘗試使用檢索增強生成(RAG)的技術,RAG 通過整合外部數據來增強基礎模型的回答能力,這不僅能解決模型訓練數據的局限性問題,還可以提供更精準和相關
前言 在先前的文章中,我們探討了 IBM Watsonx 在客戶滿意度分析中的應用。今天,我們將利用 Google 的兩款大型語言模型(LLM)— flan-ul2 和 flan-t5-xxl,展示它們如何串聯起來生成關於特定主題的隨機問題和回答。 在這篇文章中,將使用 SimpleSequen
前言 在上一篇文章中,分享了第一次使用 IBM Watsonx 的經歷,以及我對 Prompt lab 功能的初步探索。繼續這個話題,本文將探討 Watsonx 平台對 Python SDK 的支持,以及實作幾個 LLM 的應用,這一特性為開發者提供了極大的便利,使得在此平台上進行開發和應用大型語
前言 在這個迅速變化的技術世界裡,AI 已成為推動創新和效率的主要動力之一,最近很幸運得參加了IBM Watsonx 的 workshop,對我來說是一個很好的機會認識企業對於快速導入AI和整合AI應用的平台。IBM Watson 作為AI領域的先驅之一,長久以來一直在智慧型系統和認知計算方面處於
在數據科學和機器學習中,特徵工程是提高模型性能的關鍵步驟之一,通過創建新特徵或轉換現有特徵,我們可以更好地捕捉數據中的信息,提高模型的預測能力。然而,當處理大數據集時,特徵工程可能變得耗時,而且若是在研發階段,特徵其實是需要快速迭代去產生並且做後續的實驗,這也是近期遇到的問題,因此想在這篇文章實作多
1. 問題定義 每一個成功的模型都始於明確的問題定義! 核心思考:你的模型想要達到什麼目的? 例如:是要偵測每一筆交易是否涉及洗錢,還是要從大量資料中找出可能的洗錢關聯戶? 2. 數據檢查 數據是模型的基石,但不是所有數據都是有用的! 核心思考:你的數據夠嗎?時間分佈如何?正負樣本
前言 前幾篇分享了 IBM Watsonx.ai 平台,以及在平台上使用 LLM 完成客戶體驗分析、與LLM串連處理較複雜的問題。在這一篇中,我們想來嘗試使用檢索增強生成(RAG)的技術,RAG 通過整合外部數據來增強基礎模型的回答能力,這不僅能解決模型訓練數據的局限性問題,還可以提供更精準和相關
前言 在先前的文章中,我們探討了 IBM Watsonx 在客戶滿意度分析中的應用。今天,我們將利用 Google 的兩款大型語言模型(LLM)— flan-ul2 和 flan-t5-xxl,展示它們如何串聯起來生成關於特定主題的隨機問題和回答。 在這篇文章中,將使用 SimpleSequen
前言 在上一篇文章中,分享了第一次使用 IBM Watsonx 的經歷,以及我對 Prompt lab 功能的初步探索。繼續這個話題,本文將探討 Watsonx 平台對 Python SDK 的支持,以及實作幾個 LLM 的應用,這一特性為開發者提供了極大的便利,使得在此平台上進行開發和應用大型語
前言 在這個迅速變化的技術世界裡,AI 已成為推動創新和效率的主要動力之一,最近很幸運得參加了IBM Watsonx 的 workshop,對我來說是一個很好的機會認識企業對於快速導入AI和整合AI應用的平台。IBM Watson 作為AI領域的先驅之一,長久以來一直在智慧型系統和認知計算方面處於
在數據科學和機器學習中,特徵工程是提高模型性能的關鍵步驟之一,通過創建新特徵或轉換現有特徵,我們可以更好地捕捉數據中的信息,提高模型的預測能力。然而,當處理大數據集時,特徵工程可能變得耗時,而且若是在研發階段,特徵其實是需要快速迭代去產生並且做後續的實驗,這也是近期遇到的問題,因此想在這篇文章實作多
1. 問題定義 每一個成功的模型都始於明確的問題定義! 核心思考:你的模型想要達到什麼目的? 例如:是要偵測每一筆交易是否涉及洗錢,還是要從大量資料中找出可能的洗錢關聯戶? 2. 數據檢查 數據是模型的基石,但不是所有數據都是有用的! 核心思考:你的數據夠嗎?時間分佈如何?正負樣本
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
gcc11.4卡住的機會很高(目前不大確定但更新12後可以安裝暫且認定市這個問題吧) 要開始底下步驟前先把gcc換到12 GCC ref: ​清除舊版本 sudo apt-get --purge remove "*nvidia*" "libxnvctrl*" 下載​NVIDIA-
Thumbnail
NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
閱讀本篇之前,可先參考之前文章 散熱產業新趨勢( Nvidia新架構 ) 從發文到現在可看以下股價之反應 近期有觀察到散熱股的per有點反應到2025了,需要注意一下,有可能在最近或是3/18 GTC大展後利多出盡,畢竟現在新聞已經把這些內容寫出來,須留意風險。 總結:
Thumbnail
本文將介紹如何安裝CUDA和cuDNN,並提供注意事項。隨著安裝步驟和提示,確保您能成功安裝這些必要的套件。
Thumbnail
搜尋.......支援的driver: apt search nvidia-drive 最新支援到545,我們來裝545好了(通常我會選擇前一版,我也建議選前一版,像是python12 我們就選python11) sudo apt install nvidia-driver-545 sudo
sudo apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 安裝版本查找: http
Thumbnail
Nvidia將於周三(2/21)收盤後公布財報,需要用實際營收動能證明目前高價是否合理的,目前股價按預估獲利的本益比略高於32倍,在財報公布前夕,出現投資人提前下車的獲利了結賣壓, Nvidia股價下挫4.35%,引發AI族群股價走勢疲弱,AI晶片主要競爭對手AMD股價也重挫4.7%...
Thumbnail
過年期間,使用Fedora 39 版本的過程中遇到HDMI音效驅動問題,透過按alt+f2並輸入r後按Enter鍵重新啟動gnome-shell解決問題。
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
gcc11.4卡住的機會很高(目前不大確定但更新12後可以安裝暫且認定市這個問題吧) 要開始底下步驟前先把gcc換到12 GCC ref: ​清除舊版本 sudo apt-get --purge remove "*nvidia*" "libxnvctrl*" 下載​NVIDIA-
Thumbnail
NVIDIA(英偉達)作為全球領先的圖形處理器(GPU)製造商,不僅在遊戲市場佔有重要地位,還在專業圖形和高性能計算領域擁有強大的產品線。
Thumbnail
NVIDIA在人工智慧處理專用GPU領域的地位牢固,但面臨著來自英特爾和超微半導體等競爭對手的反擊。新興企業也加入競爭,使得競爭更加激烈。未來,合作關係將變得至關重要,NVIDIA和其他競爭對手在激烈的競爭中脫穎而出的關鍵。
Thumbnail
閱讀本篇之前,可先參考之前文章 散熱產業新趨勢( Nvidia新架構 ) 從發文到現在可看以下股價之反應 近期有觀察到散熱股的per有點反應到2025了,需要注意一下,有可能在最近或是3/18 GTC大展後利多出盡,畢竟現在新聞已經把這些內容寫出來,須留意風險。 總結:
Thumbnail
本文將介紹如何安裝CUDA和cuDNN,並提供注意事項。隨著安裝步驟和提示,確保您能成功安裝這些必要的套件。
Thumbnail
搜尋.......支援的driver: apt search nvidia-drive 最新支援到545,我們來裝545好了(通常我會選擇前一版,我也建議選前一版,像是python12 我們就選python11) sudo apt install nvidia-driver-545 sudo
sudo apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 安裝版本查找: http
Thumbnail
Nvidia將於周三(2/21)收盤後公布財報,需要用實際營收動能證明目前高價是否合理的,目前股價按預估獲利的本益比略高於32倍,在財報公布前夕,出現投資人提前下車的獲利了結賣壓, Nvidia股價下挫4.35%,引發AI族群股價走勢疲弱,AI晶片主要競爭對手AMD股價也重挫4.7%...
Thumbnail
過年期間,使用Fedora 39 版本的過程中遇到HDMI音效驅動問題,透過按alt+f2並輸入r後按Enter鍵重新啟動gnome-shell解決問題。