解決 NVIDIA GPU 驅動 libnvidia-ml.so 錯誤訊息

更新於 發佈於 閱讀時間約 2 分鐘

在這篇文章中,將分享最近遇到 NVIDIA GPU driver 的問題,這可能對面臨類似問題的人有所幫助~話不多說,直接開始正文!

raw-image

問題描述

當我嘗試使用 nvidia-smi 工具來檢查我的 NVIDIA GPU 狀態時,我遇到了一個錯誤訊息:NVIDIA-SMI couldn't find libnvidia-ml.so library in your system。這意味著系統無法找到 libnvidia-ml.so,這是 NVIDIA 驅動的一個關鍵庫文件,用於監控和管理 NVIDIA GPU。

這個問題通常指向 NVIDIA 驅動未正確安裝,或者系統無法正確定位到驅動的庫文件。

解決步驟

為了解決這個問題,我採取了以下步驟:

  1. 定位到庫文件目錄: 首先,我切換到包含 NVIDIA 驅動庫文件的目錄:如果不確定路徑在哪,可以先移動到根目錄,再用 find 指令去找
    cd /usr/lib/x86_64-linux-gnu
  2. 備份並替換 libcuda.so: 接著備份了 libcuda.so 文件,然後創建了一個指向 libcuda.so.1 的符號鏈接:
    cp libcuda.so libcuda.so.backup
    rm libcuda.so
    ln -s libcuda.so.1 libcuda.so
  3. 處理 libcuda.so.1: 我也備份並替換了 libcuda.so.1,以指向特定版本的庫文件:這裡的 libcuda.so.535.54.03 版本號碼,需配合硬體
    cp libcuda.so.1 libcuda.so.1.backup
    rm libcuda.so.1
    cp libcuda.so.535.54.03 libcuda.so.1
  4. 處理 libnvidia-ml.so.1: 最後,我對 libnvidia-ml.so.1 進行了類似的操作:
    cp libnvidia-ml.so.1 libnvidia-ml.so.1.backup
    rm libnvidia-ml.so.1
    ln -s libnvidia-ml.so.535.54.03 libnvidia-ml.so.1
  5. 測試更改: 完成這些操作後,我再次執行 nvidia-smi 來確認問題是否得到解決。出現這個畫面,表示有呼叫成功,就可以使用 GPU 繼續進行模型訓練。
nvidia-smi

nvidia-smi

結論

通過這些步驟,成功解決了 nvidia-smi 無法找到 libnvidia-ml.so 的問題。面對驅動相關問題時,有時候需要手動去管理 package 的連接與指向,不過這可能是暫時的解決方法,未來更新驅動可能都還要再次調整,最好的方式還是確保驅動正確安裝。

留言
avatar-img
留言分享你的想法!
avatar-img
Karen的沙龍
35會員
50內容數
歡迎來到《桃花源記》專欄。這裡不僅是一個文字的集合,更是一個探索、夢想和自我發現的空間。在這個專欄中,我們將一同走進那些隱藏在日常生活中的"桃花源"——那些讓我們心動、讓我們反思、讓我們找到內心平靜的時刻和地方
Karen的沙龍的其他內容
2025/04/21
這篇文章分析了學習英文的動機,根據Instagram抽書活動的留言,利用文字雲技術,歸納出大眾學習英文的主要原因是提升職場競爭力,並拓展國際職場機會。學習英文已不再是選項,而是攸關職涯發展的關鍵,持續提升英文能力將為個人帶來更多職涯選擇。
Thumbnail
2025/04/21
這篇文章分析了學習英文的動機,根據Instagram抽書活動的留言,利用文字雲技術,歸納出大眾學習英文的主要原因是提升職場競爭力,並拓展國際職場機會。學習英文已不再是選項,而是攸關職涯發展的關鍵,持續提升英文能力將為個人帶來更多職涯選擇。
Thumbnail
2024/09/04
我參加了由andyrockdata舉辦的資料治理超入門課程,這堂課程讓我在短時間內快速掌握資料治理的基本概念與實務運作。課程介紹了資料治理的框架、起源及相關解決方案,對於資料分析師與資料工程師而言,提供了有價值的學習資源與實踐建議。
Thumbnail
2024/09/04
我參加了由andyrockdata舉辦的資料治理超入門課程,這堂課程讓我在短時間內快速掌握資料治理的基本概念與實務運作。課程介紹了資料治理的框架、起源及相關解決方案,對於資料分析師與資料工程師而言,提供了有價值的學習資源與實踐建議。
Thumbnail
2024/03/28
Kafka是一個先進的分佈式流處理平臺,具有高吞吐量、可擴展性、容錯性和低延遲特性,提供瞭解耦、非同步和削峰特點。本文介紹了Kafka的通訊模式、適合的應用場景和未來發展趨勢,旨在幫助使用者更好地理解和應用Kafka。
Thumbnail
2024/03/28
Kafka是一個先進的分佈式流處理平臺,具有高吞吐量、可擴展性、容錯性和低延遲特性,提供瞭解耦、非同步和削峰特點。本文介紹了Kafka的通訊模式、適合的應用場景和未來發展趨勢,旨在幫助使用者更好地理解和應用Kafka。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
Nuxt 的安裝流程,一起來試試看吧
Thumbnail
Nuxt 的安裝流程,一起來試試看吧
Thumbnail
本文將介紹如何安裝CUDA和cuDNN,並提供注意事項。隨著安裝步驟和提示,確保您能成功安裝這些必要的套件。
Thumbnail
本文將介紹如何安裝CUDA和cuDNN,並提供注意事項。隨著安裝步驟和提示,確保您能成功安裝這些必要的套件。
Thumbnail
搜尋.......支援的driver: apt search nvidia-drive 最新支援到545,我們來裝545好了(通常我會選擇前一版,我也建議選前一版,像是python12 我們就選python11) sudo apt install nvidia-driver-545 sudo
Thumbnail
搜尋.......支援的driver: apt search nvidia-drive 最新支援到545,我們來裝545好了(通常我會選擇前一版,我也建議選前一版,像是python12 我們就選python11) sudo apt install nvidia-driver-545 sudo
Thumbnail
本文介紹了GPU在ESXI上的三種使用方式: 直通、vGPU、Bitfusion。針對一般使用者可以輕易取得的消費者端顯示卡進行了直通的例子和設定步驟。文章詳細介紹了BIOS、 ESXI HOST和虛擬機的設定以及需要注意的各種細節。提供了最新的nvidia驅動下載連結,並分享了測試的方法。
Thumbnail
本文介紹了GPU在ESXI上的三種使用方式: 直通、vGPU、Bitfusion。針對一般使用者可以輕易取得的消費者端顯示卡進行了直通的例子和設定步驟。文章詳細介紹了BIOS、 ESXI HOST和虛擬機的設定以及需要注意的各種細節。提供了最新的nvidia驅動下載連結,並分享了測試的方法。
Thumbnail
這篇文章將分享最近遇到 NVIDIA GPU driver 的問題,並提供瞭解決步驟,以及證實問題解決的測試方法。當您遇到類似問題時,可以參考這篇文章進行解決。文章中包含了定位庫文件目錄、備份和替換文件以及測試修改的步驟。
Thumbnail
這篇文章將分享最近遇到 NVIDIA GPU driver 的問題,並提供瞭解決步驟,以及證實問題解決的測試方法。當您遇到類似問題時,可以參考這篇文章進行解決。文章中包含了定位庫文件目錄、備份和替換文件以及測試修改的步驟。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News