使用 YOLO v8 建立基本圖片辨識並匯出 CSV 資料檔案

更新 發佈閱讀 5 分鐘

目的

這次主題是要使用 YOLO 8 來建立基本圖片辨識, 並且產出 csv 的資料檔案。

步驟

進入 COLAB

首先需要先進入 google 的 colab, 就可以省掉安裝 python 的環境, 全部的內容皆在雲端跑, 也不會吃電腦太多的資源。

安裝 YOLO 8

!pip install ultralytics

這個指令主要是用來安裝 YOLO 的套件, 可以看見執行後會 import 很多套件, 用於之後圖片分類辨識的基礎

Import 需要的資源

from ultralytics import YOLO
import cv2
from matplotlib import pyplot as pyplot​

讀取圖片

將圖片內容放入左邊的檔案當中

raw-image



raw-image










並且跑以下這段程式碼, 記得在前面加入 /content/ 才可以順利抓取到圖片路徑

street_image = '/content/Street.jpg'

載入模型 顯示結果

# 載入 YOLO 模型​
model = YOLO('yolov8n.pt')

# 偵測圖片
results = model(street_image)

# 顯示結果
results[0].show()
raw-image






其中可以看見, 在模型的會標示出 motorcycle 和 person 或者 car 還有 bicycle 幾種類別, 旁邊分別為信心指數, 指數越高, 代表模型對於該判斷越有信心!

匯出 csv 檔案

圖片中可以發現所有的分類都是透過框框來顯示, 所以 csv 檔案的結果也會是四個邊框的邊框的相對位置分別為 x1, y1, x2, y2 還有 condifence, 跟分類的標籤和名稱 class_id, class_name

import pandas as pd 

# 提取邊界框資訊
boxes = result[0].boxes

# 將邊界框轉換成更容易處理的格式
bounding_box_data = []
for box in boxes:
x1, y1, x2, y2 = [round(float(val), 2) for val in box.xyxy[0]] # 取得邊界框座標
​confidence = round(float(box.conf[0], 2) # 取得信心分數
class_id = int(box.cls[0]) # 取得類別 ID
class_name = model.names[class.id] # 取得類別名稱

bounding_box_data.append({
'x1': x1,
'y1': y1,
'x2': x2,
'y2': y2,
'confience': confidence,
'class_id': class_id,
'class_name': class_name
})

# 創建 DataFrame
df_detections = pd.DataFrame(bounding_box_data)

# 顯示在下方資訊
display(df_detections)

# 取得提取速度資訊
speed_data = results[0].speed
raw-image







最後是匯出 csv 檔案, 則是會顯示在左邊的位置, 可以提供下載並使用。

# 如果您想將偵測結果儲存為 CSV 檔案:

df_detections.to_csv('yolo_detections.csv', index=False)

print("偵測結果已儲存到 yolo_detections.csv")



# 如果您想將速度資訊儲存為 JSON 或其他格式,可以自行處理

import json

with open('yolo_speed.json', 'w') as f:

    json.dump(speed_data, f)

print("處理速度已儲存到 yolo_speed.json")

總結

這邊為簡單透過 YOLO 8 來分類台灣街景內的分類, 雖然模型具有泛化通用的分類, 但若想要提升精確度則需要做個別的訓練, 才能達到更高的水準。



留言
avatar-img
Krist
2會員
11內容數
您好, 目前是軟體工程師 Krist
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
🚀 Google 聯手 Replit:AI 程式革命最大合縱連橫! 對抗 Anthropic、Cursor 的關鍵一役,程式開發者迎來全新武器 📚 目錄 為什麼這件事值得你關注? Google × Replit:官方確認的合作內容 Replit 為什麼變成 Google 想押注的超級平
Thumbnail
🚀 Google 聯手 Replit:AI 程式革命最大合縱連橫! 對抗 Anthropic、Cursor 的關鍵一役,程式開發者迎來全新武器 📚 目錄 為什麼這件事值得你關注? Google × Replit:官方確認的合作內容 Replit 為什麼變成 Google 想押注的超級平
Thumbnail
如果不寫程式,我大概會去寫詩,雖然這兩者在本質上是一樣的:都是在一堆符號裡試圖尋找邏輯,然後在凌晨三點崩潰。 今天要聊聊 Google 最近爆紅的 AI 模型——「Nano Banana」(奈米香蕉)。 當你聽到這個名字,你可能會以為這是什麼矽谷
Thumbnail
如果不寫程式,我大概會去寫詩,雖然這兩者在本質上是一樣的:都是在一堆符號裡試圖尋找邏輯,然後在凌晨三點崩潰。 今天要聊聊 Google 最近爆紅的 AI 模型——「Nano Banana」(奈米香蕉)。 當你聽到這個名字,你可能會以為這是什麼矽谷
Thumbnail
Google Antigravity 是 Google 釋出的全新 AI 代理人(Agent)型 IDE,讓 AI 不只是寫程式的助手,而是可以「實際操作」你的開發環境、幫你完成任務的真正虛擬工程師。 Antigravity 的核心特點 1. 代理人式 IDE(Agent-First IDE)
Thumbnail
Google Antigravity 是 Google 釋出的全新 AI 代理人(Agent)型 IDE,讓 AI 不只是寫程式的助手,而是可以「實際操作」你的開發環境、幫你完成任務的真正虛擬工程師。 Antigravity 的核心特點 1. 代理人式 IDE(Agent-First IDE)
Thumbnail
在與 Claude Pro 一次漫長的對話互動的過程中,最後我問了一個看似簡單的問題,打算作為結論:「資本平準金是不是可以用來補充資本利得?」這句話本身並不複雜,卻讓 Claude Pro 陷入了一場無限迴圈的推理迷宮,最終甚至觸發使用上限,要求我「 3 小時之後再來」。
Thumbnail
在與 Claude Pro 一次漫長的對話互動的過程中,最後我問了一個看似簡單的問題,打算作為結論:「資本平準金是不是可以用來補充資本利得?」這句話本身並不複雜,卻讓 Claude Pro 陷入了一場無限迴圈的推理迷宮,最終甚至觸發使用上限,要求我「 3 小時之後再來」。
Thumbnail
本文深入探討各種資料模型(關聯式、文件、圖形)及其查詢語言(SQL、MapReduce、Cypher、SPARQL),比較其優缺點及適用場景,並以實際案例說明如何選擇最適合的資料模型與查詢語言。
Thumbnail
本文深入探討各種資料模型(關聯式、文件、圖形)及其查詢語言(SQL、MapReduce、Cypher、SPARQL),比較其優缺點及適用場景,並以實際案例說明如何選擇最適合的資料模型與查詢語言。
Thumbnail
🧠 從符號邏輯到感知交互:Vibe Coding 時代的工程師再定義 隨著大型語言模型(LLMs)如 GPT-4、Claude、Gemini 進入實用成熟期,我們迎來的不僅是生產力工具的升級,更是一場 編程範式的轉移(paradigm shift)。這場轉變不只是技術演進,更是人機關係、技能定義
Thumbnail
🧠 從符號邏輯到感知交互:Vibe Coding 時代的工程師再定義 隨著大型語言模型(LLMs)如 GPT-4、Claude、Gemini 進入實用成熟期,我們迎來的不僅是生產力工具的升級,更是一場 編程範式的轉移(paradigm shift)。這場轉變不只是技術演進,更是人機關係、技能定義
Thumbnail
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
Thumbnail
今年的AI EXPO Taiwan在3月26日至28日於台北圓山花博爭豔館舉辦,因為排課的關係,我在最後一天的時候前往參觀。雖然這場展覽主要是一個B2B的展覽,不過,由於有以前當工程師的經驗,有些議題我也還是蠻感興趣,而如果能收集各種情報,或者能有一些可以從學界出發掌握的機會,我想也是很不錯的。
Thumbnail
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
Thumbnail
最近正在進行期中考題的出題,並且在設計大語言模型這門選修課和資料結構這門必修課的作業的時候,我一直在想一個核心的問題:同學們需要什麼樣的能力,讓他們在畢業之後可以用來當作面對如今變化多端的業界的武器?程式設計師會被AI時代淘汰嗎? 可以用ChatGPT寫作業嗎? 由於ChatGPT等強大的基於大
Thumbnail
Devin 是世界上首位虛擬 AI 工程師,擁有寫程式、架設網站、除錯、自動化測試等技術。憑藉出色的學習能力,Devin 能夠自動檢查並修正程式碼錯誤,還能自行訓練和微調自身 AI 模型。本文探討了 AI 工程師的能力以及對軟體工程師就業市場的潛在影響。
Thumbnail
Devin 是世界上首位虛擬 AI 工程師,擁有寫程式、架設網站、除錯、自動化測試等技術。憑藉出色的學習能力,Devin 能夠自動檢查並修正程式碼錯誤,還能自行訓練和微調自身 AI 模型。本文探討了 AI 工程師的能力以及對軟體工程師就業市場的潛在影響。
Thumbnail
傳統上,我們認為付出努力即可逐步接近目標,但在機器學習中,追求完美可能導致整體效能下降。,有時捨棄少量極端值,換取大幅提升整體模型表現更為實際。
Thumbnail
傳統上,我們認為付出努力即可逐步接近目標,但在機器學習中,追求完美可能導致整體效能下降。,有時捨棄少量極端值,換取大幅提升整體模型表現更為實際。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News