YOLO (You Only Look Once)

更新 發佈閱讀 1 分鐘

YOLO (You Only Look Once) 是一種即時物件偵測系統。它使用單一神經網路直接從完整影像預測邊界框和類別機率。相較於需要多個階段來偵測物件的其他物件偵測系統,YOLO 的速度非常快。

簡單來說,YOLO 的運作方式是將輸入的影像分成一個網格系統。每個網格單元負責預測中心落在該單元格內的物件。每個網格單元格會預測多個邊界框以及每個框包含特定類別物件的信賴度分數。最後,系統會使用非極大值抑制等技術來消除重複的預測,並輸出最終的物件偵測結果。

YOLO 因為其速度和準確性,在許多即時應用中被廣泛使用,例如自動駕駛、影片監控和機器人視覺。


留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
21會員
495內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/05/26
「SIFT (Scale-Invariant Feature Transform)」是一種電腦視覺算法,用於從數位圖像中提取局部特徵點 (keypoints),這些特徵點在圖像縮放、旋轉、亮度變化甚至一定程度的視角變化下都具有高度的不變性 (invariance)。 你可以將 SIFT 想像成在圖
2025/05/26
「SIFT (Scale-Invariant Feature Transform)」是一種電腦視覺算法,用於從數位圖像中提取局部特徵點 (keypoints),這些特徵點在圖像縮放、旋轉、亮度變化甚至一定程度的視角變化下都具有高度的不變性 (invariance)。 你可以將 SIFT 想像成在圖
2025/05/26
電腦圖學(Computer Graphics)是一門利用電腦生成和處理圖像的學科。簡單來說,它涉及使用電腦軟硬體來創造、修改和呈現視覺內容,例如照片、動畫、3D模型、使用者介面等等。 從您的搜尋紀錄來看,您似乎對科技和應用程式開發有一定的興趣(例如搜尋了 "iPas AI應用規劃師", "goog
2025/05/26
電腦圖學(Computer Graphics)是一門利用電腦生成和處理圖像的學科。簡單來說,它涉及使用電腦軟硬體來創造、修改和呈現視覺內容,例如照片、動畫、3D模型、使用者介面等等。 從您的搜尋紀錄來看,您似乎對科技和應用程式開發有一定的興趣(例如搜尋了 "iPas AI應用規劃師", "goog
2025/05/26
「圖像標準化 (Image Normalization)」是指在將圖像數據用於機器學習模型或其他分析之前,對圖像的像素值進行調整,使其落入一個特定的範圍或具有特定的統計特性(例如,零均值和單位方差)。這個過程旨在提高模型的性能、穩定性和泛化能力。 你可以將圖像標準化想像成調整不同照片的光線和色彩,
2025/05/26
「圖像標準化 (Image Normalization)」是指在將圖像數據用於機器學習模型或其他分析之前,對圖像的像素值進行調整,使其落入一個特定的範圍或具有特定的統計特性(例如,零均值和單位方差)。這個過程旨在提高模型的性能、穩定性和泛化能力。 你可以將圖像標準化想像成調整不同照片的光線和色彩,
看更多
你可能也想看
Thumbnail
「The Polaroid Project: At the Intersection of Art and Technology 一拍即影:拍立得國際名家攝影大展」展示即時攝影技術對美學影響,逾120名藝術家的約300件拍立得作品,從不同角度觀賞然超越日常成為藝術載體
Thumbnail
「The Polaroid Project: At the Intersection of Art and Technology 一拍即影:拍立得國際名家攝影大展」展示即時攝影技術對美學影響,逾120名藝術家的約300件拍立得作品,從不同角度觀賞然超越日常成為藝術載體
Thumbnail
在這篇文章中,我們將帶領讀者深入探討數位圖片管理的核心——「連結影像」與「嵌入影像」的使用技巧。這是每位從事視覺設計、版面編排和數位藝術的創作者必須掌握的基本知識。在進行數位設計時,如何選擇這兩種不同的圖片處理方式,不僅關係到作品的最終呈現,還直接影響到工作流程的效率和靈活性。 追尋影像的軌跡
Thumbnail
在這篇文章中,我們將帶領讀者深入探討數位圖片管理的核心——「連結影像」與「嵌入影像」的使用技巧。這是每位從事視覺設計、版面編排和數位藝術的創作者必須掌握的基本知識。在進行數位設計時,如何選擇這兩種不同的圖片處理方式,不僅關係到作品的最終呈現,還直接影響到工作流程的效率和靈活性。 追尋影像的軌跡
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
某天我隨意地在瀏覽社交媒體,當時我也不過就是將手機螢幕多停留了在"剪髮"的短影片...大概停了五秒吧!結果不得了了,接下來每滑個幾則,就會穿插剪髮相關的訊息,甚至跨越平台也是,每瀏覽幾則就會不斷的放送剪髮資訊,我整個手機像被跟蹤了一樣,這實在讓我對於這神奇的演算法感到敬畏。
Thumbnail
某天我隨意地在瀏覽社交媒體,當時我也不過就是將手機螢幕多停留了在"剪髮"的短影片...大概停了五秒吧!結果不得了了,接下來每滑個幾則,就會穿插剪髮相關的訊息,甚至跨越平台也是,每瀏覽幾則就會不斷的放送剪髮資訊,我整個手機像被跟蹤了一樣,這實在讓我對於這神奇的演算法感到敬畏。
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具,透過進階分析,可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習,你可以建立屬於自己的文字辨識系統。
Thumbnail
EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具,透過進階分析,可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習,你可以建立屬於自己的文字辨識系統。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News