vocus logo

方格子 vocus

U-Net

更新 發佈閱讀 3 分鐘

U-Net 是一種專門設計用於生物醫學影像分割的卷積神經網路架構,但現在也廣泛應用於其他領域的影像分割任務。它之所以被稱為「U-Net」,是因為它的架構呈現一個明顯的「U」形。

以下是 U-Net 架構的主要特點:

* 收縮路徑 (Contracting Path) / 編碼器 (Encoder):

* 這部分是 U 形結構的左側(下行部分)。

* 它由多個卷積層(通常是兩個 3x3 卷積)組成,每個卷積層後跟一個 ReLU 激活函數和一個用於降採樣的 2x2 最大池化層,步長為 2。

* 這個路徑的作用是逐步提取輸入圖像的上下文信息,也就是圖像中不同層次的特徵。隨著網路的深入,空間解析度會降低,但特徵的數量會增加。

* 擴張路徑 (Expanding Path) / 解碼器 (Decoder):

* 這部分是 U 形結構的右側(上行部分)。

* 它也由多個卷積層組成,但與收縮路徑不同的是,它使用轉置卷積(或稱為反卷積)來進行上採樣,增加特徵圖的空間解析度。

* 每個上採樣步驟後,會將來自收縮路徑中對應層級的特徵圖進行裁剪和拼接(concatenation)。這個拼接是 U-Net 的關鍵創新之一,它允許解碼器利用編碼器提取的低階細節特徵。

* 拼接後,通常會跟隨兩個 3x3 卷積層和 ReLU 激活函數。

* 跳躍連接 (Skip Connections):

* U 形結構中連接收縮路徑和擴張路徑的水平箭頭就是跳躍連接。

* 它們直接將收縮路徑中較早層級的高解析度特徵圖傳遞到擴張路徑中對應的層級。

* 這樣做的目的是彌補在降採樣過程中損失的細節信息,使得網路在生成最終的分割結果時能夠更精確地定位物體的邊界。

* 輸出層 (Output Layer):

* 在擴張路徑的最後,通常會使用一個 1x1 的卷積層將最終的特徵圖映射到所需的類別數量。

* 對於二元分割(例如,區分前景和背景),輸出通常是一個通道的圖像,每個像素的值表示屬於前景的機率。

U-Net 的優勢:

* 有效利用上下文信息和細節信息: 透過收縮路徑獲取全局上下文,並透過跳躍連接結合來自收縮路徑的細節信息,實現精確的分割。

* 適用於小數據集: 由於其架構設計,U-Net 相較於其他深度學習模型,在只有少量標註數據的情況下也能取得不錯的成果。

* 端到端訓練: 可以直接輸入原始圖像,輸出分割結果,無需複雜的後處理步驟。

總結來說,U-Net 是一種強大的影像分割網路,其獨特的 U 形架構和跳躍連接使其能夠有效地結合上下文信息和細節信息,從而在各種影像分割任務中表現出色,尤其是在生物醫學影像分析領域。


留言
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
43會員
571內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 初級+中級(數據分析) AWS Certified AI Practitioner (AIF-C01) 其他:富邦美術館志工
2025/05/28
尺度空間理論 (Scale-Space Theory) 是一種在電腦視覺和圖像處理中使用的框架,其核心概念是透過對原始圖像進行不同程度的模糊(或平滑化),以獲得一系列不同「尺度」的圖像表示。這個過程模仿了我們在不同距離觀察物體時所看到的細節程度變化。 以下是一些關於尺度空間理論的重要概念: *
2025/05/28
尺度空間理論 (Scale-Space Theory) 是一種在電腦視覺和圖像處理中使用的框架,其核心概念是透過對原始圖像進行不同程度的模糊(或平滑化),以獲得一系列不同「尺度」的圖像表示。這個過程模仿了我們在不同距離觀察物體時所看到的細節程度變化。 以下是一些關於尺度空間理論的重要概念: *
2025/05/28
光流估計 (Optical Flow Estimation) 是一種電腦視覺技術,用來估算影像序列中每個像素點在連續幀之間的運動情況。想像你正在看一段影片,光流估計就是分析影片中每個小點如何從一幀移動到下一幀。 更具體地說: * 目的: 計算影像序列中像素點隨著時間推移的運動向量。這個向量包含
2025/05/28
光流估計 (Optical Flow Estimation) 是一種電腦視覺技術,用來估算影像序列中每個像素點在連續幀之間的運動情況。想像你正在看一段影片,光流估計就是分析影片中每個小點如何從一幀移動到下一幀。 更具體地說: * 目的: 計算影像序列中像素點隨著時間推移的運動向量。這個向量包含
2025/05/28
YOLO (You Only Look Once) 是一種即時物件偵測系統。它使用單一神經網路直接從完整影像預測邊界框和類別機率。相較於需要多個階段來偵測物件的其他物件偵測系統,YOLO 的速度非常快。 簡單來說,YOLO 的運作方式是將輸入的影像分成一個網格系統。每個網格單元負責預測中心落在該單
2025/05/28
YOLO (You Only Look Once) 是一種即時物件偵測系統。它使用單一神經網路直接從完整影像預測邊界框和類別機率。相較於需要多個階段來偵測物件的其他物件偵測系統,YOLO 的速度非常快。 簡單來說,YOLO 的運作方式是將輸入的影像分成一個網格系統。每個網格單元負責預測中心落在該單
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
有別於傳統空心線圈的成形,大多僅在二維平面上有所差異,如圓形、方形、三角形、梯形等等,然而此一案例則是將線圈造型延伸三維空間當中,採用了U型及I型的空間配置,同時後續還有個組裝的配合條件,十分具有挑戰性,故紀錄其改善內容。 一、嘗試初期 已知此空心線圈後續還有組裝排列的工序,故單顆線圈完成後就需
Thumbnail
有別於傳統空心線圈的成形,大多僅在二維平面上有所差異,如圓形、方形、三角形、梯形等等,然而此一案例則是將線圈造型延伸三維空間當中,採用了U型及I型的空間配置,同時後續還有個組裝的配合條件,十分具有挑戰性,故紀錄其改善內容。 一、嘗試初期 已知此空心線圈後續還有組裝排列的工序,故單顆線圈完成後就需
Thumbnail
控制論(Cybernetics)是一個跨學科的科學領域,致力於研究控制和通信在各種系統中的應用,無論是動物、機器還是組織系統。這門學科由美國數學家諾伯特·維納(Norbert Wiener)在20世紀40年代創立,其核心目標是理解和設計複雜系統的行為和功能。
Thumbnail
控制論(Cybernetics)是一個跨學科的科學領域,致力於研究控制和通信在各種系統中的應用,無論是動物、機器還是組織系統。這門學科由美國數學家諾伯特·維納(Norbert Wiener)在20世紀40年代創立,其核心目標是理解和設計複雜系統的行為和功能。
Thumbnail
WaveNet 提供了一個先進的架構用於音訊重建,但是,有必要嗎? Mel 頻譜本身就是經過數學轉換而獲得的結果,不能反運算嗎 ? 到底 WaveNet 在其中扮演了甚麼腳色 ?它是如何運作的 ? 讓我們在這篇好好探討下去。
Thumbnail
WaveNet 提供了一個先進的架構用於音訊重建,但是,有必要嗎? Mel 頻譜本身就是經過數學轉換而獲得的結果,不能反運算嗎 ? 到底 WaveNet 在其中扮演了甚麼腳色 ?它是如何運作的 ? 讓我們在這篇好好探討下去。
Thumbnail
大語言模型(如GPT-3和GPT-4)的出現改變了我們與機器互動的方式。這些模型能夠理解和生成自然語言,實現許多以前無法想像的應用。然而,你可能會好奇,這些模型究竟是如何理解語言的?這裡,我們來探討一個關鍵的概念:「一切語義都是關係」。
Thumbnail
大語言模型(如GPT-3和GPT-4)的出現改變了我們與機器互動的方式。這些模型能夠理解和生成自然語言,實現許多以前無法想像的應用。然而,你可能會好奇,這些模型究竟是如何理解語言的?這裡,我們來探討一個關鍵的概念:「一切語義都是關係」。
Thumbnail
目錄 序 導論: 一個西方觀點的評述 1.0 從函數到函數算法 ......1.1 句子成份
Thumbnail
目錄 序 導論: 一個西方觀點的評述 1.0 從函數到函數算法 ......1.1 句子成份
Thumbnail
這篇文章,會帶著大家複習以前學過的BFS框架, 並且以圖論的應用題與概念為核心, 貫穿一些相關聯的題目,透過框架複現來幫助讀者理解這個演算法框架。 BFS 框架 + 演算法 虛擬碼 # Queue 通常初始化成根結點,作為起點 BFS_queue = deque([root])​ # 先
Thumbnail
這篇文章,會帶著大家複習以前學過的BFS框架, 並且以圖論的應用題與概念為核心, 貫穿一些相關聯的題目,透過框架複現來幫助讀者理解這個演算法框架。 BFS 框架 + 演算法 虛擬碼 # Queue 通常初始化成根結點,作為起點 BFS_queue = deque([root])​ # 先
Thumbnail
這篇文章,會帶著大家複習以前學過的前綴和框架, 並且以區間和的概念與應用為核心, 貫穿一些相關聯的題目,透過框架複現來幫助讀者理解這個演算法框架。 前綴和 prefix sum框架 與 區間和計算的關係式 接下來,我們會用這個上面這種框架,貫穿一些同類型,有關聯的題目 (請讀者、或觀眾
Thumbnail
這篇文章,會帶著大家複習以前學過的前綴和框架, 並且以區間和的概念與應用為核心, 貫穿一些相關聯的題目,透過框架複現來幫助讀者理解這個演算法框架。 前綴和 prefix sum框架 與 區間和計算的關係式 接下來,我們會用這個上面這種框架,貫穿一些同類型,有關聯的題目 (請讀者、或觀眾
Thumbnail
剖面的7大類型   本書挑選已完成的63個當代建築案例(1906~2016),將剖面的構築邏輯呈現出來,及證明剖面的複雜性不會犧牲營造的可能性,並歸納出剖面的7大類型,分別為:1. 拉伸型(Extrusion)、2. 堆疊型(Stack)、3. 塑造型(Shape)、4. 剪切型(Sh
Thumbnail
剖面的7大類型   本書挑選已完成的63個當代建築案例(1906~2016),將剖面的構築邏輯呈現出來,及證明剖面的複雜性不會犧牲營造的可能性,並歸納出剖面的7大類型,分別為:1. 拉伸型(Extrusion)、2. 堆疊型(Stack)、3. 塑造型(Shape)、4. 剪切型(Sh
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News