[OpenCV基礎][Python]warpAffine仿射變換

更新於 發佈於 閱讀時間約 6 分鐘

warpAffinewarpPerspective 都是 OpenCV 中用於圖像變換的函數,主要差異在於這兩種函數所使用的變換矩陣的類型和適用場景。

本文主要討論warpAffine,另外warpPerspective可以此篇文章

[OpenCV基礎][Python]warpPerspective透視變換

仿射變換是一種線性的直線的、平行性幾何變換,將一個二維空間中的點映射另一個二維空間中。這種變換可以包括平移、旋轉、縮放、剪切等操作。

仿射變換可以用warpAffine()來實現。結果圖如下

仿射變換前後比較

仿射變換前後比較


差異

warpAffine:仿射變換

  • 變換矩陣類型: 2x3 的仿射變換矩陣。
  • 適用場景: 保持直線在變換後仍然是直線平行線依然保持平行簡單的平。適用於移、旋轉、縮放等變換,但無法處理透視變換。

warpPerspective:透視變換

  • 變換矩陣類型: 3x3 的透視變換矩陣。
  • 適用場景: 除了可以進行仿射變換外,還能處理透視變換,即使平行線在變換後也可能不再平行。這使得它適用於更廣泛的應用,如文件矯正、校正透視變形等。
圖像座標表示方法

圖像座標表示方法


語法

cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])
  • src:要進行透視變換的輸入圖像
  • M透視變換2x3變換矩陣
  • dsize:輸出圖像的大小,以元組(width, height)表示。

進階參數(可選擇不填,則會使用默認)

  • dst:輸出圖像,可選參數,如果未提供,則函數會創建一個與 dsize 相同大小的空白圖像。
  • flags:進行變換時的插值方法:cv2.INTER_NEAREST最近鄰插值,使用最近鄰的像素值進行插值,速度最快,但效果可能不夠平滑。cv2.INTER_LINEAR雙線性插值,使用相鄰四個像素的加權平均值,效果比最近鄰好一些,但計算成本較高。cv2.INTER_CUBIC雙三次插值,使用相鄰的16個像素進行插值,產生更平滑的效果,但計算成本最高。

  • borderMode:用於處理邊界模式:cv2.BORDER_CONSTANT常數邊界模式,邊界外的像素使用指定的常數值填充。cv2.BORDER_REFLECT反射邊界模式,邊界外的像素是邊界內像素的鏡像反射。cv2.BORDER_WRAP循環邊界模式,像素位置溢出時,回到相對應的另一邊。
  • borderMode 設定為 cv2.BORDER_CONSTANT 時:可以使用 borderValue 參數指定邊界常數值。這個值通常是一個顏色值,例如白色 (255, 255, 255) 或黑色 (0, 0, 0)

參數幾乎與warpPerspective相似,主要區別在於變換矩陣 M 的大小和形式,以及 warpPerspective 能夠處理更一般的透視變換,而 warpAffine 僅能處理保持平行線的仿射變換。


程式範例 - 平移

import cv2
import numpy as np

# 讀取輸入圖像
img = cv2.imread('input_image.jpg')

# 指定物體的位移量(平移50個像素到右下方)
tx, ty = 50, 50

# 定義仿射變換矩陣 M
M = np.float32([[1, 0, tx], [0, 1, ty]])

# 應用仿射變換
result = cv2.warpAffine(img, M, (img.shape[1], img.shape[0]))

# 顯示原始圖像和變換後的圖像
cv2.imshow('Original Image', img)
cv2.imshow('Affine Transformed Image', result)
cv2.waitKey(0)
cv2.destroyAllWindows()
平移比較

平移比較


程式範例 - 縮放、剪切

import cv2
import numpy as np

# 讀取輸入圖像
img = cv2.imread('123.jpg')

# 仿射變換前的三個點,這些點可以是手動選取或使用檢測算法(例如角點檢測)
src_pts = np.array([[2700, 970], #左上
[6000, 60], #右上
[6000, 3300]], #右下
dtype=np.float32)

# 仿射變換後的目標三個點
dst_pts = np.array([[0, 0], #左上
[6000, 0], #右上
[6000, 3368]], #右下
dtype=np.float32)

# 計算仿射變換矩陣 M
M = cv2.getAffineTransform(src_pts, dst_pts)

# 應用仿射變換
result = cv2.warpAffine(img, M, (img.shape[1], img.shape[0]))

# 顯示原始圖像和變換後的圖像

cv2.imshow('Original Image', img)
cv2.imshow('warpAffine Transformed Image', result)
cv2.waitKey(0)
cv2.destroyAllWindows()
仿射變換前,原圖標示座標

仿射變換前,原圖標示座標

仿射變換後

仿射變換後


數學表示法:

一個二維仿射變換可以表示為以下的矩陣形式:

x,y 是原始圖像中的座標,x′,y′ 是變換後的座標,矩陣中的a,b,c,d,e,f 是變換矩陣的參數。

  • ae控制縮放(縮放因子),當它們不等於1時,進行縮放操作。
  • bd控制剪切,當它們不等於0時,進行剪切操作。
  • cf控制平移,它們是平移的量。
仿射變換數學式

仿射變換數學式

簡單來說,對於一個點 (x,y),使用變換矩陣進行仿射變換的計算就是將這個點的坐標應用於變換矩陣的線性運算


根據本身的需求來選擇要透視變換還是仿射變換吧
















留言
avatar-img
留言分享你的想法!
小松鼠-avatar-img
2024/02/09
螃蟹 新年快樂~
螃蟹_crab-avatar-img
發文者
2024/02/11
小松鼠 新年快樂~
小松鼠-avatar-img
2024/02/08
狗狗可愛~
avatar-img
螃蟹_crab的沙龍
139會員
249內容數
本業是影像辨識軟體開發,閒暇時間進修AI相關內容,將學習到的內容寫成文章分享。
螃蟹_crab的沙龍的其他內容
2025/02/15
在電腦視覺應用中,輪廓(Contour)常用來描述物體的邊界。 當圖像中有雜訊或物體邊緣過於複雜時,我們可以利用輪廓逼近技術,將輪廓簡化成較少點數的多邊形,這不僅有助於後續的形狀分析,也能提高處理速度。 本文將介紹如何使用 OpenCV 中的 cv2.arcLength 與 cv2.approx
Thumbnail
2025/02/15
在電腦視覺應用中,輪廓(Contour)常用來描述物體的邊界。 當圖像中有雜訊或物體邊緣過於複雜時,我們可以利用輪廓逼近技術,將輪廓簡化成較少點數的多邊形,這不僅有助於後續的形狀分析,也能提高處理速度。 本文將介紹如何使用 OpenCV 中的 cv2.arcLength 與 cv2.approx
Thumbnail
2024/12/02
中值濾波器(Adaptive Median Filter)是一種針對噪聲去除的圖像處理技術,主要應用於處理含有椒鹽雜訊的圖像,但在椒鹽雜訊過大時就會面臨,若為了處理掉雜訊,使用的處理窗口(kernel)就要大一點,會造成圖像的邊緣模糊掉。 後面為解決這個問題,就發展了自適應中值濾波器,其概念源自於
Thumbnail
2024/12/02
中值濾波器(Adaptive Median Filter)是一種針對噪聲去除的圖像處理技術,主要應用於處理含有椒鹽雜訊的圖像,但在椒鹽雜訊過大時就會面臨,若為了處理掉雜訊,使用的處理窗口(kernel)就要大一點,會造成圖像的邊緣模糊掉。 後面為解決這個問題,就發展了自適應中值濾波器,其概念源自於
Thumbnail
2024/10/03
在影像處理中,形態學操作是非常重要的一種技術,能夠幫助我們去除噪點、強化特徵、修復物體的形狀等。形態學操作的核心是「結構元素」(kernel),不同形狀的結構元素會產生不同的處理效果。本文將介紹如何使用不同形狀的結構元素來進行圖像處理,並結合實際程式範例和測試圖片來說明其效果。
Thumbnail
2024/10/03
在影像處理中,形態學操作是非常重要的一種技術,能夠幫助我們去除噪點、強化特徵、修復物體的形狀等。形態學操作的核心是「結構元素」(kernel),不同形狀的結構元素會產生不同的處理效果。本文將介紹如何使用不同形狀的結構元素來進行圖像處理,並結合實際程式範例和測試圖片來說明其效果。
Thumbnail
看更多