如何在 OpenCV Python 中对给定图像执行距离变换?


我们可以使用cv2.distanceTransform()方法执行距离变换。以下是此方法的语法。

语法

cv2.distanceTransform(src, distanceType, maskSize)

此方法接受以下参数:

  • src - 8 位,单通道(二值)源图像。

  • distanceType - 距离的类型。

  • maskSize - 距离变换掩码的大小。

步骤

要对图像执行距离变换,我们可以按照以下步骤操作:

  • 导入所需的库。在以下所有示例中,所需的 Python 库是OpenCV。确保您已安装它。

  • 使用cv2.imread()读取输入图像。使用此方法读取的 RGB 图像是 BGR 格式。可以选择将读取的 BGR 图像赋值给 img。

  • 现在,使用cv2.cvtColor()函数将此 BGR 图像转换为灰度图像。可以选择将转换后的灰度图像赋值给 gray。

  • 现在对灰度图像应用阈值处理,将其转换为二值图像。调整第二个参数 (threshValue) 以获得更好的二值图像。

  • 使用cv2.distanceTransform()对二值图像应用距离变换。它返回距离变换后的图像。将此图像归一化到 [0,1] 范围内。

  • 显示距离变换后的图像。

让我们来看一些例子,以便更好地理解。

输入图像

我们将在下面的示例中使用此图像作为输入文件。


示例

在此示例中,我们找到输入图像的距离变换。我们将cv2.DIST_L2作为 distanceType,并将 maskSize 设置为 3。

# Load image in grayscale import cv2 import numpy as np import matplotlib.pyplot as plt # Read the input image img = cv2.imread('sketch.jpg') # convert the image to grayscale gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # apply thresholding to convert the grayscale image to a binary image ret,thresh = cv2.threshold(gray,150,255,cv2.THRESH_BINARY) # Apply distance transform on the binary image dist = cv2.distanceTransform(thresh, cv2.DIST_L2, 3) # Normalize the distance image for range = {0.0, 1.0} # so we can visualize and threshold it cv2.normalize(dist, dist, 0, 1.0, cv2.NORM_MINMAX) cv2.imshow('Distance Transform Image', dist) cv2.waitKey(0) cv2.destroyAllWindows()

输出

运行上面的 Python 程序后,它将生成以下输出窗口:


示例

在此示例中,我们找到输入图像的距离变换。我们应用五种不同类型的 distanceType 和 maskSize 为 3。

# import required libraries import cv2 import matplotlib.pyplot as plt # Read the input image img = cv2.imread('sketch.jpg') # convert the image to grayscale gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # Apply thresholding to convert the grayscale image to a binary image ret,thresh = cv2.threshold(gray,150,255,cv2.THRESH_BINARY) # Apply distance transform on the binary image dist_C = cv2.distanceTransform(thresh, cv2.DIST_C, 3) dist_L1 = cv2.distanceTransform(thresh, cv2.DIST_L1, 3) dist_L2 = cv2.distanceTransform(thresh, cv2.DIST_L2, 3) dist_LP = cv2.distanceTransform(thresh, cv2.DIST_LABEL_PIXEL, 3) dist_M = cv2.distanceTransform(thresh, cv2.DIST_MASK_3, 3) # Normalize the distance image for range = {0.0, 1.0} # so we can visualize and threshold it cv2.normalize(dist_C, dist_C, 0, 1.0, cv2.NORM_MINMAX) cv2.normalize(dist_L1, dist_L1, 0, 1.0, cv2.NORM_MINMAX) cv2.normalize(dist_L2, dist_L2, 0, 1.0, cv2.NORM_MINMAX) cv2.normalize(dist_LP, dist_LP, 0, 1.0, cv2.NORM_MINMAX) cv2.normalize(dist_M, dist_M, 0, 1.0, cv2.NORM_MINMAX) # visualize the distance images plt.subplot(231),plt.imshow(dist_C, cmap = 'gray') plt.title('DIST_C'), plt.xticks([]), plt.yticks([]) plt.subplot(232),plt.imshow(dist_L1, cmap = 'gray') plt.title('DIST_L1'), plt.xticks([]), plt.yticks([]) plt.subplot(233),plt.imshow(dist_L2, cmap = 'gray') plt.title('DIST_L2'), plt.xticks([]), plt.yticks([]) plt.subplot(234),plt.imshow(dist_LP, cmap = 'gray') plt.title('DIST_LABEL_PIXEL'), plt.xticks([]), plt.yticks([]) plt.subplot(235),plt.imshow(dist_M, cmap = 'gray') plt.title('DIST_MASK_3'), plt.xticks([]), plt.yticks([]) plt.show()

输出

运行上面的 Python 程序后,它将生成以下输出窗口,显示应用不同 distanceType 后获得的不同变换。


注意这五种distanceType之间的区别。

更新于:2022年12月2日

1K+ 次浏览

启动您的职业生涯

完成课程获得认证

开始学习
广告