写点什么

图像的模板匹配,Python OpenCV 取经之旅第 29 天

发布于: 2 小时前

Python OpenCV 365 天学习计划,与橡皮擦一起进入图像领域吧。


基础知识铺垫

今天的 1 个小时,我们要交给模板匹配了,而且学习起来比较轻松,因为我看到一句话,模板匹配是最没用的匹配方式,应用场景很少。


就喜欢这样的技术,学起来的摩擦力小,不容易掉头发。

模板匹配

模板匹配大意就是在整个图像区域寻找已有的小图像,在寻找之前,你需要准备一个待寻找的图像,以及一个小图


寻找的形式是从左到右,从上到下,这个找法很形象了,一行一行的找。


在寻找的过程中,通过 OpenCV 封装好的算法,计算小图与大图的匹配度,这个匹配度越大,两张图片相同的可能性越大。

模板匹配函数原型

在 Python 中,通过 help 函数,可以查看任意函数的说明。


matchTemplate(image, templ, method[, result[, mask]]) -> result
复制代码


参数说明如下:


  • <kbd>image</kbd>:待检索的图像;

  • <kbd>templ</kbd>:小图,要求不大于待搜索图像;

  • <kbd>method</kbd>:匹配方法,下表提供,算法不需要掌握,知道用法即可;

  • <kbd>result</kbd>:结果图像;

  • <kbd>mask</kbd>:掩膜,需要与 <kbd>templ</kbd> 有相同的数据类型和大小,默认不设置,仅支持 <kbd>method</kbd> 参数值为 <kbd>TM_SQDIFF</kbd> 和 <kbd>TM_CCORR_NORMED</kbd>


关于 <kbd>method</kbd> 参数的值有以下几种情况:


  • <kbd>TM_SQDIFF</kbd>:平方差匹配;

  • <kbd>TM_SQDIFF_NORMED</kbd>:标准平方差匹配,利用平方差来进行匹配,最好匹配为 0,匹配越差,匹配值越大;

  • <kbd>TM_CCORR</kbd>:相关性匹配;

  • <kbd>TM_CCORR_NORMED</kbd>:标准相关性匹配,采用模板和图像间的乘法操作,数越大表示匹配程度较高, 0 表示最坏的匹配效果;

  • <kbd>TM_CCOEFF</kbd>:相关性系数匹配;

  • <kbd>TM_CCOEFF_NORMED</kbd>:标准相关性系数匹配,将模版对其均值的相对值与图像对其均值的相关值进行匹配,1 表示完美匹配,-1 表示糟糕的匹配,0 表示没有任何相关性(随机序列)。


以上内容整理自网络


接下来编写测试代码:


import cv2 as cv
# 读取目标图片,小图target = cv.imread("./target.jpg")
# 读取模板图片,待查找的图片template = cv.imread("./template.jpg")
# 获取模板图片的宽高尺寸,用于后面画矩形框th, tw = template.shape[:2]
# 执行匹配模板,匹配方式选择标准平方差匹配result = cv.matchTemplate(target, template, cv.TM_SQDIFF_NORMED)
# 输出匹配结果print(type(result))cv.imshow("image", result)cv.waitKey()
复制代码


注意下图中,最终匹配到的区域颜色最深。


下面我们将其标记出来,需要用到一个新的函数,具体如下。

minMaxLoc 函数

该函数是在给定的矩阵中寻找最大值和最小值,并给出它们的位置。


特别说明是如果需要在所有的通道中查找最小或者最大元素,要先将矩阵重新解释为单通道,好吧,引出归一化的概念了。


那我们先把这个函数学到收,之后在把归一化的函数补充上。


函数原型如下:


minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc
复制代码


原型比较简单,输入一个图像之后,可以返回 4 个值。


这 4 个值分别是,最大值,最小值以及最大值与最小值的位置。


上文我们使用的是 <kbd>cv.TM_SQDIFF_NORMED</kbd> 方法,按照上面的叙述,匹配值最小越好,所以需要获取一下图像的最小值位置。


修改上文代码如下:


import cv2 as cv
# 读取目标图片,小图target = cv.imread("./target.jpg")# cv.imshow("target", target)
# 读取模板图片,待查找的图片template = cv.imread("./template.jpg")# cv.imshow("template", template)
# 获取模板图片的宽高尺寸,用于后面画矩形框th, tw = template.shape[:2]
# 执行匹配模板,匹配方式选择标准平方差匹配result = cv.matchTemplate(target, template, cv.TM_SQDIFF_NORMED)
# 获取最小值位置min_val, max_val, min_loc, max_loc = cv.minMaxLoc(result)tl = min_locprint(tl)# 通过模板的宽和高,找到匹配最好的右下角地方# tl[0],tl[1]分别代表最佳匹配值地方的 x 和 ybr = (tl[0]+tw, tl[1]+th)cv.rectangle(target, tl, br, (0,0,255),2)# 输出匹配结果
cv.imshow("image", target)cv.waitKey()
复制代码


最终运行效果如下,匹配成功。

其他的 <kbd>method</kbd>你自行测试吧。

补一个 cv2.normalize

学习新的函数,先把概念通读,尝试理解,理解不要在降格到应用。


归一化就是把待处理的数据进行处理,这里的处理就是某种算法了,然后将数据限制在一个范围内(范围由我们自己定义)


归一化之后,数据会变得更加有可比性,具体原因还未找到可靠资料。


函数原型如下:


dst = cv2.normalize(src[, dst[, alpha[, beta[, norm_type[, dtype[, mask]]]]]])
复制代码


参数说明:


  • <kbd>src</kbd>:输入数组;

  • <kbd>dst</kbd>:与 src 大小相同的输出数组;

  • <kbd>alpha</kbd>:如果 norm_type 为 NORM_MINMAX ,则 alpha 为最小值或最大值,如果 norm_type 为其他类型,则为归一化要乘的系数;

  • <kbd>beta</kbd>:如果 norm_type 为 NORM_MINMAX ,则 beta 为最小值或最大值,如果 norm_type 为其他类型,beta 被忽略,此处不会被用到,一般传入 0;

  • <kbd>norm_type</kbd>:归一化类型,常见的有 NORM_L1, NORM_L2, NORM_INF, NORM_MINMAX;

  • <kbd>dtype</kbd>:如果取负值时,dst 与 src 同样的类型,否则,dst 和 src 有同样的通道数,且此时图像深度为 CV_MAT_DEPTH(dtype);

  • <kbd>mask</kbd>:掩膜。


应用起来比较简单,例如本篇博客中的案例,只需要增加如下代码即可。


# 归一化处理cv.normalize(result, result, 0, 1, cv.NORM_MINMAX, -1)
复制代码

橡皮擦的小节

希望今天的 1 个小时,你有所收获,我们下篇博客见~


发布于: 2 小时前阅读数: 2
用户头像

爬虫 100 例作者,蓝桥签约作者,博客专家 2021.02.06 加入

6 年产品经理+教学经验,3 年互联网项目管理经验; 互联网资深爱好者; 沉迷各种技术无法自拔,导致年龄被困在 25 岁; CSDN 爬虫 100 例作者。 个人公众号“梦想橡皮擦”。

评论

发布
暂无评论
图像的模板匹配,Python OpenCV 取经之旅第 29 天