Python 从 0 到 1 丨带你了解图像直方图理论知识和绘制实现
本文分享自华为云社区《[Python从零到壹] 五十.图像增强及运算篇之图像直方图理论知识和绘制实现》,作者:eastmount。
一.图像直方图理论知识
灰度直方图是灰度级的函数,描述的是图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。假设存在一幅 6×6 像素的图像,接着统计其 1 至 6 灰度级的出现频率,并绘制如图 1 所示的柱状图,其中横坐标表示灰度级,纵坐标表示灰度级出现的频率[1-2]。
如果灰度级为 0-255(最小值 0 为黑色,最大值 255 为白色),同样可以绘制对应的直方图,如图 2 所示,左边是一幅灰度图像(Lena 灰度图),右边是对应各像素点的灰度级频率。
为了让图像各灰度级的出现频数形成固定标准的形式,可以通过归一化方法对图像直方图进行处理,将待处理的原始图像转换成相应的标准形式[3]。假设变量 r 表示图像中像素灰度级,归一化处理后会将 r 限定在下述范围:
在灰度级中,r 为 0 时表示黑色,r 为 1 时表示白色。对于一幅给定图像,每个像素值位于[0,1]区间之内,接着计算原始图像的灰度分布,用概率密度函数 P®实现。为了更好地进行数字图像处理,必须引入离散形式。在离散形式下,用 rk 表示离散灰度级,P(rk)代替 P®,并满足公式(2)。
公式中,nk 为图像中出现 rk 这种灰度的像素数,n 是图像中像素总数,是概率论中的频数,l 是灰度级总数(通常 l 为 256 级灰度)。接着在直角坐标系中做出 rk 和 P(rk)的关系图,则成为灰度级的直方图[4]。
假设存在一幅 3×3 像素的图像,其像素值如公式(3)所示,则归一化直方图的步骤如下:
首先统计各灰度级对应的像素个数。用 x 数组统计像素点的灰度级,y 数组统计具有该灰度级的像素个数。其中,灰度为 1 的像素共 3 个,灰度为 2 的像素共 1 个,灰度为 3 的像素共 2 个,灰度为 4 的像素共 1 个,灰度为 5 的像素共 2 个。
接着统计总像素个数,如公式(5)所示。
最后统计各灰度级的出现概率,通过公式(6)进行计算,其结果如下:
绘制的归一化图行如图 3 所示,横坐标表示图像中各个像素点的灰度级,纵坐标表示出现这个灰度级的概率。
直方图被广泛应用于计算机视觉领域,在使用边缘和颜色确定物体边界时,通过直方图能更好地选择边界阈值,进行阈值化处理。同时,直方图对物体与背景有较强对比的景物的分割特别有用,可以应用于检测视频中场景的变换及图像中的兴趣点。
二.OpenCV 绘制直方图
首先讲解使用 OpenCV 库绘制直方图的方法。在 OpenCV 中可以使用 calcHist()函数计算直方图,计算完成之后采用 OpenCV 中的绘图函数,如绘制矩形的 rectangle()函数,绘制线段的 line()函数来完成。其中,cv2.calcHist()的函数原型及常见六个参数如下:
hist = cv2.calcHist(images, channels, mask, histSize, ranges, accumulate)
hist 表示直方图,返回一个二维数组
images 表示输入的原始图像
channels 表示指定通道,通道编号需要使用中括号,输入图像是灰度图像时,它的值为[0],彩色图像则为[0]、[1]、[2],分别表示蓝色(B)、绿色(G)、红色(R)
mask 表示可选的操作掩码。如果要统计整幅图像的直方图,则该值为 None;如果要统计图像的某一部分直方图时,需要掩码来计算
histSize 表示灰度级的个数,需要使用中括号,比如[256]
ranges 表示像素值范围,比如[0, 255]
accumulate 表示累计叠加标识,默认为 false,如果被设置为 true,则直方图在开始分配时不会被清零,该参数允许从多个对象中计算单个直方图,或者用于实时更新直方图;多个直方图的累积结果用于对一组图像的直方图计算
接下来的代码是计算图像各灰度级的大小、形状及频数,接着调用 plot()函数绘制直方图曲线。
上述代码绘制的“Lena”灰度图像所对应的直方图曲线如图 4 所示,图 4(a)表示原图像,图 4(b)表示对应的灰度直方图曲线。
同时输出直方图的大小、形状及数量,如下所示:
彩色图像调用 OpenCV 绘制直方图的算法与灰度图像一样,只是从 B、G、R 三个放量分别进行计算及绘制,具体代码如下所示。
最终绘制的“Lena”彩色图像及其对应的彩色直方图曲线如图 5 所示,其中图 5(a)表示 Lena 原始图像,图 5(b)表示对应的彩色直方图曲线。
三.Matplotlib 绘制直方图
Matplotlib 是 Python 强大的数据可视化工具,主要用于绘制各种 2D 图形。本小节 Python 绘制直方图主要调用 matplotlib.pyplot 库中 hist()函数实现,它会根据数据源和像素级绘制直方图。其函数主要包括五个常用的参数,如下所示:
n, bins, patches = plt.hist(arr, bins=50, normed=1, facecolor=‘green’, alpha=0.75)
arr 表示需要计算直方图的一维数组
bins 表示直方图显示的柱数,可选项,默认值为 10
normed 表示是否将得到的直方图进行向量归一化处理,默认值为 0
facecolor 表示直方图颜色
alpha 表示透明度
n 为返回值,表示直方图向量
bins 为返回值,表示各个 bin 的区间范围
patches 为返回值,表示返回每个 bin 里面包含的数据,是一个列表
图像直方图的 Python 实现代码如下所示,该示例主要是通过 matplotlib.pyplot 库中的 hist()函数绘制的。
注意,读取的“lena-hd.png”图像的像素为二维数组,而 hist()函数的数据源必须是一维数组,通常需要通过函数 ravel()拉直图像。
读取显示的“lena”灰度图像如图 6 所示。
最终的灰度直方图如图 7 所示,它将 Lena 图 256 级灰度和各个灰度级的频数绘制出来,其中 x 轴表示图像的 256 级灰度,y 轴表示各个灰度级的频数。
如果调用下列函数,则绘制的直方图是经过标准化处理,并且颜色为绿色、透明度为 0.75 的直方图,如图 8 所示。
plt.hist(src.ravel(), bins=256, density=1, facecolor=‘green’, alpha=0.75)
彩色直方图是高维直方图的特例,它统计彩色图片 RGB 各分量出现的频率,即彩色概率分布信息。彩色图片的直方图和灰度直方图一样,只是分别画出三个通道的直方图,然后再进行叠加,其代码如下所示。Lena 彩色原始图像如图 9 所示。
绘制的彩色直方图如图 10 所示,包括红色、绿色、蓝色三种对比。
如果希望将三个颜色分量的柱状图分开绘制并进行对比,则使用下面的代码实现,调用 plt.figure(figsize=(8, 6))函数绘制窗口,以及 plt.subplot()函数分别绘制 4 个子图。
最终输出的图形如图 11 所示,,图 11(a)表示原图像,图 11(b)表示蓝色分量直方图,图 11©表示绿色分量直方图,图 11(d)表示红色分类直方图。
四.总结
本文主要讲解图像直方图理论知识以及直方图绘制方法,并且包括 Matplotlib 和 OpenCV 两种统计及绘制方法。灰度直方图是灰度级的函数,描述的是图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。这篇文章的知识点将为后续图像处理和图像运算对比提供支撑。
参考文献:
[1] 冈萨雷斯. 数字图像处理(第 3 版)[M]. 北京:电子工业出版社, 2013.
[2] 张恒博, 欧宗瑛. 一种基于色彩和灰度直方图的图像检索方法[J]. 计算机工程, 2004.
[3] Eastmount. [数字图像处理] 四.MFC 对话框绘制灰度直方图[EB/OL]. (2015-05-31). https://blog.csdn.net/eastmount/article/details/46237463.
[4] 阮秋琦. 数字图像处理学(第 3 版)[M]. 北京:电子工业出版社, 2008.
[5] Eastmount. [Python 图像处理] 十一.灰度直方图概念及 OpenCV 绘制直方图[EB/OL]. (2018-11-06). https://blog.csdn.net/Eastmount/article/details/83758402.
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/9162ff3ee54e1c0c4cf002046】。文章转载请联系作者。
评论