跟我学 Python 图像处理丨带你入门 OpenGL
本文分享自华为云社区《[Python图像处理] 二十七.OpenGL入门及绘制基本图形(一) 》,作者:eastmount。
一.OpenGL 入门知识
1.什么是 OpenGL
OpenGL(Open Graphics Library,译为“开放式图形库”) 是用于渲染 2D、3D 矢量图形的跨语言、跨平台的应用程序编程接口(API)。这个接口由近 350 个不同的函数调用组成,用来绘制从简单的图形元件到复杂的三维景象。OpenGL 常用于 CAD、虚拟现实、科学可视化程序和电子游戏开发。
OpenGL 可用于设置所需的对象、图像和操作,以便开发交互式的 3 维计算机图形应用程序。OpenGL 被设计为一个现代化的、硬件无关的接口,因此我们可以在不考虑计算机操作系统或窗口系统的前提下,在多种不同的图形硬件系统上,或者完全通过软件的方式实现 OpenGL 的接口。OpenGL 的高效实现(利用了图形加速硬件)存在于 Windows,部分 UNIX 平台和 Mac OS。这些实现一般由显示设备厂商提供,而且非常依赖于该厂商提供的硬件。
OpenGL 规范由 1992 年成立的 OpenGL 架构评审委员会(ARB)维护。ARB 由一些对创建一个统一的、普遍可用的 API 特别感兴趣的公司组成。到了今天已经发布了非常多的 OpenGL 版本,以及大量构建于 OpenGL 之上以简化应用程序开发过程的软件库。这些软件库大量用于视频游戏、科学可视化和医学软件的开发,或者只是用来显示图像。
一个用来渲染图像的 OpenGL 程序需要执行的主要操作如下:
从 OpenGL 的几何图元中设置数据,用于构建形状
使用不同的着色器(shader)对输入的图元数据执行计算操作,判断它们的位置、颜色,以及其他渲染属性
将输入图元的数学描述转换为与屏幕位置对应的像素片元(fragment),这一步也称作光栅化(rasterization)
最后,针对光栅化过程产生的每个片元,执行片元着色器(fragment shader),从而决定这个片元的最终颜色和位置
如果有必要,还需要对每个片元执行一些额外的操作,例如判断片元对应的对象是否可见,或者将片元的颜色与当前屏幕位置的颜色进行融合
2.OpenGL 安装
作者的电脑环境为 Win10+Python3.7,打开 CMD 调用 pip 工具进行安装,如下图所示。
但通常安装成功之后,运行代码会报错“OpenGL.error.NullFunctionError: Attempt to call an undefined function glutInit, check for bool(glutInit) before calling”。
据说是 pip 默认安装的是 32 位版本的 pyopengl,而作者的操作系统是 64 位。网上很多大牛会去 “https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyopengl” 网站下载适合自己的版本。比如 Python3.7 且 64 位操作系统。
安装流程如下所示:
写到这里,我们 Python 的 OpenGL 库就安装成功了!
二.OpenGL 入门程序
我们首先介绍两个入门代码,然后再进行深入的讲解。
1.OpenGL 绘制正方形
完整代码如下:
运行结果如下图所示:
核心步骤如下:
主函数使用 glut 库初始化 OpenGL
glutInit()
设置显示模式并初始化 glut 窗口(画布)
glutInitDisplayMode(GLUT_SINGLE | GLUT_RGBA)
glutInitWindowSize(400, 400)
glutCreateWindow(“eastmount”)
注册绘制图像的回调函数,如 display()
glutDisplayFunc(display)
绘制图像 display 函数,包括清除画布、设置颜色、绘制图元、设置定点、结束绘制、刷新执行
glClear(GL_COLOR_BUFFER_BIT|GL_DEPTH_BUFFER_BIT)
glColor3f(1.0, 0.0, 0.0)
glBegin(GL_QUADS)
glVertex3f(-0.5, -0.5, 0.0)
glVertex3f(0.5, -0.5, 0.0)
glVertex3f(0.5, 0.5, 0.0)
glVertex3f(-0.5, 0.5, 0.0)
glEnd()
glFlush()
进入 glut 主循环
glutMainLoop()
2.OpenGL 绘制水壶
接着补充一段经典的水壶代码,所有计算机试卷、计算机图形学、3D 图像领域都会绘制它。
运行结果如下图所示,它主要调用 glutSolidTeapot(0.5)函数绘制实现实心茶壶,glutWireTeapot(0.5)函数绘制线框茶壶。
注意,glut 提供了一些现成的绘制立体的 API,如 glutWireSphere 绘制球、glutWireCone 绘制椎体、glutWireCube 绘制立体、glutWireTorus 绘制甜圈、glutWireTeapot 绘制茶壶、glutWireOctahedron 绘制八面体,请读者自行提升。
3.OpenGL 绘制多个图形
接下来绘制一个坐标系,并分别绘制四个图形,设置不同颜色,代码如下所示。
输出结果如下图所示:
4.OpenGL 绘图代码及原理详解
该部分将详细讲解上面三段代码的核心知识,帮助大家巩固基础。作者让大家先看代码及其运行效果,从而提升 OpenGL 编程兴趣,再深入分析其原理,这种倒叙的方式希望您们喜欢。
(1) 核心函数上述代码中,以 glut 开头的函数都是 GLUT 工具包所提供的函数。
glutInit():对 GLUT 进行初始化,该函数必须在其它的 GLUT 使用之前调用一次。其格式比较死板,一般 glutInit()直接调用即可。
glutInitDisplayMode():设置显示方式,其中 GLUT_RGB 表示使用 RGB 颜色,与之对应的是 GLUT_INDEX(表示使用索引颜色);GLUT_SINGLE 表示使用单缓冲,与之对应的是 GLUT_DOUBLE(表示使用双缓冲)。更多参数请读者阅读官方网站或 Google。
glutInitWindowPosition():设置窗口在屏幕中的位置。
glutInitWindowSize():设置窗口的大小,两个参数表示长度和宽度。
glutCreateWindow():根据当前设置的信息创建窗口,参数将作为窗口的标题。需要注意的是,当窗口被创建后,并不是立即显示到屏幕上,需要调用 glutMainLoop()才能看到窗口。
glutDisplayFunc():设置一个函数,当需要进行画图时,这个函数就会被调用,通常用来调用绘制图形函数。
glutMainLoop():进行一个消息循环,大家需要知道这个函数可以显示窗口,并且等待窗口关闭后才会返回。
以 gl 开头的函数都是 OpenGL 的标准函数。
glClear():清除,其中参数 GL_COLOR_BUFFER_BIT 表示清除颜色,GL_DEPTH_BUFFER_BIT 表示清除深度。
glRectf():画一个矩形,四个参数分别表示位于对角线上的两个点的横、纵坐标。
glFlush():刷新显示图像,保证前面的 OpenGL 命令立即执行,而不是让它们在缓冲区中等待。
OpenGL 要求指定顶点的命令(glVertex2f)必须包含在 glBegin()函数和 glEnd()函数之间执行。
(2) 绘制顶点顶点(vertex)是 OpengGL 中非常重要的概念,描述线段、多边形都离不开顶点。它们都是以 glVertex 开头,后面跟一个数字和 1~2 个字母,比如:
glVertex2d
glVertex2f
glVertex3f
glVertex3fv
数字表示参数的个数,2 表示有 2 个参数(xy 坐标),3 表示三个(xyz 坐标),4 表示四个(齐次坐标 w)。字母表示参数的类型,s 表示 16 位整数(OpenGL 中将这个类型定义为 GLshort),i 表示 32 位整数(OpenGL 中将这个类型定义为 GLint 和 GLsizei),f 表示 32 为浮点数(OpenGL 中将这个类型定义为 GLfloat 和 GLclampf),d 表示 64 位浮点数(OpenGL 中将这个类型定义为 GLdouble 和 GLclampd)。例如:
glVertex2i(1, 3)
glVertex2f(1.0, 3.0)
glVertex3f(1.0, 3.0, 1.0)
glVertex4f(1.0, 3.0, 0.0, 1.0)
注意,OpenGL 中很多函数都采用这种形式命名。
(3) 设置颜色在 OpenGL 中,设置颜色函数以 glColor 开头,后面跟着参数个数和参数类型。参数可以是 0 到 255 之间的无符号整数,也可以是 0 到 1 之间的浮点数。三个参数分别表示 RGB 分量,第四个参数表示透明度(其实叫不透明度更恰当)。以下最常用的两个设置颜色的方法:
glColor3f(1.0,0.0,0.0) #红色
glColor3f(0.0,1.0,0.0) #绿色
glColor3f(0.0,0.0,1.0) #蓝色
glColor3f(1.0,1.0,1.0) #白色
glColor4f(0.0,1.0,0.0,0.0) #红色且不透明度
glColor3ub(255, 0, 0) #红色
注意,OpenGL 是使用状态机模式,颜色是一个状态变量,设置颜色就是改变这个状态变量并一直生效,直到再次调用设置颜色的函数。除了颜色,OpenGL 还有很多的状态变量或模式。
(4) 绘制基本图形前面我们介绍了各种图像,下表展示了常见的图像元件。
GL_POINTS:绘制顶点
GL_LINES:绘制线段
GL_LINE_STRIP:绘制连续线段
GL_LINE_LOOP:绘制闭合的线段
GL_POLYGON:绘制多边形
GL_TRIANGLES:绘制三角形
GL_TRIANGLE_STRIP:绘制连续三角形
GL_TRIANGLE_FAN:绘制多个三角形组成的扇形
GL_QUADS:绘制四边形
GL_QUAD_STRIP:绘制连续四边形
详见下图所示。
三.OpenGL 基础知识
在深入学习 OpenGL 之前,我们有必要了解一些最常用的图形学名词、OpenGL 原理和语法。
1.OpenGL 语法
OpenGL 程序的基本结构通常包括——初始化物体渲染所对应的状态、设置需要渲染的物体。渲染(render)表示计算机从模型创建最终图像的过程,OpenGL 只是其中一种渲染系统。模型(model)或者场景对象是通过几何图元,比如点、线和三角形来构建的,而图元与模型的顶点(vertex)也存在着各种对应的关系。
OpenGL 另一个最本质的概念叫着色器,它是图形硬件设备所执行的一类特色函数。可以将着色器理解为专为图形处理单元(GPU)编译的一种小型程序。在 OpenGL 中,会用到始终不同的着色阶段(shader stage),最常用的包括顶点着色器(vertex shader)以及片元着色器,前者用于处理顶点数据,后者用于处理光栅化后的片元数据。所有的 OpenGL 程序都需要用到这两类着色器。最终生成的图像包含了屏幕上绘制的所有像素点。像素(pixel)是显示器上最小的可见单元。计算机系统将所有的像素保存到帧缓存(framebuffer)当中,后者是由图形硬件设备管理的一块独立内存区域,可以直接映射到最终的显示设备上。
正如前面您看到的,OpenGL 库中所有的函数都会以字符“gl”作为前缀,然后是一个或者多个大写字母开头的词组,以此来命令一个完整的函数(例如 glBindVertexArray())。OpenGL 的所有函数都是这种格式,上面看到的“glut”开头的函数,它们来自第三方库 OpenGL Utility Toolkit(GLUT),可以用来显示窗口、管理用户输入以及执行其他一些操作。
与函数命名约定类似,OpenGL 库中定义的常量也是 GL_COLOR_BUFFER_BIT 的形式,常量以 GL_作为前缀,并且使用下划线来分割单词。这些常量的定义是通过 #define 来完成的,它们基本可以在 OpenGL 的头文件 glcorearb.h 和 glext.h 中找到。
为了能够方便地在不同的操作系统之间移植 OpenGL 程序,它还为函数定义了不同的数据类型,例如 GLfloat 是浮点数类型。此外,比如 glVertex*()的函数,它有多种变化形式,如 glVertex2d、glVertex2f。在函数名称的“核心”部分之后,通过后缀的变化来提示函数应当传入的参数,通常由一个数字和 1~2 个字母组成。glVertex2f()中的“2”表示需要传入 2 个参数,f 表示浮点数。
2.老式 OpenGL vs 现代 OpenGL
(1) 老式 OpenGL 在大多数计算机图形系统中,绘图的方式是将一些顶点发送给处理管线,管线由一系列功能模块互相连接而成。最近,OpenGL 应用编程接口(API)从固定功能的图形管线转换为可编程的图形管线。
如下图绘制正方形的代码,它使用的是老式 OpenGL,要为三维图元(在这个代码中,是一个 GL_QUADS 即矩形)指定各个顶点,但随后每个顶点需要被分别发送到 GPU,这是低效的方式。 这种老式编程模式伸缩性不好,如果几何图形变得复杂,程序就会很慢。对于屏幕上的顶点和像素如何变换,它只提供了有限的控制。
后续我们将专注于现代的 OpenGL,但是网络上也会有老式 OpenGL 的例子。
(2) 现代 OpenGL 现代 OpenGL 利用一系列的操作,即通过“三维图形管线”绘制图形,其基本流程如下图所示。
简化三维图形管线分为 6 步:
三维几何图形定义(VBO 等)。 在第一步,通过定义在三维空间中的三角形的顶点,并指定每个顶点相关联的颜色,我们定义了三维几何图形。
顶点着色器。 接下来,变换这些顶点:第一次变换将这些顶点放在三维空间中,第二次变换将三维坐标投影到二维空间。根据照明等因素,对应顶点的颜色值也在这一步中计算,这在代码中通常称为“顶点着色器”。
光栅化。 将几何图形“光栅化”(从几何物体转换为像素)。
片段着色器。 针对每个像素,执行另一个名为“片段着色器”的代码块。正如顶点着色器作用于三维顶点,片段着色器作用于光栅化后的二维像素。
帧缓冲区操作(深度测试、混合等)。 最后,像素经过一系列帧缓冲区操作,其中,它经过“深度缓冲区检验”(检查一个片段是否遮挡另一个)、“混合”(用透明度混合两个片段)以及其他操作,其当前的颜色与帧缓冲区中该位置已有的颜色结合。
帧缓冲区。 这些变化最终体现在最后的帧缓冲区上,通常显示在屏幕上。
PS:该部分参考 Mahesh Venkitachalam 大神编写的《Python 极客项目编程》,代码可以查看:https://github.com/electronut/pp
3.OpenGL 绘制时钟
最后补充“xiaoge2016 老师”的一段趣味代码,通过 OpenGL 绘制时钟,注意它是跳动的。
其运行结果如下图所示:
四.总结
本篇文章主要讲解 Python 和 OpenGL 基础知识,包括安装、基础语法、绘制图形等。希望对读者有一定帮助,也希望这些知识点为读者从事 Python 图像处理相关项目实践或科学研究提供一定基础。
参考文献:
[1] 《OpenGL 编程指南(第 8 版)》 作者:Dave Shreiner Granham Sellers 等,王锐 译
[2] 《Python 极客项目编程》 作者:Mahesh Venkitachalam,王海鹏 译
[3] 《OpenGL 编程精粹》杨柏林 陈根浪 徐静 编著
[4] 写给 python 程序员的 OpenGL 教程 - 许老师(天元浪子)
[5] Python 之 OpenGL 笔记(2):现代 OpenGL 编程常用的几个通用函数 - 大龙老师
[6] python3+OpenGL 环境配置 - GraceSkyer 老师
[7] VS2012下基于Glut OpenGL显示一些立体图形示例程序 - yearafteryear老师
[8] Python——OpenGL - 白季飞龙老师
[9] python+opengl 显示三维模型小程序 - xiaoge2016[10] https://github.com/electronut/pp
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/57ec6cc9c7bd560437e9def70】。文章转载请联系作者。
评论