GPU 和 AT 的区别在哪里?GPU 与 AT 有哪些区别?
GPU 这一概念也是相对于计算机系统中的 CPU 而言的,由于人们对图形的需求越来越大,尤其是在家用系统和游戏发烧友,而传统的 CPU 不能满足现状,因此需要提供一个专门处理图形的核心处理器。
GPU 作为硬件显卡的心脏,地位等同于 CPU 在计算机系统中的作用。同时 GPU 也可以用来作为区分 2D 硬件显卡和 3D 硬件显卡的重要依据。2D 硬件显卡主要通过使用 CPU 来处理特性和 3D 图像,将其称作软加速。
3D 硬件显卡则是把特性和 3D 图像的处理能力集中到硬件显卡中,也就是硬件加速。目前市场上流行的显卡多半是由 NVIDIA 及 ATI 这两家公司生产的。
问题一:GPU 设计目的和 CPU 截然不同
GPU 是并行编程模型,和 CPU 的串行编程模型完全不同,导致很多 CPU 上优秀的算法都无法直接映射到 GPU 上,并且 GPU 的结构相当于共享存储式多处理结构,因此在 GPU 上设计的并行程序与 CPU 上的串行程序具有很大的差异。
GPU 主要采用立方环境的材质贴图、硬体 T&L、顶点混合、凹凸的映射贴图和纹理压缩、双重纹理四像素 256 位的渲染引擎等重要技术。
由于图形渲染任务具有高度的并行性,因此 GPU 可以仅仅通过增加并行处理单元和存储器控制单元便可有效地提高处理能力和存储器带宽。
GPU 设计目的和 CPU 截然不同,CPU 是设计用来处理通用任务,因此具有复杂的控制单元,而 GPU 主要用来处理计算性强而逻辑性不强的计算任务,GPU 中可利用的处理单元可以更多的作为执行单元。
因此,相较于 CPU,GPU 在具备大量重复数据集运算和频繁内存访问等特点的应用场景中具有无可比拟的优势。
问题二:GPU 使用方式
使用 GPU 有两种方式,一种是开发的应用程序通过通用的图形库接口调用 GPU 设备,另一种是 GPU 自身提供 API 编程接口,应用程序通过 GPU 提供的 API 编程接口直接调用 GPU 设备。
通用图形库:
通过通用的图形库的方式使用 GPU,都是通过 OpenGL 或 Direct3D 这一类现有的图形函数库,以编写渲染语言(Shading Language)的方法控制 GPU 内部的渲染器(Shader)来完成需要的计算。
目前业界公认的图形编程接口主要有 OpenGL 和 DirectX 这两种接口。OpenGL 是当前可用于开发可交互、可移植的 2D 与 3D 图形应用程序的首选环境,也是当前图形应用最广泛的标准。
OpenGL 是 SGI 公司开发的计算机图形处理系统,是图形硬件的软件接口,GL 为图形库(Graphics Library),OpenGL 应用程序不需要关注所在运行环境所处的操作系统与平台。
只要在任何一个遵循 OpenGL 标准的环境下都会产生一样的可视化效果。与 OpenGL 类似,DirectX (Directe Xtension)也是一种图形 API。它是由 Microsoft 创建的多媒体编程接口,并已经成为微软视窗的标准。
为适应 GPU 应用的需求,DirectX 则根据 GPU 新产品功能的扩充与进展及时地定义新的版本,它所提供的功能几乎与 GPU 提供的功能同步。
GPU 自身编程接口:
GPU 自身提供的编程接口主要由提供 GPU 设备的两家公司提供,分别是括 NVIDIA 的 CUDA 框架和 AMD(ATI)公司于 2006 年提出了 CTM(Close To Metal)框架(备注,最初是 ATI 公司生产 GPU 设备,后被 AMD 收购)。
AMD 的 CTM 框架现在已不再使用,主要是 AMD(ATI)于 2007 年推出了 ATI Stream SDK 架构,2008 年 AMD(ATI)完全转向了公开的 OpenCL 标准,因此 AMD(ATI)公司目前已没有独立的、私有的通用计算框架。
2007 年 NVIDIA 公司发布 CUDA (Compute Unified Device Architecture)专用通用计算框架。使用 CUDA 进行通用计算编程不再需要借助图形学 API,而是使用与 C 语言以十分类似的方式进行开发。在 CUDA 编程模型中,有一个被称为主机(Host)的 CPU 和若干个被称作设备(Device)或者协处理器(Co-Processor)的 GPU。
在该模型中,CPU 和 GPU 协同工作,各司其职。CPU 负责进行逻辑性较强的事务处理和串行计算,而 GPU 则专注于执行线程化的并行处理任务。CPU、GPU 各自拥有相互独立的存储器地址空间主机端的内存和设备端的显存。一般采用 CUDA 框架自己进行编程的都是一些大型的应用程序,比如石油勘测、流体力学模拟、分子动力学仿真、生物计算、音视频编解码、天文计算等领域。
而我们一般企业级的应用程序由于开发成本以及兼容性等原因,大多数都是采用通用的图形库来进行开发调用 GPU 设备。
问题三:GPU 操作方法
GPU 对于通用计算和图形处理的内部组件主要有两部分,顶点处理器(Vertex Processor)和子素处理器(Fragment Processor)。这种处理器具备流处理机的模式,即不具有大容量的快存/存储器可以读写,只是直接在芯片上利用临时寄存器进行流数据的操作。
当 GPU 用于图形处理时,此时 GPU 内部的顶点渲染、像素渲染以及几何渲染操作都可以通过流处理器完成。
从图中可以看出,此时 GPU 内部的所有流处理器相当于一个多核的处理器,数据可以很方便地在不同的流处理器之间的输入和输出之间移动,同时 GPU 分派器和控制逻辑可以动态的指派流处理器进行相应的顶点,像素,几何等操作,因为流处理器都是通用的。
评论