QuTrunk 与 Paddle 结合实践 --VQA 算法示例
QuTrunk 与 Paddle 结合实践--VQA 算法示例
1、概述
QuTrunk 是启科量子开发和已经开源的一款量子编程框架软件产品,它使用 Python 作为宿主语言,利用 Python 的语法特性实现针对量子程序的 DSL(领域专用语言),所有支持 Python 编程的 IDE 均可安装使用 QuTrunk。QuTrunk 基于量子逻辑门、量子线路等概念提供量子编程所需的各类 API。这些 API 分别由相应的模块实现,比如 QCircuit 实现量子线路功能,Qubit 实现量子比特,Qureg 实现量子寄存器,Command 对应每个量子门操作的指令, Backend 代表运行量子线路的后端模块,gate 模块实现了各类基础量子门操作。同时 QuTrunk 还可以作为其他上层量子计算应用的基础,比如:量子算法、量子可视化编程、量子机器学习等。QuTrunk 设有多种量子计算后端模块,如:BackendLocalPy(本地 Python 版本模拟器);BackendLocalCpp(本地 C++版本模拟器);BackendQuSprout(量子计算云服务);BackendIBM(IBM 量子云计算平台)等。QuTrunk 对所有量子逻辑门及量子编程涉及到的基本概念进行了封装与实现,支持主流的量子算法。在使用 QuTrunk 进行量子编程时, 开发者只需通过提供的量子编程 API 即可直接调用量子逻辑门进行使用。QuTrunk 也支持混合量子-经典程序编写,已设计了量子线路分段执行机制, 提供 QuSL 量子汇编指令标准,与 Python 代码完全兼容。完整了解 QuTrunk 的文档请参考开发者社区上的相关文章介绍:启科开发者平台 (queco.cn)
QuTrunk 的 github 链接:QuTrunk
PaddlePaddle 是百度发布的一款 AI 框架(下面简称 Paddle),QuTrunk 框架的特性天然支持与 Paddle 的结合,通过使用 QuTrunk 开发量子计算+AI 融合的应用程序以帮助用户解决各领域在经典计算机无法解决或者解决起来耗时很长复杂问题。本文主要通过量子计算上常用的 VQA 算法示例来展示如何使用 QuTrunk 和 Paddle 结合。
2、VQA 算法简介
2.1 VQA 算法定义
变分量子算法(variational quantum algorithm, VQA)其实就是用一个经典优化器(classical optimizer)来训练一个含参量子线路(quantum circuit),即 VQA 使用参数化的量子电路在量子计算机上进行计算,然后把参数的优化训练丢给经典优化器来处理,从而充分利用了经典优化的工具箱。与其他为容错时代开发的量子算法相比,VQA 具有保持量子电路深度较浅从而降低噪声的额外优势,因而 VQA 也成为 NISQ 上设备取得量子优势的主要策略,在大量的应用中被使用,基本上涵盖了研究人员为量子计算机设想的所有应用,如下图所示:
2.2 VQA 基本元素介绍
VQA 的主要优点之一是它提供了一个通用框架,可用于解决各种问题。尽管这种多功能性转化为具有不同复杂度级别的不同算法结构,但大多数(如果不是所有)VQA 都有一些共同的基本元素。它有些像是机器学习在量子计算中的自然类比,经典机器学习框架中有四个要素:
1. 数据
2. 模型
3. 损失函数
4. 优化器
我们的目标是找到一个可以拟合数据 的模型 ,即确定一组最优的参数 θ 。确定 θ的方法就是让模型与给定的数据尽可能地接近(但不过拟合),接近程度由损失函数 来定义。利用一些优化器来找到 的最小值点,目标即可达成。
- 对于经典机器学习算法,model 通常是一个在经典计算机上运行的神经网络;
- 对于变分量子算法,model 是一个在量子计算机上运行的量子电路 t;
对比经典 ML,VQA 算法的 4 个基本元素为:损失函数,ansatz,梯度和优化器。下面分别介绍:
2.2.1 损失函数
VQA 的一个重要方面是将问题编码为损失函数。类似于经典的机器学习,损失函数将可训练参数θ的值映射到实数,优化任务是找到损失函数的全局最小值,损失函数的数学表达式如下:
如上(1)式中,U(θ)是参数化的酉,θ由离散和连续的参数组成,是训练集的输入状态,是一组可观察值,是编码任务的函数。对于一个给定的问题,可以有不同的选择。损失函数的构建需满足如下准则:
1. 损失必须是可信的,因 C(θ)的最小值对应于问题的解;
2. 在量子计算机上进行测量并可能进行经典后处理,从而来有效地估算 C(θ)。这里隐含的假设是损失不能用经典计算机有效地计算,否则 VQA 不能实现量子优势;
3. C(θ)在操作上是有意义的,较小的损失值代表更好的解;
4. 损失必须是可训练的,以便有效优化参数。
为了在 NISQ 硬件中实现给定的 VQA,用于估计的量子电路必须保持电路深度和辅助要求较小。这是因为 NISQ 器件容易发生门错误,量子比特计数有限,并且这些量子比特的退相干时间短,因而构建有效的损失函数量子电路是 VQA 的一个重要方面。
2.2.2 ansatz
VQA 另外一个重要的方面是 ansatz,它是依赖于一组可以优化的连续或离散参数θ的量子操作。ansatz 的形式决定参数θ,需要训练它们以最小化损失。一方面 ansatz 的具体结构通常取决于具体问题,因为在许多情况下,人们可以利用有关问题的信息来解决问题。另一方面,一些 ansatz 体系结构是通用的,与问题无关,这意味着即使没有相关信息可用,也可以使用它们。对于公式(1)的损失函数,可以将参数θ编码为应用于量子电路的输入状态的酉 U(θ)。U(θ)可以一般表示为 L 个顺序应用的单位的乘积
其中是非参数化酉算子,是厄米算子;是θ中的第 l 个元素。
2.2.3 梯度
一旦定义了损失函数和 ansatz,下一步是训练参数θ并解损失函数的优化问题。众所周知,对于许多优化任务,使用损失函数梯度(或高阶导数)中的信息可以帮助加快并保证优化器的收敛。梯度的计算可以使用参数化移位法则(parameter-shift rule)。假设参数θ全都以 Pauli 矩阵旋转角的形式出现,即,通过对损失函数进行计算,可证明有如下性质:
其中是一个向量,是第 l 个元素其值 1,否则为 0。等式(3)表明,可以通过将第 l 个参数偏移一定量α来评估梯度。请注意,评估的准确性取决于系数 1/(2sinα),因为每个±α项都是通过采样来评估的。由于 1/sinα在这一点上是最小的,所以在α=π/4 时,评估的精度最大。尽管参数移位规则可能类似于原始有限差分,但它通过系数 1/sinα来评估参数的解析梯度。最后,更一般的的梯度可以通过使用链式法则从等式(3)获得。
2.2.4 优化器(Optimizers)
对于任何变分量子算法,VQA 的成功取决于所采用的优化方法的效率和可靠性。VQA 与经典优化器相关的优化问题通常预计是 N-P 难的,因为涉及的损失函数可以有许多局部最小值。除了复杂经典优化中遇到的典型困难外,当对 VQA 进行训练时还会遇到一些新的挑战,包括诸如由于测量预算有限而导致的固有随机环境、硬件噪声等。这也导致了许多量子感知优化器的发展。在这里,我们将讨论一些为变分量子算法设计或推广的优化器。为了方便起见,根据它们是否实现了梯度下降,将它们分为两类。
一种是梯度下降法,它是目前最常见的优化方法之一,按照梯度指示的方向进行迭代。鉴于只有统计估计可用于这些梯度,这些策略属于随机梯度下降(SGD)的范畴。一种从机器学习领域引入的 SGD 方法是 Adam,它调整优化过程中采取的步骤的大小,以允许比通过基本 SGD 获得的解决方案更有效和更精确的解决方案。受机器学习文献启发的另一种方法在每次迭代中调整精度(即每次估计的执行次数),而不是步长,以节省所使用的量子资源。
另一种不同的基于梯度的方法是基于假设一个假想的时间演化,或者等效地通过使用基于信息几何概念的量子自然梯度衰减法。虽然标准梯度下降在参数空间的 l2(欧几里德)几何中的最陡的下降方向上采取步骤,但是自然梯度下降在具有度量张量的空间上工作,该度量张量编码了量子状态对参数变化的灵敏度。使用这种度量,通常会加速梯度更新步骤的收敛,允许用更少的迭代达到给定的精度水平。这种方法也被扩展到包含噪声的影响。
Paddle 框架中提供了 Adm 和 SGD 等优化器。根据使用场景和意愿来选择。
2.3 VQA 实现过程
为了使混合经典-量子计算成功,需要克服两个挑战。首先,我们需要找到参数化量子电路,这些量子电路具有表达能力,能够对相关优化问题的最优解产生足够好的近似。第二,量子电路参数的经典优化需要足够快和准确地解决。下图中展示了变分量子算法优化过程:
其主要实现的过程和步骤为:
1. 首先定义损失函数 ,对问题的解进行编码;
2. 其次输出 ansatz,即依赖于一组可以优化的连续或离散参数θ的量子操作;
3. 最后使用来自训练集的数据在混合量子经典循环中训练该 ansatz 以解决优化任务
3、QuTrunk+Paddle VQA 算法应用实现
为便于理解,本文通过我们以制备量子态为例,介绍基于 QuTrunk 加 Paddle 框架使用变分量子算法(Variational Quantum Algorithms, VQA),即使用量子神经网络解决优化问题的基本思想与算法框架。
量子神经网络使用量子态与量子门构建电路。一个量子神经网络,也同样可以通过其结构(电路内量子门的连结方式),以及一组可调参数 (对应量子门的旋转角度)来表示。
上图是一个含有三个量子比特,六个参数可调量子门,仅一层的量子神经网络。其中 指一个绕 x-轴旋转 角度的量子门, 为可调参数.
- 注 1: 任意量子门可以被以任意精度分解为单量子比特门与双量子比特门 (例:CNOT 门)。
- 注 2: 单量子比特门总可以通过其旋转轴与旋转角度 θ 表示。
由以上可得,通过深度足够的量子电路并调整每一个单量子比特门旋转角度 θ,量子电路可模拟任意多量子比特门。
数学上,变分量子算法(使用量子神经网络解优化问题)可以表述为: 通过调节(结构给定)量子神经网络中可调参数 θ,得到最优的输出量子态 , 以及最小化损失函数 。通常输入量子态选取 。
下面将按逻辑顺序来讲解 qutrunk 和 paddle 结合下,通过 VQA 算法来优化量子线路获取最优参数的具体实现过程。
3.1 导入需要的包
程序使用到了 numpy,pyplot,paddle 和 qutrunk 等,首先通过如下带来引入必要的 library 和 package
3.2 定义参数化量子线路函数
首先定义用于训练的含参数的量子电路即量子神经网络,量子比特数和深度作为传入参数,可以在主函数中指定,针对每个量子比特执行 Rx,Rz 旋转门操作,角度值采用随机数生成,并对其执行 CNOT 操作:
3.3 定义计算量子线路梯度值函数
梯度的计算使用参数化移位法则(parameter-shift rule),按照公式(3)的规则来计算,参数偏移量指定为π/2
3.4 通过 Pylayer 定义电路层类
通过 Paddle 的 Pylayer 将 QuTrunk 构建的量子电路转换成到其深度学习的神经网络,其中 forward 函数用于运行量子线路返回计算结果,backward 函数用于调用梯度计算函数计算线路梯度,用于学习优化参数。
3.3 定义初始化参数
程序开始先定义出量子线路及量子神经网络训练所需要的的参数,例如:迭代次数 ITR,学习速率 LR,构建量子线路的量子数:num_qubits,线路深度:deph,以及记录迭代中间过程的 list 参数,loss_list(损失值列表),parameter_list(旋转角度参数列表)
3.4 构建量子线路
首先构造随机参数
然后根据定义的函数,构建量子电路,并绑定随机参数到线路上
3.5 通过 Paddle 优化器优化量子线路
程序调用了 Paddle 的 Adam 优化器来优化线路,如下:
然后通过定义训练的总次数进行迭代,并打印训练结果。
通过迭代训练,打印输出的结果如下,可以看到通过 115 迭代后,loss 不断变小收敛,逐步接近目标值-1。
3.6 输出结果
通过迭代后,我们将损失函数最终值、量子线路参数和最终量子态通过 print 输出,最后打印出电路图
结果如下:
为了更形象的展示迭代优化效果,我们也可以通过绘制其曲线来详细展示,程序如下
最后运行输出的效果如下图所示:
4、总结
以上的示例只是 QuTrunk 与 Paddle 结合的一次小的尝试,通过这次 QuTrunk 的量子编程框架和 Paddle AI 深度学习框架的结合实践的探索,也为后续的深层次合作提供了较好的参考,QuTrunk 将继续深入探索与 Paddle 的结合最佳实践。
版权声明: 本文为 InfoQ 作者【启科量子开发者官方号】的原创文章。
原文链接:【http://xie.infoq.cn/article/5904565454605ed70525f2405】。文章转载请联系作者。
评论