写点什么

三掌柜的 2023 年国产 AI 体验之路

作者:三掌柜
  • 2023-12-29
    广东
  • 本文字数:5500 字

    阅读完需:约 18 分钟

三掌柜的2023年国产AI体验之路

目录

  • 前言

  • AI 体验回顾

  • 百度云千帆使用体验

  • 腾讯云 HAI 使用体验

  • 阿里云通义使用体验

  • 番外篇:外联奇遇记

  • 结束语

前言

不用多说,2023 年的技术圈引爆全圈的当属大模型和生成式 AI 了,在短短的一年时间里,几乎各行各业都被 AI 所渗透,对于开发者而言,正在经历一场由生成式 AI 带来的开发方式的革新。作为开发者的我,同样是没有“逃过”AI 的“魔掌”,在不到一年时间里先后体验使用了 6 个国内外大模型的开发体验,其中有 3 个是国产的,本文也是基于自己关于国产大模型的使用体验来分享,所以其他国外的 3 个就在做过多介绍。作为自己的 2023 年关于 AI 的年终总结,个人觉得体验还是非常丰富的,也让我从 AI 小白到入门 AI,那么本文就来总结回顾一下自己的 2023 国产 AI 体验历程。

AI 体验回顾

这里还是要分享一下在 2023 年自己关于 AI 使用和体验以及开发的回顾,不管是国外的大模型还是国内的大模型,基本上我都做了体验,具体的大模型名字这里就不再一一举例说明,我想要分享的是自己关于 AI 体验的感受。


通过体验不同厂商的 AI 大模型,让我自己从 AI 小白到成功入门 AI,这对我个人而言是非常有纪念意义的事情,从一个“国产”程序员的角度来看,我个人还是非常希望我们国产 AI 大模型能够赶快超越国外的同等产品的,而且我也非常看好国内的 AI 大模型能够改变符合我们自己的生活方式。

百度云千帆使用体验

关于百度云千帆大模型的使用,这里我还是直接把我的使用步骤分享出来更有说服性,但是需要着重说明的是百度云千帆大模型是我第一次上手去开发使用的大模型,之前关于大模型的使用体验是基于生成式 AI 已经做好的应用层面,这次的体验是自己去开发使用体验,也是第一次让我体验到了深度接触大模型的美妙感受。那么接下来就来详细分享一下我对百度云千帆使用的体验步骤。


在实际使用千帆大模型平台的过程中,我对其进行了一系列的测试和评估,首先来分享一下从登录进入开始。

1、登录

首次进入打开网站地址 https://cloud.baidu.com/product/wenxinworkshop,直接进入百度智能云首页,以浅蓝为主色调的首页看起来非常清新脱俗,在浏览友好的主页之后,不要忘了亲自体验千帆大模型,先去登录百度账号。

别忘了在首页正中间有一个非常醒目的“立即使用”按钮,点击即可一键触达,接下来就是去体验了。

点击“立即使用”按钮之后,会有一个同意用户协议的提示,阅读并接受,点击“同意并继续”按钮进入。

进入千帆大模型平台之后,如下所示。

通过从上图可以看出,千帆大模型平台的功能非常庞大且丰富,如果想全部去体验一下还是需要很大的时间成功,作为初次使用千帆大模型的用户也不必担心,因为下面有关于新手指南的引导文档,滑动到主页的最下面就可以看到新手指南,具体如下图所示。

2、体验在线 API

这里笔者以较为简单的一个方面来进行实际体验,通过体验在线测试 API 的功能来直观的让初学者有一个很好的示范,在开始之前需要先创建一个应用,具体步骤如下所示。

其实创建应用非常简单,只需通过应用接入,点击“创建应用”按钮即可。

在创建应用的时候,只需要输入应用名和描述,然后服务配置根据实际情况来选择即可,这里的示例使用默认的全部选项即可。


应用创建成功后,就可以在应用列表中看到创建成功的应用,具体如下所示。

紧接着就可以验证了,直接进入下面的网址就可以体验在线调试功能来,直接打开网址:

https://console.bce.baidu.com/tools/#/api?product=AI&project=%E5%8D%83%E5%B8%86%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%B9%B3%E5%8F%B0&parent=%E9%89%B4%E6%9D%83%E8%AE%A4%E8%AF%81%E6%9C%BA%E5%88%B6&api=oauth/2.0/token&method=post

打开网址之后,会进入到示例代码中心的人工智能 AI 选型,具体如下所示。

主要分为三个部分:千帆大模型的产品详情,获取应用信息,以及示例代码。本文以 node.js 示例代码为例。


接下来选择一个模型,然后在对话框中输入“hello world”,如下图所示。

上面的操作,可以直接点击“调试”按钮,也可以点击对话框右边的箭头,两种操作方式。


值得注意到是中间的代码区域,并不是使用者手动输入的,而是自动根据右侧输入的内容而产生的,具体运行效果如下所示。

通过上图运行到结果,可以看到千帆大模型可以正常的给我回应,且中间代码里面的内容也更新了。


另外,也可以选择调试结果来查看具体的返回的 JSON 数据,方便做调试,具体如下图所示。

上面就是我关于百度云千帆大模型的亲自上手开发体验的操作步骤,但是千帆大模型不止这一点功能,但是由于篇幅限制,这里不能一一介绍。

3、体验小结

体验之后,我个人觉得百度云千帆是国内最早期的大模型之一,也是最接近国外大模型水平的大模型,而且在实际开发应用过程中,千帆大模型的使用步骤不复杂,而且效果也很不错,非常适合去开发一些生成式 AI 的应用,个人觉得整体效果已经非常不错,对于刚接触大模型开发的小伙伴来说是个非常不错的练手选择,所以我觉得 2024 年我还会继续深度使用和体验它。

腾讯云 HAI 使用体验

其实腾讯云的大模型也是国内布局很早的,而且对应的生成式 AI 应用也是很早就推出来的。今年也是一个机缘巧合,我入手体验了腾讯云的大模型,个人觉得有云厂商背景的大模型有很大的“先天优势”,不管是从算力还是模型“喂养”,都有很强大的支持。自从有了百度云千帆的实际上手开发体验的经验之后,再来体验腾讯云的相关开发,就有一点得心应手了。


废话不多说,再来回顾一下我个人关于腾讯云 HAI 的使用体验具体步骤和心得。

1、关于 StableDiffusion API 服务使用

先来体验一下高性能应用服务 HAI 快速为开发者提供 StableDiffusion API 服务,然后进入 jupyter_lab 操作界面,在腾讯云控制台找到对应的地方,这里是在算力管理页面选择

进入 jupyter_lab 之后,如下所示:

选择终端操作,如下图所示:

在终端中输入命令行:


cd /root/stable-diffusion-webuipython launch.py --nowebui --xformers --opt-split-attention --listen --port 7862
复制代码

具体执行效果如下所示:

执行命令之后的效果,如下所示:

接着需要添加 高性能应用服务 HAI 的端口配置,使外部网络能够顺利地访问该服务器提供的 API 服务,方面体验使用。进入算力详情,点击编辑规则。

然后进入算力详情,找到对应的安全组规则设置,如下所示:

紧接着,先看配置参考如下:

来源:0.0.0.0/0 协议端口:TCP:7862 (根据您配置的端口填写)

具体配置位置如下所示,值得注意的是这只是一个个人关于自己使用的记录,如有不一样的地方,请一切以实际来看。

创建之后,列表就会显示出来,如下所示:

打开启用 StableDiffusion API 接口使用指南,直接配置完成后输入 服务器 IP 地址:端口号/docs 可查看相关的 API 接口 swagger 使用指南,官方提供的 api 常用的有几个:

/sdapi/v1/txt2img 文字生图 
POST/sdapi/v1/img2img 图片生图
POST/sdapi/v1/options 获取设置 GET | 更新设置 POST(可用来更新远端的模型)
/sdapi/v1/sd-models 获取所有的模型 GET
复制代码

这里的服务器地址就是你开通的算力的公网 IP,如果不清楚,你可以去算力详情查看,这里不再赘述。在浏览器中输入服务器地址+端口号+/docs,回车,即可打开,如下所示:

2、搭建 Web 应用

使用 高性能应用服务 HAI 搭建的 StableDiffusion API 作为服务端快速动手开发一个基于 Cloud Studio 构建的 Web 应用,在搜索框输入 Cloud Studio ,点击搜索,如下所示:

进入之后,选择开发空间,如下所示:

选择手动创建,并立即创建,如下所示:

进入手动创建页面,进行新建工作空间的设置,如图所示:

新建之后,稍作等待,即可创建成功,如下所示:

前端界面已完成,请下载压缩包后上传至工作空间并解压压缩包,点击下载压缩包 : sd_api.zip下载链接:https://gitee.com/login?redirect_to_url=%2Fmmliujc%2Ftencent_gpu%2Fraw%2Fmaster%2Fsd_api.zip

然后进行上传压缩包的操作,具体看下面的示意图:

点击空白处,直接点击上传 按钮即可上传成功。

上传压缩包,如下所示:

终端操作解压压缩包:

终端的输入解压命令 :

unzip sd_api.zip

在终端中输入解压命令,文件即可打开:

解压完成之后,如下所示:

然后开启 web 服务并查看需调试的页面,解压完成后,在终端窗口输入命令:

cd sd_api #进入文件夹
npm install #安装依赖包
复制代码

接着进入项目内(sd_api)并安装依赖后启动 Web 项目截图:

等待依赖完成安装后就可以启动 Web 项目了,输入命令:

npm run dev #启动 web

启动项目,运行后的效果,如下所示:

通过查看端口来查看 Web 页面,如下所示:

选择本地预览,查看效果,如下所示:

然后进行设置,然后进行构图。

在 Vue 项目下的 model 文件夹中创建一个名为 Txt2ImgModel.ts 的文件,这个文件主要用于调用相关接口参数配置,如下所示:

然后在 Vue 项目下的 model 文件夹中创建一个名为 ControlNetModel.ts 的文件,这个文件主要用于添加 ControlNet 组件

接下来安装 vue 环境,如下所示:


在安装完成后,下载附件 main.zip 解压后将 main.vue 文件覆盖至项目下的 views 文件夹中的 main.vue 并保存,这个文件将用于数据绑定、图片渲染功能:

下载代码文件:main.vue.zip ,下载链接 : https://gitee.com/mmliujc/tencent_gpu/raw/master/main.zipview 文件夹中的 main.vue 文件修改后截图:

同时修改 vue 项目下的 vite.config 文件,配置信息修改为部署在高性能应用 HAI 服务器 API 的相关信息:

主要是修改访问服务器地址,如下所示:

然后保存之后,重新运行项目,如下所示:

搭建完成,快速启动 Web 页面并测试,效果如下所示:

3、体验小结

关于腾讯云 HAI 的使用体验,这里以关于 AI 绘图的切入点来分享自己的体验,个人觉得这次开发体验是非常棒的,也是非常有成就感的,因为我觉得通过使用腾讯云 HAI,彻底让我入门 AI 大模型相关的开发工作,先不说我的上手能力能够应对多大的开发量,但是我觉得对我个人而言,在以后的关于大模型开发应用已经没啥太大难度,所以说这也是我 2023 年关于大模型相关的最大的收获所在。

阿里云通义使用体验

关于阿里云通义的使用,我是最早开始接触和体验的,不管是通义在初期内测的时候,还是正式发布之后的使用体验。但是关于阿里云通义使用体验,我只是使用它做了一个 AI 绘图的作品,但是是基于阿里云已经有的大模型应用来实现的,我没有做实际的开发应用操作,所以这里就不来拿具体的开发应用例子来讲。


虽然不做具体示例分享,但是可以分享一下关于阿里云通义使用心得,我个人觉得体验完通义大模型之后,单纯拿它的相似图生成这个功能来看,就已经封神了,效果非常的不错,而且超乎预期想要的效果,这里没有夸张的讲,真的非常的棒。还有就是它的文生图能力,和腾讯云的 HAI 文生图友谊比,这里没有拉仇恨,只是做一个横向的对比,个人感觉二者不分伯仲。

我虽然在 2023 年在阿里云通义的使用没有太深度,但是展望一下 2024,我觉得我肯定会深度去使用阿里云通义去开发相关的应用体验,也期待阿里云通义大模型越来越强大。


番外篇:外联奇遇记

2023 除了自己关于 AI 体验的收获之外,我还在参与线下活动中认识了很多大佬和粉丝,以及多年网友的线下面基。还有就是自己通过线下活动,学到很多技术圈的最新动向和资讯,也让我在继续自己的开发生涯的同时及时学习新技术,帮助自己提高自身竞争力。在 2023 年,我参加了不少于 20 场的各类线下沙龙活动,涉及技术圈的各种技术方向和领域,真的让我“开了眼”。我觉得最值得我分享的线下活动有很多,但是这里不得不说的有 3 个大会,我以活动时间先后顺序来分享。

第一个值得提的线下沙龙活动当属 8 月份火山引擎开发者社区举办的火山引擎开发者社区 Meetup 第 11 期上海站,也是我 2023 年第一次参加火山的线下活动,但也是 2023 年最后一次参加,因为没记错的话火山引擎开发者社区在上海就举办一次线下活动吧😂。但是通过本次线下活动,学到很多有用的技术理念,比如从云基础设施到上层云应用的实践,是我之前所陌生的领域,这次活动算是给我很好的科普了,对我帮助很大,我觉得赚到了。

第二个值得提的活动,当属 11 月份极客邦主办的 FCon 全球金融科技大会·上海站,我曾在我朋友圈发个这样的感慨:参加 FCon 大会,是三掌柜的圆梦之旅,因为我见到了我的偶像极客邦大 boss 霍老板,他的前期经历跟我现在的经历比较像,都对程序开发不感兴趣,但是对编辑感兴趣,也就是技术编辑,最后很荣幸的和霍老板聊了一会,并把我之前证书的印刷的霍老板名字换成了霍老板亲笔签名,又合了影,我真的赚大了!而且我也见到了 InfoQ 写作社区负责人丹姐,并要了丹姐的亲笔签名,毕竟我是 InfoQ 写作社区签约作者,哈哈。



第三个值得提的活动,当属 12 月份极客邦主办的 2023 QCon 全球软件开发大会,恰逢今年是 QCon 第 15 周年,非常有纪念意义,所以就算是“下刀子”,我也要去现场参会,由于活动地点太远,当天早上 5:30 就要起床,地铁就坐了一个半小时,打车 10 几分钟,真的是用爱参会的,好在此次活动也没让我失望,又一次见到了霍老板,分享一个小插曲,那会儿时间太早,摄影师还没到位,直接用的霍老板的“遥遥领先”拍的合影,我觉得我又赚大了,哈哈。



结束语

马上 2023 就要结束,简单回顾一下这一年,想必大家都跟我一样有很多值得纪念的经历。加上大环境的影响,技术圈的“寒冬”,但是每一位开发者都是以对技术的热情而过好每一天,我也是。我觉得 2023 年,是 AI 的元年,也是技术人的技术革新的一年,很有纪念意义。2023 年,对我来说也是非常有收获、有意义的一年,我通过实际开发体验相关的 AI 大模型,让我成功入门 AI 赛道,对我以后的个人竞争力有很大的帮助,在使用这些国产大模型的同时,也让我看到了我们国产大模型在紧追快赶,不断的提升和完善,也让我们这些“国产”程序员看到了我们自己的大模型的不断发展壮大,提升了我们的自豪感。最后,再来期许一下国产大模型,能够继续坚持迎难而上,坚持自主创新,坚持造福国人!

发布于: 44 分钟前阅读数: 5
用户头像

三掌柜

关注

某某某技术有限责任公司架构师 2021-02-05 加入

一分耕耘,不一定有一分收获,但十分耕耘,一定会有一分收获!

评论

发布
暂无评论
三掌柜的2023年国产AI体验之路_年终总结_三掌柜_InfoQ写作社区
vConsole