AI 绘画平台难开发,难变现?试试 Stable Diffusion API Serverless 版解决方案
作者:王佳、江昱、筱姜
Stable Diffusion 模型,已经成为 AI 行业从传统深度学习时代走向 AIGC 时代的标志性里程碑。越来越多的开发者借助 stable-diffusion-webui(以下简称 SDWebUI)能力进行 AI 绘画领域创业或者业务上新,获得高流量及商业价值,但是面对多客户、高并发的复杂场景,使用原生 Stable Diffusion API 会面临以下挑战:
1. 显卡资源昂贵且难以购买,GPU 卡池管理技术门槛高: 高性能的 GPU 资源不仅价格昂贵,而且往往难以大规模采购。此外,GPU 卡池的有效管理和维护需要复杂的技术支持,也带来了额外的挑战。
2. 难以应对高并发: 原生的 Stable Diffusion API 采用单实例推理模式,其并发处理能力有限。在面对高并发场景时,尤其是并发请求具有大的波动性时,资源配置难以精确预测,从而可能导致系统错误和业务中断。
3. 多模型切换难度大: 当不同模型的请求在高并发条件下同时发送到同一实例时,频繁的模型切换成为一个显著的瓶颈。这种切换不仅消耗巨大,而且影响了推理效率,使得多模型部署在实际应用中变得复杂和低效。
为了帮助用户高效率、低成本应对企业级复杂场景,函数计算团队正式推出 Stable Diffusion API Serverless 版解决方案,通过使用该方案,用户可以充分利用 Stable Diffusion +Serverless 技术优势快速开发上线 AI 绘画应用,期待为广大开发者 AI 绘画创业及变现提供思路。
基于 Stable Diffusion API Serverless 版解决方案搭建的,部署 AI 艺术字应用活动火热进行中!生成姓氏头像赢新春好礼,欢迎点击 “阅读原文” 体验。
活动链接:https://developer.aliyun.com/topic/fcnewyear
应用场景
Stable Diffusion API Serverless 版本提供了多种可能性,以适应不同的应用场景和业务需求。
1. 个性化内容创作: 利用 Stable Diffusion API,内容创作者和数字艺术家可以快速生成个性化的艺术作品和图像。例如,艺术家可以根据用户的描述或关键词,即时创作出独特的艺术风格图像,实现个性化的艺术创作和用户互动。
2. 广告和市场营销: 在广告和市场营销领域,Stable Diffusion API 可以用来生成吸引人的视觉内容,从而增强广告效果。例如,企业可以根据产品特性和目标受众的偏好,快速创建多样化的广告图像,以提升品牌形象和市场吸引力。
3. 游戏和娱乐产业: 在游戏和娱乐产业中,Stable Diffusion API 可以被用来增强用户体验,通过生成独特的游戏背景、角色和元素来丰富游戏世界。例如,游戏开发者可以使用 API 来设计独特的游戏环境和角色,为玩家提供更丰富和个性化的游戏体验。
方案优势
Stable Diffusion API Serverless 版本在多方面提供了显著的优势,特别是在简化部署、成本效率、推理效率、资源管理、并发处理和用户体验上。以下是这些优势的具体体现:
1. 上手简单,快速部署: 借助阿里云 Serverless 应用中心,用户可以实现快速部署,大幅简化传统 Stable Diffusion API 的复杂部署流程。这使得开发者能够快速上手并专注于应用的开发和创新。
2. 计费灵活,成本效益显著: Serverless 版本提供按需计费模式,用户仅需为实际使用的资源付费,无需预先投资昂贵的硬件。这种灵活的计费方式大幅降低了总体成本,尤其适合资源需求波动的场景。
3. 优化的模型管理,提升推理效率: 通过优化多模型的管理和部署,Serverless 版本有效提高了推理效率。减少模型切换和加载的频率,确保了快速、稳定的推理性能。
4. 自动扩缩容,高效资源管理: 利用自动扩缩容机制,Serverless 版本根据实时需求灵活调整资源使用,避免了资源浪费并保障了服务的连续性。
5. 异步处理和排队机制,优化并发处理: Serverless 版本通过引入异步处理和高效排队机制,克服了高并发场景下的挑战,保证了服务的高可用性和响应速度。
总之,Stable Diffusion API Serverless 版本集成了阿里云 Serverless 技术的核心优势,提供了一种高效、成本有效且用户友好的解决方案,为开发者在 AI 绘画和其他 AI 应用领域的创新和商业化提供支持。
方案架构图
名词解释:
admin,提供模型管理,包括模型上传+删除等
webui,提供界面化的调试功能,主要是模型和参数调整、插件安装等,达到更好出图效果
proxy,API 的前端服务,提供非推理之外的功能,主要包括结果、进度查询等
control,控制推理实例最大并发实例数。通过控制 control 的并发度,控制下游多函数推理服务的实例数
agent+sd-api,推理服务
一个模型(checkpoints)创建一个函数,每个函数支持弹多个实例,总的实例数通过 control 并发度进行控制。
之所以一个模型(checkpoints)创建一个函数,是为了避免多模型并发推理使用场景下的模型间的频繁切换带来的开销,提升推理效率,进而达到给用户降本的效果
sd_ 开头的都是动态创建函数
注意事项:
使用过程中会动态创建 sdapi 函数,每个 checkpoint 对应一个函数,并且会在 ots 中 function 表中记录对应的函数详情。如果想删除动态创建的函数,请清理对应 ots 中 function 表的函数记录,避免后续调用出问题
异步推理结果会默认存放到 oss 中,存放到 image/default 路径下
部署 Stable Diffusion API Serverless 版
准备工作
开通云产品:
函数计算 FC:用于提供 CPU+GPU 算力
对象存储 OSS:用于保存输出图片结果;同时存储请求中的中转图片,便面直接传递 base64 导致超出请求的 body 限制
表格存储 Tablestore:用于存储推理结果、函数信息等
文件存储 NAS:用于多节点共享存储空间
部署 Stable Diffusion Serverless API
进入函数计算 FC 3.0 控制台,点击左侧“应用”进行应用中心。如果老用户曾经创建过应用,点击“创建应用”也可直达应用中心
点击“人工智能”分类,选择“fc-stable-diffusion-v3”模版,点击“立即创建”
确定详细参数进行应用创建,您可以重点注意三个信息的填写,其他使用默认值即可。
地域:选择距离您较近的地区,如果后续有更多出图需要,可以考虑选择海外地区,以方便 hugging face 等网站的连接
命名空间:如果您已经部署多个 SD,请在这里进行区分,新用户可使用默认值
绘图类型:选择艺术字
首次使用需要额外的权限,可以根据提示“前往授权”
点击“创建应用”,勾选了解内容,点击“同意并继续部署”,等待大约 1 分钟
生成 WebUI 域名(注意保护此链接不外传以免耗费您账户的费用),不要点击链接,直接切换到右侧“Serverless API”
点击“Serverless API”点击“初始化 Serverless API”,再次确认已经开通“FC、OSS、OTS”三款产品,勾选“已阅读”点击“下一步”
进行“角色名”的授权,勾选“启用 Serverless API”,OTS 实例创建方式可以默认“自动创建”,确认后等待大约 30 秒
创建好 Serverless API,就可以参考下面 API 定义开始进行测试生产使用
Stable Diffusion API Serverless 版支持的 API 详情
API 接口主要分两类:
非推理类接口,用于结果和进度查询、模型管理、应用重启等
推理类接口,文生图、图生图、图片放大等
具体可以参考: https://github.com/devsapp/serverless-stable-diffusion-api/blob/main/api/api.yaml
1. 模型相关 API
模型的注册、更新和删除都通过 admin 界面化操作即可
1.1 获取模型列表 API
GET /modelsresponse:
2. 推理相关 API
支持文生图和图生图
支持同步模式和异步模式两种,默认同步模式
同步模式:header 中添加 {"Request-Type":"sync"},不添加默认为同步模式
异步模式:header 中添加 {"Request-Type":"async"}
推理结果会同步存储到 oss 和 ots 中,可以通过 /tasks/{taskId}/result 接口获取推理结果(oss 图片地址、推理参数等)
2.1 txt2img
POST /txt2img
request:其中 stable_diffusion_model, sd_vae 新加字段,其他保持跟原生 webui:txt2img 保持一致
其中 controlnet 中图片支持两种格式:
图片的 base64 编码:备注:base64 请求存在超过 FC 异步请求 body 上限可能,如果超过上限请使用 oss 方式
oss 上图片路径,支持 png/jpg/jpeg
response:
2.2 img2img
POST /img2img
request:其中 stable_diffusion_model,sd_vae 新加字段,其他保持跟原生 webui:img2img 保持一致其中 controlnet 和 init_images 中图片支持两种格式:
图片的 base64 编码:备注:base64 请求存在超过 FC 异步请求 body 上限可能,如果超过上限请使用 oss 方式
oss 上图片路径,支持 png/jpg/jpeg
response:
3. 图片处理 API
3.1 图片放大
图片放大,支持单张图片处理,暂不支持批量处理。respone 返回 taskId,调用获取结果接口获取图片地址即可
其中 image 支持两种格式:
图片的 base64
oss 上图片路径,支持 png/jpg/jpeg
POST /extra_images
request:
response:
4. 结果相关 API
4.1 获取结果
通过 taskid 获取推理结果
GET /tasks/{taskId}/result
response:
4.2 查询进度
推理进度查询
GET /tasks/{taskId}/progress,同 webui 中的 progress
response:
4.3 取消推理
取消对应任务 POST /tasks/{taskId}/cancellation
5. 动态资源相关 API
5.1 获取动态创建 sd 函数
获取动态创建的 sdapi 函数
GET /list/sdapi/fucntions
response:
5.2 更新动态创建 sd 资源
批量更新动态创建 sd 函数资源,比如镜像、环境变量、cpu、显存等。其中 models 不指定代表更新所有动态创建 sd 函数资源
POST /batch_update_sd_resource
request:
response:
5.3 批量删除动态创建函数接口
批量删除动态创建的函数,入参函数列表
POST /del/sd/functions
request:
6. 其他接口
原生 webui-api 接口,除了上面支持的功能接口,剩下的 api 接口
插件自定义的 api 接口
其中支持同步、异步模式+任务模式:
同步/异步,header 中设置 Request-Type,其中值 sync 为同步模式,async 为异步模式,不设置该值默认为同步模式,异步获取结果需要从上面的获取结果接口(tasks/{taskId}/result)获取最终的结果
任务模式,header 中设置 Task-Flag,会将结果保存到 ots 进行持久化,同样支持同步+异步
最佳实践
为了方便大家直观体验一下该解决方案成效,基于函数计算团队开发者的基于 Stable Diffusion Serverless API 解决方案搭建的 AI 文字生成应用,作为一个实验 demo 开放体验,期待为广大开发者 AI 绘画创业及变现提供一些有益思考。直接参加体验活动,送好礼!
活动链接:https://developer.aliyun.com/topic/fcnewyear
部署成功的 AI 绘画应用:
眯着眼睛看看是什么字?
开源代码
github : https://github.com/devsapp/serverless-stable-diffusion-api
可以自己基于开源代码加工开发
版权声明: 本文为 InfoQ 作者【阿里巴巴云原生】的原创文章。
原文链接:【http://xie.infoq.cn/article/2ff06e92436a68fa6e9b4a4bc】。文章转载请联系作者。
评论