"教练,我想打篮球!" —— 给做系统的同学们准备的 AI 学习系列小册
最近在读 Jeff Dean 的新作 Pathways ,心中又一次出现了这样的困惑:从前沿工作上看,系统工作与算法模型工作早就已经到了相互结合、缺一不可的状态。但近几年在做开源项目的过程中,和开发者、用户交流下来,最大的体会是系统工程师和算法工程师几乎总是离的很远。同学们彼此眼中的对方,大概是“洗草药炼丹的” vs “大力出奇迹抡大锤的”……
做系统的同学们想要深入跟进 AI 技术趋势,把大锤抡到算法同学的心坎儿里,并不容易。几乎所有学习资料都透着一股浓重的科研味道,太多的公式与理论,太少的工程与系统。
作为系统出身的 AI 爱好者,我们在做 [Towhee] (https://github.com/towhee-io/towhee) 与 [Milvus] (https://github.com/milvus-io/milvus) 两个开源项目的过程中一直在等待一个为系统人量身打造的 AI 教程,但一直没有这样的作品出现。
近期,我们计划自己动手进行一次尝试,做一套咱们系统人自己的 AI 学习教程。项目定位是开源,纯系统角度,落地,好玩。目前计划中的有三个系列,分别侧重应用实战、推理系统优化、前沿系统技术:
1、从零开始搭建 AI 应用
应用 CLIP 搭建文本-图片跨模态搜索服务
技术宅的浪漫:图片与视频二次元化!
大规模图搜系统
跨模态视频语义检索
音乐版权检测实战(策划中)
问答系统(策划中)
没有人比我更懂如何高效浏览 Github :为 Github 构建开源项目检索与推荐系统(策划中)
技术宅的浪漫:你的女神总是缺一个口红色号!(策划中)
2、构建你自己的高性能推理服务
初识 TorchScript ,ONNX ,TensorRT
基于 Nvidia 的工具包加速你的推理服务
Towhee 推理服务构建实战 (策划中)
3、AI 系统论文精读
Pathways: Asynchronous Distributed Dataflow for ML
接下来即将和大家见面的系列文章是 《从零开始搭建 AI 应用:应用 CLIP 搭建文本-图片跨模态搜索服务》。在这个系列中,将会学到:
CLIP 跨模态搜索的基本工作原理
文本-图片跨模态搜索的原型搭建
进阶 1:部署向量数据库,进行大规模向量召回
进阶 2:部署推理服务,大幅提升推理性能
进阶 3:向量数据压缩
为了最大化提高教程的流畅度,我们目前已经在 [Towhee] (https://github.com/towhee-io/towhee) 项目中完成了一系列准备工作,包括 CLIP 的集成封装,python 侧的 pipeline 编程接口,贴近生产实战的 docker 镜像,干货满满,敬请期待!
如果你觉得我们分享的内容还不错,请不要吝啬给我们一些鼓励:点赞、喜欢或者分享给你的小伙伴!
活动信息、技术分享和招聘速递请关注:https://zilliz.gitee.io/welcome/
如果你对我们的项目感兴趣请关注:
版权声明: 本文为 InfoQ 作者【Zilliz】的原创文章。
原文链接:【http://xie.infoq.cn/article/588f6ab1785ba9a926a426a62】。文章转载请联系作者。
评论