J-Tech & 开源之夏|什么是比快更快的向量搜索
J-Tech Talk
由 Jina AI 社区为大家带来的技术分享工程师们将深入细节地讲解具体的问题
分享 Jina AI 在开发过程中所积累的经验
本期 J-Tech Talk 邀请到了在开源之夏项目中脱颖而出的杨小燕,分享她负责的项目《支持 Redis 数据库作为 DocArray 的存储后台》帮助更多的开发者高效地进行向量检索。
作为 Jina 生态的底层模块,DocArray 是一种可扩展的数据结构,完美适配深度学习任务。总的来说,DocArray 能够把非结构化数据,统一成同一种数据结构。支持的数据类型包括文本、图像、音频、视频、3D mesh 等,并且能够高效地处理、检索、推荐、存储及传输数据。在小燕的贡献下,DocArray 新增了 Redis 数据库的后端存储支持,现在 DocArray 支持了更多向量数据库作为存储后台,如 Annlite,SQLite,Qdrant 以及 Elasticsearch 等。
分享内容
什么是 DocArray
DocArray 是一种为机器学习而生的数据结构工具包。
如何实现 DocArray 的 Redis 后端存储
添加 Redis 支持,可以使用基于图的 ANN 搜索算法:HNSW,该算法能够最大程度地达到检索召回率和检索时间的平衡。
经验分享 - 在开源之夏和世界各地的工程师一起开发的体验
关于讲师
杨小燕 Jina AI 开源社区 DocArray 贡献者中国原子能科学研究院的核能科学与工程专业硕士二年级在读,本科毕业于清华大学工程物理系。
活动时间
2022 年 9 月 22 日 周四晚 19:00 - 19:45
开源之夏是由中国科学院软件研究所“开源软件供应链点亮计划”发起,并长期支持的一项暑期开源活动,由软件所与 OpenEuler 社区联合主办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展。
欢迎私信申请报名活动~
评论