Last Week in Milvus
What's New
Core Updates
#23353 在 2.3 版本中, milvus 和 knowhere 引擎会移除了 Annoy 索引。Annoy 索引在性能和召回率方面均不如 IVF、HNSW 等索引,维护成本比较高所以经过讨论决定在 2.3 中移出 Annoy 索引的支持,有使用的用户要注意。
#23321 在 2.3 版本中,Milvus 会支持 count 接口,用于统计 collection 的行数。现有的 Milvus sdk 中,用户普遍会使用 num_entities 获取 collection 函数,但此接口有很多限制,例如会统计被删除的数据、未持久化的数据统计不准等问题。新增的 count 接口除了能计算 collection 行数外,还支持 query 的查询表达式用于统计带条件的行数。
Knowhere
#815 #820 内核侧正在开发 GetVectorById 的功能,为 Milvus 2.3.x 版本中支持 retreive 原始向量做准备。
Birdwatcher
#137 在为 QueryNodeV2 做适配中#139 新增命令清理已经被 drop 的 collection 元数据
Community
新的开源项目 GPTCache ,用于解决调用大模型性能慢、成本高的问题。可以把 Milvus 作为用户、OpenAI 之间的缓存层,语义相似的问题会使用 Milvus 中的数据来回答,减少对 OpenAI 的调用。已发布至 0.1.11 版本。#801 AutoGPT 支持 Milvus 作为 memory 后端
New Contributor
Welcome arijit-chowdhury-genea
What's Up Next
下周发布 2.2.6 版本,预计 4 月底发布 2.3.0 版本。
Did you know
除了在互联网、ChatGPT 领域可以用 Milvus 之外,在生物制药的分子式识别也可以用 Milvus,用户案例详见 https://milvus.io/docs/molecular_similarity_search.md
评论