写点什么

搜索算法

0 人感兴趣 · 10 次引用

  • 最新
  • 推荐

ColPali: 基于 PaliGemma-3B 和 ColBERT 策略的视觉检索器

用户头像
吴脑的键客
2024-11-08

ColPali 是一种基于视觉语言模型(VLMs)的新颖模型架构和训练策略,可有效地从视觉特征为文档编制索引。 它是 PaliGemma-3B 的扩展,可生成 ColBERT 风格的文本和图像多向量表示。 它在论文《ColPali: 利用视觉语言模型进行高效文档检索》一文中介绍了它,

减少 95% 资源的向量搜索 | 使用云搜索的 DiskANN

DiskANN 通过构建低时延、高召回率的 Vamana 图,同时辅以内存与 SSD 磁盘之间的高效协同作业,召回率和主流的 HNSW 图算法基本保持一致,内存资源占用相比于基于图的算法要大幅减少。

https://static001.geekbang.org/infoq/ef/ef22d6fa64cd85f515d3620961ba0c34.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深度学习应用篇 - 推荐系统 [12]:经典模型 -DeepFM 模型、DSSM 模型召回排序策略以及和其他模型对比

CTR预估是目前推荐系统的核心技术,其目标是预估用户点击推荐内容的概率。DeepFM模型包含FM和DNN两部分,FM模型可以抽取low-order(低阶)特征,DNN可以抽取high-order(高阶)特征。低阶特征可以理解为线性的特征组合,高阶特征,可以理解为经过多次线性-非

https://static001.geekbang.org/infoq/83/834373091bf7fa0f1e87193e5a7c23af.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

秒懂算法 | 搜索基础

用户头像
TiAmo
2023-03-07

搜索,就是查找解空间,它是“暴力法”算法思想的具体实现。

https://static001.geekbang.org/infoq/bc/bc83843827f0db364052324c0ae3afd1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

2023 年了,做 SEO 还有必要吗?

seo、sem究竟做哪个?都有哪些常见的搜索引擎?不同的搜索引擎对应的优化策略又是什么?如何从前端入手优化搜索引擎,看这篇就够了!

推荐系统 [四]:精排 - 详解排序算法 LTR (Learning to Rank)_ poitwise, pairwise, listwise 相关评价指标,超详细知识指南。

推荐可分为以下四个流程,分别是召回、粗排、精排以及重排: 1. 召回是源头,在某种意义上决定着整个推荐的天花板; 2. 粗排是初筛,一般不会上复杂模型; 3. 精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;

推荐系统 [八] 算法实践总结 V0:腾讯音乐全民 K 歌推荐系统架构及粗排设计

推荐可分为以下四个流程,分别是召回、粗排、精排以及重排: 1. 召回是源头,在某种意义上决定着整个推荐的天花板; 2. 粗排是初筛,一般不会上复杂模型; 3. 精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;

推荐系统 [二]:召回算法超详细讲解 [召回模型演化过程、召回模型主流常见算法 (DeepMF_TDM_Airbnb Embedding_Item2vec 等)、召回路径简介、多路召回融合]

推荐可分为以下四个流程,分别是召回、粗排、精排以及重排: 1. 召回是源头,在某种意义上决定着整个推荐的天花板; 2. 粗排是初筛,一般不会上复杂模型; 3. 精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;

https://static001.geekbang.org/infoq/a6/a657bcc37780fa42ae6153890494d177.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

搜索中常见数据结构与算法探究(一)

ES现在已经被广泛的使用在日常的搜索中,Lucene作为它的内核值得我们深入研究,比如FST,下面就用两篇分享来介绍一些本文的主题:

搜索算法_搜索算法技术文章_InfoQ写作社区