写点什么

lucene

0 人感兴趣 · 13 次引用

  • 最新
  • 推荐

[分词] 基于 Lucene8 版本的混合分词器 (分词合并)

  近期在研究NLP相关技术,再次感受到中文领域分词算法的重要性,突然想到一年前在项目中使用到的Lucene技术中关于分词器的部分,对其再次进行对比分析,并混合多种现有分词方法,获得更多词项。

https://static001.geekbang.org/infoq/47/47f2f33fea2ab8931fe51f3e0f9468f8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从零开始实现 Go 搜索引擎(一)

用户头像
geange
07-19

用Go从零开始实现一个搜索引擎(Go版lucene)

https://static001.geekbang.org/infoq/17/1744f987a2ed260227f74f04711d885a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

初识 ElasticSearch

用户头像
阿Q说代码
2022-06-22

ES 是使用 Java 编写的一种开源搜索引擎,它在内部使用 Lucene 做索引与搜索,通过对 Lucene 的封装,隐藏了 Lucene 的复杂性,取而代之的提供一套简单一致的 RESTful API

Lucene 倒排索引原理

Lucene 作为 Apache 开源的一款搜索工具,一直以来是实现搜索功能的神兵利器,Solr 和 Elasticsearch 均基于该工具包开发。 而 Lucene 之所以能在搜索中发挥至关重要的作用正是因为倒排索引。 因此本文将介绍倒排索引的概念以及倒排索引在 Lucene 中的实现。

深度解析 Lucene 轻量级全文索引实现原理

Lucene的相关使用心得,内容涵盖索引的生成、管理及搜索功能等内容。本文介绍了在轻量级的数据搜索中,深度解析Lucene如何实现全文索引。

https://static001.geekbang.org/infoq/88/887e9aa771e04a9346bc94fa974b8576.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

全文检索工具包 Lucene 入门教程

用户头像
AlbertYang
2021-03-25

Apache Lucene 是完全用Java编写的高性能,功能齐全的,全文检索引擎工具包,通过lucene可以让程序员快速开发一个全文检索功能。

https://static001.geekbang.org/infoq/8a/8accba0b5b5e93350fe48e893eb6810b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

为什么 ElasticSearch 比 MySQL 更适合全文索引

MySQL 对于复杂条件查询的支持并不好。MySQL 最多使用一个条件涉及的索引来过滤,然后剩余的条件只能在遍历行过程中进行内存过滤,而 ElasticSearch 十分适合进行复杂条件查询,是业界主流的复杂条件查询场景解决方案,广泛应用于订单和日志查询等场景。

起飞!这份技术点拉满的 ELk+Lucene 笔记,可能价值百万

用户头像
小Q
2020-09-10

起飞!这份技术点拉满的ELk+Lucene笔记,可能价值百万

不会有人还不知道全文检索工具 Lucene 怎么用吧?文字长文教程

用户头像
给你买橘子
2020-07-11

Apache Lucene 是完全用Java编写的高性能,功能齐全的,全文检索引擎工具包,通过lucene可以让程序员快速开发一个全文检索功能。

https://static001.geekbang.org/infoq/13/13c859c8696e3743de1df89f81febbcc.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Lucene 的 Smart CN 实现分词、停用词、扩展词

用户头像
Page
2020-05-24

Lucene 中提供了 SmartCN 为中文提供分词功能,实际应用中还会涉及到停用词、扩展词(特殊词、专业词)等,因此本文将聚焦在 SmartCN 而暂时不考虑其他中文分词类库。

https://static001.geekbang.org/infoq/46/460a389a20c6b64c1eb55a9042531a69.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

H2 的全文检索功能

用户头像
Page
2020-05-22

在前面的文章中,我们介绍了 H2 的一些特性以及 为什么H2 适合应用在测试环境中。H2 不但可以作为嵌入式数据库、内存数据库使用。在适当的场景下可以选择使用 H2 替换掉 SQLite,还可利用 H2 内存数据库的特点,将它还提供了全文检索的功能。

Elasticsearch 原理讲透了!

用户头像
for
2020-05-09

反向索引又叫倒排索引,是根据文章内容中的关键字建立索引。 搜索引擎原理就是建立反向索引。 Elasticsearch 在 Lucene 的基础上进行封装,实现了分布式搜索引擎。 Elasticsearch 中的索引、类型和文档的概念比较重要,类似于 MySQL 中的数据库、表和行。

lucene_lucene技术文章_InfoQ写作社区