写点什么

分词

0 人感兴趣 · 6 次引用

  • 最新
  • 推荐

ElasticSearch 拼音搜索自定义扩展插件 (长拼音序列)

  当前的中文搜索引擎都支持拼音搜索,但是在使用过程中会出现各种各样的场景,当前的自定义插件,用来处理在拼音搜索过程中如果遇到长拼音序列的情况,应该如何进行处理。

https://static001.geekbang.org/infoq/27/273c78b0dada91f16bac630ae94e488a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

中文分词的原理与方法及其在运维领域中的实践

# 技术黑板报 # 第八期,什么是中文分词,其原理与方法在智能运维中是如何应用的?本篇将带来详细解答

Elasticsearch IK 分词扩展词典(qbit)

用户头像
qbit
2021-09-28

本文对 Elasticsearch 7.13 适用,扩展词条实时生效。

https://static001.geekbang.org/infoq/0c/0c0c4802041c979d0777496ff6782a19.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

pyhanlp 添加自定义词典(qbit)

用户头像
qbit
2021-09-07

pyhanlp 添加自定义词典,提取关键词

https://static001.geekbang.org/infoq/de/de774f63f029fc4db9c2b0537c1d5225.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ES 终于可以搜到“悟空哥”了!

用户头像
悟空聊架构
2021-04-21

Elasticsearch 搜索引擎内置了很多种分词器,但是对中文分词不友好,所以我们需要借助第三方中文分词工具包。

https://static001.geekbang.org/infoq/22/22dfd3e789134c70d0a442375f1c1cca.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 Python 和 SudachiPy 进行日语分词

用户头像
Roc
2020-05-27

需要对一些日文进行词频统计,其中主要的技术点就是日语分词。本文使用 Python 和 SudachiPy 库进行日语分词。

分词_分词技术文章_InfoQ写作社区