分词
0 人感兴趣 · 6 次引用
- 最新
- 推荐
ElasticSearch 拼音搜索自定义扩展插件 (长拼音序列)
当前的中文搜索引擎都支持拼音搜索,但是在使用过程中会出现各种各样的场景,当前的自定义插件,用来处理在拼音搜索过程中如果遇到长拼音序列的情况,应该如何进行处理。
中文分词的原理与方法及其在运维领域中的实践
# 技术黑板报 # 第八期,什么是中文分词,其原理与方法在智能运维中是如何应用的?本篇将带来详细解答
ES 终于可以搜到“悟空哥”了!
Elasticsearch 搜索引擎内置了很多种分词器,但是对中文分词不友好,所以我们需要借助第三方中文分词工具包。
使用 Python 和 SudachiPy 进行日语分词
需要对一些日文进行词频统计,其中主要的技术点就是日语分词。本文使用 Python 和 SudachiPy 库进行日语分词。