您的位置:首页 > 健康 > 美食 > ES升级--03-- IK分词器

ES升级--03-- IK分词器

2024/10/5 14:36:00 来源:https://blog.csdn.net/weixin_48052161/article/details/139761742  浏览:    关键词:ES升级--03-- IK分词器

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • IK分词器
    • 1. IK分词器 下载
        • https://github.com/infinilabs/analysis-ik/releases
    • 2. 创建文件夹 analysis-ik
    • 3.把zip包放至该目录下 解压
    • 4. 删除zip包
    • 5、重启Elasticsearch, 观察日志
  • 使用kibana测试
    • 1、细粒度的拆分
    • 2、粗粒度的拆分


IK分词器

elasticsearch默认提供了standard分词器,但对中文的分词效果不尽人意

1. IK分词器 下载

  • IK中文分词器-Github地址
https://github.com/infinilabs/analysis-ik/releases

在这里插入图片描述

2. 创建文件夹 analysis-ik

创建文件夹 analysis-ik,在/data/es/elasticsearch-7.9.1/plugins/下

3.把zip包放至该目录下 解压

在这里插入图片描述

unzip elasticsearch-analysis-ik-7.9.1.zip 

在这里插入图片描述

4. 删除zip包

rm -rf  elasticsearch-analysis-ik-7.9.1.zip 

5、重启Elasticsearch, 观察日志

在这里插入图片描述
在这里插入图片描述

使用kibana测试

IK提供两种分词算法:ik_smart 和 ik_max_word

  • ik_smart : 最粗粒度的拆分
  • ik_max_word : 最细粒度的拆分

1、细粒度的拆分

POST _analyze
{"analyzer": "ik_max_word","text": ["中华人民共和国万岁"]
}

在这里插入图片描述

2、粗粒度的拆分

POST _analyze
{"analyzer": "ik_smart","text": ["中华人民共和国万岁"]
}

在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com