当前位置: 首页 > news >正文

网站开发 平均工资免费的网站搭建

网站开发 平均工资,免费的网站搭建,电子工程网注册,动漫制作专业的认知ElasticSearch 添加IK分词器 前言一、IK分词器的算法二、Ik分词器的下载安装#xff08;Winows 版本#xff09;三、Ik分词器的下载安装#xff08;Linux 版本#xff09;四、验证测试#xff08;postman工具#xff09;测试 ik_smart 分词算法测试 ik_max_word 分词算法… ElasticSearch 添加IK分词器 前言一、IK分词器的算法二、Ik分词器的下载安装Winows 版本三、Ik分词器的下载安装Linux 版本四、验证测试postman工具测试 ik_smart 分词算法测试 ik_max_word 分词算法扩展字典 前言 ElasticsearchES内置携带了多种类型的分词器而Standard Analyzer单字分词只是其中之一并且是默认使用的分词器。IK分词器是一个专门为中文文本设计的分词工具它不是ES的内置组件而是一个需要单独安装和配置的插件。在Elasticsearch中IK分词器和Standard Analyzer是并存的关系它们并不会互相排斥或覆盖。在Elasticsearch中当你在创建索引时为某个字段指定了特定的分词器比如中文分词器IK Analyzer那么这个分词器就会被应用于该字段的文本数据在后续的索引和查询过程中都会使用这个分词器来处理该字段的文本。 如果你没有为字段指定分词器Elasticsearch会使用该字段类型默认的分词器。对于文本text类型的字段默认的分词器通常是Standard Analyzer它适用于大多数英文文本的分词处理但不适用于中文等需要特殊分词处理的文本。 一、IK分词器的算法 IK提供了两个分词算法ik_smart和ik_max_word其中ik smart为最少切分ik_max_word为最细粒度划分! ik_max_word: 会将文本做最细粒度的拆分比如会将中华人民共和国国歌拆分为中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌会穷尽各种可能的组合 ik_smart: 会做最粗粒度的拆分比如会将中华人民共和国国歌拆分为中华人民共和国,国歌。 二、Ik分词器的下载安装Winows 版本 下载地址 https://github.com/medcl/elasticsearch-analysis-ik 注意IK分词器插件的版本要和ElasticSearch的版本一致 我这边是v7.15.2的 解压安装包到 ElasticSearch 所在文件夹中的plugins目录中 Windows 环境下 再启动ElasticSearch查看IK分词器插件是否安装成功 三、Ik分词器的下载安装Linux 版本 下载地址 https://github.com/medcl/elasticsearch-analysis-ik 注意IK分词器插件的版本要和ElasticSearch的版本一致 我这边是v7.15.2的 需要在plugins目录下创建ik分词器文件夹文件夹名称一定要命名为ik不然启动elasticsearch时候会报错的然后在把里面的东西解压放在这个ik下面如下 解压完ik分词器安装包后重启elasticsearch。 四、验证测试postman工具 使用postman工具校验 测试 ik_smart 分词算法 分词请求入参 请求 http://127.0.0.1:9200/_analyze入参 {analyzer: ik_smart,text: 海内存知己,天涯若比邻 }结果如下所示 测试 ik_max_word 分词算法 分词请求入参 请求 http://127.0.0.1:9200/_analyze入参 {analyzer: ik_max_word,text: 海内存知己,天涯若比邻 }结果如下所示 比较两个分词算法对同一句中文的分词结果ik_max_word比ik_smart得到的中文词更多从两者的英文名含义就可看出来但这样也带来一个问题使用ik_max_word会占用更多的存储空间。 扩展字典 从上面的举例来看我使用 ik_max_word 算法时分词里面没有“存知己”这个词如果我想加该怎么办这个时候就涉及了扩展字典的操作了。 第一步 在ik分词器文件的config目录中新建自定义的字典文件以.dic为后缀并在文件中加入“存知己” 第二步 然后打开 IKAnalyzer.cfg.xml 文件把自定义的字典添加到IK的字典中 第三步 重启ES再次测试就发现有了“存知己”这个词了 参考文章 【1】ElasticSearch——IK分词器的下载及使用 【2】Elasticsearch和Kibana版本对应关系 【3】ElasticSearch在linux环境中集成IK分词器
http://www.dnsts.com.cn/news/51983.html

相关文章:

  • 京东网站建设流程图wordpress 前台发布文章
  • 不用登录的小游戏网站网站推广效果不好原因是
  • 上海做企业网站的公司wordpress加cdn
  • 查询网站备案显示划横线wordpress抱歉您不能上传文件
  • 网站建设者属于广告经营者吗网站域名怎么填写
  • 品牌创建策划方案合肥专业网站优化费用
  • 网站空间 哪个速度快何鹏seo
  • 网站建设wlpeixun潍坊网站开发weifangwangluo
  • 做报纸能经常更新网站网站和服务器是什么
  • 打折网站运营思路seo常见优化技术
  • 阿里巴巴做网站费用做贵网站多少钱
  • 在58做网站推广有效果吗WordPress知更鸟破解版
  • 揭阳网站建设方案外包工程公司财务制度及流程
  • 没有做网站经验可以学seo吗南通做外贸网站
  • 武陟外贸英文网站建设汕头网站建设推广方法
  • 中国建设银行杭州分行网站seo综合查询可以关了吗
  • 网站建设工具 公司网站优化文章
  • 中介如何做网站收客怎么免费网站
  • 网站如何做360度全景做网站放太多视频
  • 企业电子商务网站有哪些功能网站制作价格东莞
  • 网站文章突然不收录dede如何手机网站和电脑网站的数据同步更新
  • 网站设计怎么自学网站推广工具网络
  • 重庆多语网站建设品牌企业wordpress主题公园下载
  • 上虞做网站公司小说小程序搭建
  • 红色扁平化网站h5网站建设哪家好
  • 网上哪个网站教做西点宝塔wordpress无法打开503
  • 做网站的是什么职业我市精神文明建设的门户网站
  • 湖北黄石域名注册网站建设如何导出WordPress主题
  • 东莞企业网站推广怎么做郴州建设信息网站
  • 响应式网站pad尺寸凤山县住房和城乡建设局网站