当前位置: 首页 > news >正文

图片做动画网站厦门建设管理局网站

图片做动画网站,厦门建设管理局网站,设计了网站首页,wordpress搜索页Elasticsearch 分析器的高级用法一#xff08;同义词#xff0c;高亮搜索#xff09; 同义词简介分析使用同义词案例 高亮搜索高亮搜索策略unifiedplainvh 同义词 简介 在搜索场景中#xff0c;同义词用来处理不同的查询词#xff0c;有可能是想表达相同的搜索目标。 例… Elasticsearch 分析器的高级用法一同义词高亮搜索 同义词简介分析使用同义词案例 高亮搜索高亮搜索策略unifiedplainvh 同义词 简介 在搜索场景中同义词用来处理不同的查询词有可能是想表达相同的搜索目标。 例如查询“北京大学”和“北大”时其实时想搜索同一个内容。 在ES内置的分词过滤器中有两个同义词分词过滤器synonym 和 synonym_graph 官网 synonym: https://www.elastic.co/guide/en/elasticsearch/reference/7.10/analysis-synonym-tokenfilter.html synonym_graph: https://www.elastic.co/guide/en/elasticsearch/reference/7.10/analysis-synonym-graph-tokenfilter.html synonym_graph 相对于 synonym 对于多词同义词有更精确的效果 官方建议在索引时使用 synonym 在 查询时 使用 synonym_graph 分析使用 可以借助同义词过滤器实现 同义词分析器 指定同义词内容有两种方式 直接通过synonyms 指定同义词用 , 分割 # synonym POST _analyze {tokenizer: ik_smart,filter: {type: synonym,synonyms: [北京大学, 北大]},text: 北京大学 }通过文件方式指定 同义词 在 es/config 目录下 创建文件 analysis/synonym.txt 在 synonym.txt 中编辑同义词内容 # 通过文件方式指定同义词 POST _analyze {tokenizer: ik_smart,filter: {type: synonym,synonyms_path: analysis/synonym.txt},text: 北京大学 }上述两种请求方式结果相同如下 从结果可以看出北京大学 和 北大 都被当做同义词分析。 同义词案例 案例要求通过大学简称或全称都能搜索到对应大学的内容 创建大学索引 # 创建一个索引 # 包含一个text字段索引分析器为 ik_smart # 搜索分析器为自定义的 同义词分析器同义词内容在analysis/synonym.txt 中 # updateable: true 表示允许动态修改同义词 PUT /college {settings: {index: {analysis: {analyzer: {my_synonyms: {tokenizer: ik_smart,filter: [ synonym ]}},filter: {synonym: {type: synonym_graph,synonyms_path: analysis/synonym.txt, updateable: true }}}}},mappings: {properties: {name: {type: text,analyzer: ik_smart,search_analyzer: my_synonyms }}} }指定同义词 在 analysis/synonym.txt 文件中 写入同义词 ”北京大学北大“ 初始化数据 POST /college/_bulk {index:{}} {content:北大国内最高学府} {index:{}} {content:北外中华人民共和国教育部直属的全国重点大学211}测试搜索 GET /college/_search {query: {match: {content: 北京大学}} } 修改同义词文件 上述同义词文件中没有指定 北外 和 北京外国语。所以直接搜索北京外国语大学是没有结果的。 这时我们需要动态的添加新的 同义词。 ES官方提供了 修改分析器资源的 API POST /{index}/_reload_search_analyzers 并要求必须指定updateable: true 我在创建索引时 已经指定了 updateable: true这里可以直接修改 synonym.txt 文件 a. 添加 同义词 echo 北京外国语大学,北外,北京外国语 synonym.txtb. 发送请求 重新加载分析器资源 POST /college/_reload_search_analyzers测试搜索 GET /college/_search {query: {match: {content: 北京外国语大学}} }高亮搜索 “高亮显示”的英文为highlight是指在搜索结果中通过对文档标题的部分匹配字符串进行颜色(如红色)或者字体(如加粗)等处理在视觉呈现上使匹配的字符串与未匹配的字符串有明显的区分效果。 ES 提供了高亮搜索功能 下面搜索content 字段并对搜索内容进行高亮显示 PUT /light {mappings: {properties: {content:{type:text}}} }POST /light/_bulk {index:{}} {content:北京大学国内最高学府,211,985} {index:{}} {content:北京中国首都帝都}GET /light/_search {_source: content,query: {match: {content: 北京}},highlight: {fields: {content: {// 设定 高亮搜索策略默认是unifiedtype:plain,// 设定 高亮标签默认是em/empre_tags: hight,post_tags: /hight}}} }高亮搜索策略 ES支持的高亮显示搜索策略有plain、unified和fvh用户可以根据搜索场景进行选择。 unified 默认策略 unified策略是由Lucene Unified Highlighter来实现的其使用BM25(Best Match25)算法进行匹配 plain plain是精准度比较高的策略因此它必须将文档全部加载到内存中并重新执行查询分析。由此可见plain策略在处理大量文档或者大文本的索引进行多字段高亮显示搜索时耗费的资源比较严重。因此plain策略适合在单个字段上进行简单的高亮显示搜索。 vh 为了弥补上述两种策略在大文本索引高亮显示搜索时的速度低问题Lucene还提供了基于向量的高亮显示搜索策略fvh(fast vector highlighter)。fvh策略更适合在文档中包含大字段的情况(如超过1MB)下使用如果计算机的I/O性能更好(如使用SSD)则fvh策略在速度上的优势更加明显。 如果要使用fvh策略进行高亮显示搜索需要设定字段的 term_vector属性值为with positions offsets。
http://www.dnsts.com.cn/news/231734.html

相关文章:

  • 炫酷手机网站模板模板网站如何做优化
  • 做响应式网站用什么框架做的好的电商网站项目
  • 安阳市网站建设的公司jcms内容管理系统
  • 网站后台如何更换在线qq咨询代码wordpress 手机站目录
  • 重庆做网站需要多少钱wordpress拼图
  • 网站百度指数扬州做企业网站
  • 东莞网站建设排名 南城wordpress提请审批
  • 手机可以做网站服务器吗wordpress正计时代码
  • 网站厨师短期培训班wordpress登录无反应
  • asp.net做网站系统网站ftp
  • 做玻璃瓶的网站网站运营方案ppt
  • 佛山住房和城乡建设部网站官网手机摄影网站首页
  • 网站没收录可以做排名中国建设局网站首页
  • 百度关键词查询网站网站建设毕业设计中期报告
  • 建设网站策划dw做网站教程视频
  • 东莞网站到首页排名搜索历史记录
  • 用canvas做网站建立企业官网
  • 瑶海合肥网站建设海珠区手机版网站建设
  • 新吴区推荐做网站价格百度关键词怎么排名
  • 阿里云服务器网站建设微信公众号开店流程
  • 青岛网站建设-中国互联百度入口官网
  • 海外网站如何做用户实名认证王老吉网站建设水平优点
  • 中小型企业网站建设与管理请举例说明什么是网络营销
  • 南通市港闸区城乡建设局网站线上广告投放渠道
  • 建网站网络公司企业所得税法实施条例
  • asp.net网站开发pdf衡水哪家制作网站好
  • 苏州专业建站签名设计网站
  • 海外网站加速器下载学做电商网站
  • 新塘做网站公司天津搜索引擎推广
  • 公司网站设计制作搜狗官网