网易那个自己做游戏的网站是什么,电子商务建立网站前期准备,画册设计案例,佛山网站建设和维护概述
Elasticsearch多文档聚合检索
详细 记得把这几点描述好咯#xff1a;需求#xff08;要做什么#xff09; 代码实现过程 项目文件结构截图 演示效果 应用场景
我们需要在五种不同的文档中检索数据。 比如 商品#xff08;goods#xff09;、案例#xff08;ca…概述
Elasticsearch多文档聚合检索
详细 记得把这几点描述好咯需求要做什么 代码实现过程 项目文件结构截图 演示效果 应用场景
我们需要在五种不同的文档中检索数据。 比如 商品goods、案例cases、日记diaries、帖子posts、商家shops。 我们现在需要用关键字做全文检索但是命中结果需要包含每一类数据。 goods-如果关键字命中最多返回4条不命中返回0条。 cases、diaries、posts、shops 4类数据都遵循上诉规则就是每一类最多返回4条没有关键词命中则不返回。
1.分开检索每一类索引文档
为了赶工期由于业务场景中有单类索引检索的需求所以一开始我们重用了单索引的code直接在接口层聚合5类数据。但是这样我们搜索服务与应用服务的开销无疑是增大了很多。我们来看看接口调用 看到这儿是不是有些难受。这么多调用这么多并发只想说一句难受啊。是的我心里也很难受所以我们必须做出改变
2.一起来优化优化吧
不应该访问这么多服务我们知道ES是可以一次性检索多类文档。我们当然希望一次让ES返回我们所有的检索数据那当然是最好的。我们来看看简化后的流程 哟西好像简洁了很多
3.把任务一次性交给Elasticsearch
优化之后的请求少了服务的多次调用少了并发的开销我们把所有大部分任务一次性交给了SEsearch engine,通过SE的计算我们只需要一次调用服务就可以拿到想要的所有数据进行数据的分类封装就可以返回给客户端使用了。那么这个过程又发生了哪些变化呢在coding过程中用到了哪些知识呢下面我们一起来code share吧。
4.通过聚合函数平均返回值
要点 terms aggregation — Bucket aggregation topHints aggregation — Metrics aggregation
terms aggregation是Elasticsearch的Bucket aggregation,就是聚合桶topHints aggregation 是Elasticsearch Metrics aggregation ,指标聚合。 terms aggregation — 提供根据某个字段进行装桶可以认为是根据指定key进行分组。桶聚合的特点只能返回桶的数据。比如根据”_index”分组那我们聚合桶就只有_index的值而不能拿到命中的数据。 topHints aggregation — 返回排序靠前的数据值得注意的是支持返回最大的size 是 200。指标聚合会根据桶内的数据进行指标计算。topHint 可以让我们拿到命中的数据。 说明在这里介绍下metrics aggregation 、Bucket Aggregation的区别。metrics Aggregation 是对聚合数据的计算。Bucket Aggregation 用于对数据进行分组。往往我们在业务实现中DSL中是需要有多种类型的aggregation的。 根据topHints aggregation 的特点我们利用这样的方法检索每类数据返回结果是不能超过200条的
5.code share
核心代码 **aggregationBuilder 语义说明
1.创建名称为 “index-group”的terms bucket 2.然后在每个terms bucket中创建名称为”details”的 topHints aggregation的子聚合。 3.子聚合中根据”_score”(命中分数)进行排序。
项目结构补充