当前位置: 首页 > news >正文

网站建设通知书pc端网站开发技术

网站建设通知书,pc端网站开发技术,网站建设中 即将上线html5源代码,成都有什么互联网公司terms aggregation 即词项分桶聚合。它是 Elasticsearch 最常用的聚合#xff0c;类同于关系型数据库依据关键字段做 group。 size#xff1a;返回的词项分桶数量#xff0c;默认 10。阈值 65535。默认情况下#xff0c;协调节点向每个分片请求 top size 数量的词项桶类同于关系型数据库依据关键字段做 group。 size返回的词项分桶数量默认 10。阈值 65535。默认情况下协调节点向每个分片请求 top size 数量的词项桶并且在所有分片都响应后将结果进行缩减并返回给客户端。如果实际词项桶的数量大于 size则返回的词项桶可能会存在偏差并且不准确。 shard_size每个分片返回的词项分桶数量默认为 size * 1.5 10。shard_size 越大结果越准确但是最终计算结果的成本也越高每个分片上的优先级队列会更大并且节点与客户端之间的数据传输量也更大。shard_size  不能比 size 小否则 Elasticsearch 会覆盖该属性值将其设置为和 size 一样的值。 min_doc_count限制返回的词项分桶中对应文档的命中数量必须满足的最小值默认 1。 shard_min_doc_count限制每个分片返回的词项分桶中对应文档的命中数量必须满足的最小值默认 0。必须小于 min_doc_count。建议为 min_doc_count / 分片数。 show_term_doc_count_error显示词项分桶统计数据的错误信息默认 false。用来显示聚合返回的每个词项的错误值错误值表示文档计数在最差情况下的错误。这个错误值在决定 shard_size 参数值时非常有用。 order指定排序规则。默认按照 doc_count 逆序排序。 missing指定字段的值不存在时给予文档的缺省值。默认会忽略。 修改返回的词项分桶的数量的阈值。 PUT _cluster/settings {transient: {search.max_buckets: 10} }查询航班目的地最多的 Top 10 国家。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10}}} }结果输出如下 {took : 38,timed_out : false,_shards : {total : 1,successful : 1,skipped : 0,failed : 0},hits : {total : {value : 10000,relation : gte},max_score : null,hits : [ ]},aggregations : {DestCountry : {doc_count_error_upper_bound : 0,sum_other_doc_count : 3187,buckets : [{key : IT,doc_count : 2371},{key : US,doc_count : 1987},{key : CN,doc_count : 1096},{key : CA,doc_count : 944},{key : JP,doc_count : 774},{key : RU,doc_count : 739},{key : CH,doc_count : 691},{key : GB,doc_count : 449},{key : AU,doc_count : 416},{key : PL,doc_count : 405}]}} }词项分桶聚合返回的 doc_count 值是近似的。可以使用参考如下两个指标来判断 doc_count 值是否是准确的。 sum_other_doc_count查询结果中没有出现的所有词项的文档总数。 doc_count_error_upper_bound查询结果中没有出现的词项的最大可能文档数。它的值是所有分片返回的最后一个词项的文档数量的和。当 show_term_doc_count_error 参数设置为 true可以查看每个词项对应的文档数量的误差。这些误差只有当聚合结果按照文档数降序排序时才会被统计。此外如果按照词项值本身排序、按照文档数升序或者按照子聚合结果排序都无法统计误差doc_count_error_upper_bound 会返回 -1。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true}}} }结果输出如下 {took : 5,timed_out : false,_shards : {total : 1,successful : 1,skipped : 0,failed : 0},hits : {total : {value : 10000,relation : gte},max_score : null,hits : [ ]},aggregations : {DestCountry : {doc_count_error_upper_bound : 0,sum_other_doc_count : 3187,buckets : [{key : IT,doc_count : 2371,doc_count_error_upper_bound : 0},{key : US,doc_count : 1987,doc_count_error_upper_bound : 0},{key : CN,doc_count : 1096,doc_count_error_upper_bound : 0},{key : CA,doc_count : 944,doc_count_error_upper_bound : 0},{key : JP,doc_count : 774,doc_count_error_upper_bound : 0},{key : RU,doc_count : 739,doc_count_error_upper_bound : 0},{key : CH,doc_count : 691,doc_count_error_upper_bound : 0},{key : GB,doc_count : 449,doc_count_error_upper_bound : 0},{key : AU,doc_count : 416,doc_count_error_upper_bound : 0},{key : PL,doc_count : 405,doc_count_error_upper_bound : 0}]}} }排序 默认按照 doc_count 逆序排序。不推荐按照 doc_count 升序排序或者在子聚合中排序这会增加统计文档数量的错误。但是如果在单一分片或者聚合使用的字段在索引时用做路由键这两种情况下却是准确的。 _count按照数量排序默认的排序方式。 _key按照词项排序。 _term 按照词项排序。 按照文档数量的升序排序。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true,order: {_count: asc}}}} }按照 key 的字母顺序升序排序。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true,order: {_key: asc}}}} }查询航班飞行最短的 Top 10 国家。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,order: {min_FlightTimeMin: desc}},aggs: {min_FlightTimeMin: {min: {field: FlightTimeMin}}}}} }GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,order: {stats_FlightTimeMin.max: desc}},aggs: {stats_FlightTimeMin: {stats: {field: FlightTimeMin}}}}} }词项嵌套分桶 嵌套深度建议不要超过三层。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true},aggs: {OriginCountry: {terms: {field: OriginCountry,size: 10}}}}} }脚本方式 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {script: {source: doc[DestCountry].value -DEMO;,lang: painless},size: 10}}} }结果输出如下 {took : 56,timed_out : false,_shards : {total : 1,successful : 1,skipped : 0,failed : 0},hits : {total : {value : 10000,relation : gte},max_score : null,hits : [ ]},aggregations : {DestCountry : {doc_count_error_upper_bound : 0,sum_other_doc_count : 3187,buckets : [{key : IT-DEMO,doc_count : 2371},{key : US-DEMO,doc_count : 1987},{key : CN-DEMO,doc_count : 1096},{key : CA-DEMO,doc_count : 944},{key : JP-DEMO,doc_count : 774},{key : RU-DEMO,doc_count : 739},{key : CH-DEMO,doc_count : 691},{key : GB-DEMO,doc_count : 449},{key : AU-DEMO,doc_count : 416},{key : PL-DEMO,doc_count : 405}]}} }词项分桶键值过滤 支持精确键值过滤与模糊匹配方式通过正则表达式过滤。个人发现 Elasticsearch 7.14 版本模糊匹配方式实际操作中不生效。 include包括指定的词项分桶值。exclude不包括指定的词项分桶值。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true,include: [US, IT, CN]}}} }结果输出如下 {took : 2,timed_out : false,_shards : {total : 1,successful : 1,skipped : 0,failed : 0},hits : {total : {value : 10000,relation : gte},max_score : null,hits : [ ]},aggregations : {DestCountry : {doc_count_error_upper_bound : 0,sum_other_doc_count : 0,buckets : [{key : IT,doc_count : 2371,doc_count_error_upper_bound : 0},{key : US,doc_count : 1987,doc_count_error_upper_bound : 0},{key : CN,doc_count : 1096,doc_count_error_upper_bound : 0}]}} }词项分桶分区聚合 很多时候需要统计的分桶数量太多导致一次运行很慢。可以借助分区机制在客户端进行合并。对所有可能的分桶进行分区。 partition分区编号。从 0 开始。 num_partitions分区数量。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true,include: {partition: 2,num_partitions: 5}}}} }个人在实际操作中发现每次调整 partition的值返回的桶的数量可能会不同。比如partition设置为2结果返回8个桶parition设置为1结果返回6个桶 词项分桶统计收集模型 collect_mode词项分桶统计收集模型。 depth_first默认值深度优先。适用于分桶数据量小的分桶比较固定的建议 10000 以内。breadth_first广度优先。适用于分桶数据量大的。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true,collect_mode: depth_first}}} }词项分桶存储选择 execution_hint词项分桶临时存储设置。 map使用 map 结构。适用于少量分桶的聚合统计。global_ordinals默认值使用全局序号结构。适用于大量分桶的聚合统计。 GET kibana_sample_data_flights/_search {size: 0,aggs: {DestCountry: {terms: {field: DestCountry,size: 10,show_term_doc_count_error: true,execution_hint: map}}} }提前加载全局序号 Elasticsearch 在使用全局序号时第一次需要从 doc_values 读取所有值来构建全局序号。可以设置提前加载到内存中避免查询响应慢。 eager_global_ordinals设置 true提前加载并构建全局序号。 PUT my-index-000001/_mapping {properties: {tags: {type: keyword,eager_global_ordinals: true}} }指标聚合进行子聚合 stats 指标聚合作为子聚合。 GET kibana_sample_data_ecommerce/_search {size: 0,aggs: {city_name: {terms: {field: geoip.city_name,size: 10},aggs: {taxful_total_price: {stats: {field: taxful_total_price}}}}} }top_hits 指标聚合作为子聚合。 GET kibana_sample_data_ecommerce/_search {size: 0,aggs: {aggs_customer_id: {terms: {field: customer_id,size: 10},aggs: {top_hits: {top_hits: {size: 2, _source: {includes: [customer_id, order_date, products]},sort: [{order_date: {order: desc}} ]}}}}} }top_metrics 指标聚合作为子聚合。 GET kibana_sample_data_ecommerce/_search {size: 0, aggs: {aggs_customer_id: {terms: {field: customer_id,size: 2},aggs: {top_metrics_total_price: {top_metrics: {metrics: {field: taxful_total_price},sort: {order_date: desc},size: 1}}}}} }
http://www.dnsts.com.cn/news/254645.html

相关文章:

  • 一站多通怎么做网站湘潭网站建设厦门网站制作
  • 网站打开有声音是怎么做的wordpress数据库批量替换网址
  • 做网站的公司好坑啊seo优化按天扣费
  • 做网站应该会什么问题新世纪建设集团网站
  • 自己做的网站只能打开一个链接工程建设网最新信息网站
  • 营销型网站建设方案网站建设公司 网络服务
  • 网站建设方案内容作文网址有哪些
  • 专业网站优化案例软件开发公司专业的有哪些
  • 网站开发专业分析wordpress判断用户权限
  • wordpress域名改了wordpress 优化提速
  • 大连做网站哪里好怎么介绍自己的网页设计
  • 网站给挂黑链中英文切换网站开发
  • 动漫网站设计电脑端游排行榜前十名网络游戏
  • 青岛学网站建设的大学博物馆建设网站
  • 简单公司网站源码西安有什么好玩的景点推荐
  • 广东省网站备案查询wordpress search页面
  • 做华为网站的还有哪些功能wordpress搬家 500
  • 做校服的网站自己做的网站怎么放上网
  • 点点站长工具现在网站建站的主流语言是什么
  • 学校网站制作方案开发一个app要多少费用
  • 城市联盟网站怎么做苏州好的做网站的公司哪家好
  • 成品网站免费网站下载今天的新闻有哪些
  • 查企业网站创建好网站如何把浏览
  • 江苏住房和城乡建设网站佛山淘宝设计网站设计价格
  • 网站子域名什么意思上位机软件开发培训
  • 福州优化网站建设网页制作模板html
  • 微网站 建设方案企业所得税优惠政策
  • 织梦wap网站模板东道设计应届生收入
  • 淘宝网站设计分析qq登录网页手机版
  • 网站建设加排名要多少余姚公司做网站