当前位置: 首页 > news >正文

怎么把服务器做网站成都开网站

怎么把服务器做网站,成都开网站,wordpress15天教,加盟编程教育哪家好Havenask 是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎#xff0c;深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了 Havenask 分布式索引构建服务——Build Service#xff0c;主打稳定、快速、易管理#xff0c;是在线系… Havenask 是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了 Havenask 分布式索引构建服务——Build Service主打稳定、快速、易管理是在线系统提升竞争力的一大利器。 一、Havenask 介绍 Havenask 是阿里巴巴广泛使用的自研大规模分布式检索系统是过去十多年阿里在电商领域积累下来的核心竞争力产品广泛应用在搜推广和大数据检索等典型场景在 2022 年云栖大会-云计算加速开源创新论坛上完成开源首发同时作为阿里云开放搜索 OpenSearch 底层搜索引擎OpenSearch 自 2014 年商业化目前已有千余家外部客户。 下图展示了 Havenask 中一个完整的搜索服务在线系统、索引系统、管控系统、扩展插件且包括了查询流、数据流、控制流。其中索引系统负责索引数据生成的过程还包含有文档处理与本文的主角索引构建服务 Build Service。索引构建分为三个步骤对数据进行前置处理例如分词、向量计算等、产出索引、合并索引文件的处理。 Havenask 支持千亿级别数据实时检索、百万 QPS 查询百万 TPS 高时效性写入保障毫秒级查询延迟和数据更新并具有良好的分布式架构、极致的性能优化能够实现比现有技术方案更低的成本普惠更多的开发者和企业。 二、Build Service 简介 Build Service 是一个分布式索引构建服务用于 Havenask 中的全量表的索引构建。它可以对接本地存储、HDFS 等多种数据源快速的将原始数据构建成全量索引并以流式工作模式进行增量索引构建。Build Service 是 Havenask 读写分离架构的重要组成部分独立的索引构建服务使 Havenask 具有下面优势 在线系统更加稳定将索引构建从在线系统分离避免了索引构建对在线系统的影响使在线系统更加稳定。 索引构建更快特有的全量流程使全量数据导入更快独立的资源控制进一步提升索引构建速度。 多版本索引管理多版本独立的构建流程管理使索引重建更方便更安全。 三、Build Service 架构 Build Service 架构图 上图是 Build Service 的架构在 Build Service 中主要有下面几个角色 BS AdminBS Admin 负责整个集群的任务调度和资源管理。BS Admin 提供丰富的接口进行索引构建任务的启停资源的调整等BS Admin 接收到这些请求之后会进行任务的调度并配合调度系统调度任务的执行并维护任务的状态。 ProcessorProcessor 从数据源中拉取数据进行处理Processor 可以支持多种数据源比如 HDFS、OSS 等分布式文件系统也可以对接 Swift 消息中间件处理实时数据。在 Processor 中主要是对数据进行分词、简单的数据转换等处理开发者可以通过定制数据源 reader 插件和数据处理 DocumentProcessor 插件来扩展支持不同的数据源和数据处理逻辑。 BuilderBuilder 负责索引的构建它将经过 Processor 处理的数据按照 Schema 的配置构建成倒排、正排、摘要索引。Builder 与 Processor 的数据交互是通过 Swift 消息中间件来实现的即 Processor 将处理之后的数据写到 SwiftBuild 从 Swift 中读取这些数据进行索引构建。 MergerMerger 负责索引的定期整理定期索引整理使索引文件更加紧凑可以降低在线集群索引加载的内存开销提升检索性能。索引整理时会清理已经删除的数据将小的索引文件合并成大的索引文件也可以按照配置在整理时根据某个字段进行离线排序这样可以进一步提升检索性能。 在一个 Build Service 服务中可以有一个或者多个 BS Admin它们通过 ZK 进行 leader 选举只有 leader 才会管理整个 Build Service 服务其他 Admin 作为 fllower使服务更加稳定。一个 Build Service 服务可以同时管理多个表或者同一个表的不同版本的索引构建任务每个任务都是相互隔离的互不影响。每个索引构建任务都有各自的 Processor、Builder、Merger 节点进行数据的处理索引的构建。每个索引构建任务可以独立进行资源控制比如调整 Processor 节点的个数Builder 和 Meger 的并发度以及这些节点的 CPU 和内存等。 对于 Processor、Builer 和 Meger 节点它们只有分片Shard的概念没有备份的概念。比如对于 Processor每个分片处理不同的数据一个分片只会启动一个节点如果某些原因启动了多个节点多个节点之间通过 ZK 进行 leader 选举只有 leader 节点才会存活并工作非 leader 节点的进程会自动退出。Builder 和 Merger 的情况与 Processor 类似唯一不同的是分片数是在创建表时就确定的它们只能基于分片数据调节并发度因此 Builder 和 Meger 节点真实启动的个数是分片数乘以并发度。 四、索引构建流程 索引构建流程示意图 Build Service 的索引构建分为两个阶段全量索引构建和增量索引构建。每个索引构建任务都会先进行全量索引构建全量结束之后会自动切换到增量索引构建阶段增量索引构建任务会一直执行直至这次索引构建任务停止。全量索引构建任务会首先从分布式文件系统读取原始数据构建成索引如果没有配置这步会跳过全量文件处理完成之后会继续从 Swift 中读取数据继续构建全量索引。这样等全量流程结束之后全量索引中的数据已经通过消费 Swift 追到距离当前比较靠近的时间了索引切上线之后不会出现较长时间的时效性延迟。 无论是全量索引构建还是增量索引构建它们的索引构建流程是类似的。首先 Processor 节点会从数据源中包括 Swift读取原始数据然后对数据进行分词或者其他处理处理之后的数据会转发到 Swift 的中。Builder 和 Merger 的任务是交替执行的首先 Builder 从 Swift 中读取处理之后的数据构建成索引索引产出在分布式文件系统中。对于全量索引构建全量数据被全部构建为索引之后 Builder 就会结束对于增量索引构建Builder 接受 BS Admin 的调度将数据处理到某个时间点就会退出。Builder 结束之后Meger 节点就会执行Meger 会对构建的索引按照一定的策略进行整理整理好的索引也会写回分布式文件系统。 需要注意的是增量索引构建时Processor 处理之后的数据不仅仅供 Builder 消费在线的 Searcher 节点也会直接消费将其构建成实时索引。 五、Build Service 定制能力 为了满足不同业务的需求Build Service 在构建索引时支持下面三种定制能力分析器的定制、数据源插件的定制、数据处理插件的定制。开发者可以直接修改代码将定制逻辑与 Havenask 一起编译成一个 Binary 生效也可以建立单独的目录将其编译成动态库通过插件的方式生效。 分析器定制分析器主要用于对文档进行分词开发者可以通过定制分析器定制自己的分词逻辑分析器不仅会在构建索引时生效在查询时也会生效。 数据源插件定制Havenask 主要支持 HDFS、OSS、MaxCompute、Swift 等数据源如果要支持更多的数据源比如 kafka可以定制 Processor 的 Reader 插件。 数据处理定制数据在 Processor 中是由一个 DocumentProcessor 链进行处理的用户可以定制自己的 DocumentProcessor 处理类来扩展数据处理逻辑。 六、Build Service 与 Indexlib核心索引库的关系 Indexlib 是 Havenask 的核心索引库提供正排、倒排、摘要等索引的实现并在此基础上抽象出了各种表模型比如 normal 表、kv 等、kkv 表等。但是 Indexlib 无法独立提供索引构建服务必须通过 Build Service 才能进行索引构建。可以说Indexlib 提供了各种索引的定义并提供了索引构建的接口Build Service 定义了流式索引构建的框架两者相结合才使 Havenask 具有了强大的索引构建能力。 七、总结 Build Service 是一个流式的索引构建服务能够轻松完成海量数据的索引构建对在线系统没有任何影响极大提高了整个集群的稳定性。独立的索引构建任务管理可以方便、安全的对同一张表进行多次索引构建特别适用于智能搜索场景下需要定期索引重建的场景。当然Build Service 的引入也使得整个系统的架构更加复杂数据生效链路变长资源开销变大大家在使用时请根据业务情况认真选择。 Havenask 开源官网 https://havenask.net/ Havenask 开源项目地址 https://github.com/alibaba/havenask 阿里云 OpenSearch 官网 https://www.aliyun.com/product/opensearch
http://www.dnsts.com.cn/news/246311.html

相关文章:

  • 弄淘宝招牌图什么网站可以做网站建设开票多少个点
  • 网站设计师需要什么知识与技能wordpress百度时时推送
  • 查询网站有没有备案安阳千度网络有限公司
  • 网站建设与管理课程心得体会怎么用手机做刷会员网站
  • 网站服务器费用明细苏州企业网站制作多少钱
  • 用什么做网站方便友情链接英文翻译
  • 海淀网站建设价格微信公众号怎么做网页
  • 大连网站制作的网站开发专业术语大全
  • 石家庄网站平台网站设计用那个软件
  • 唐山做网站那家好网络营销企业培训
  • 网站可以做无形资产吗深圳营销型网站建设-龙华信科
  • 网站建站系统程序搜索引擎及门户网站介绍总结
  • 网上交易平台网站建设公司网站开发能怎么赚钱
  • 单页网站建设h5制作工具手机版
  • 上海网站制作公司shop++的发展历程
  • 陆良县住房和城乡建设局网站房产网签后能不能退房
  • 东莞网站建设优化东莞泰安企业网站seo
  • 爱途 中山网站制作张家港市凤凰镇建设局网站
  • 个人做地方门户网站wordpress发邮件收到不到邮件
  • 中国工程信息网站阿里云怎么购买域名
  • 重庆潼南网站建设公司电话湖南变电站公司中企动力技术支持网站建设
  • 如何做好公司网站建设海南网站建设小强
  • 望城门户网站制作视频软件哪个好
  • 百度品牌网站建设dede 中英文网站 怎么做
  • 网站正在建设中永久优秀网站设计参考
  • 建网站空间网站seo收录
  • 判断网站是什么系统做的微信小程序商城开发教程
  • 邮箱域名可以做网站吗做网站时搜索的代码是什么
  • 网站可以做参考文献吗wordpress 保持空格
  • 网站建设_app开发网页设计欣赏及点评