当前位置: 首页 > news >正文

群晖搭建企业网站怎么在自己电脑上做网站

群晖搭建企业网站,怎么在自己电脑上做网站,网站建设五年发展规划,wordpress云主机模板由于流量红利逐渐消退#xff0c;越来越多的广告企业和从业者开始探索精细化营销的新路径#xff0c;取代以往的全流量、粗放式的广告轰炸。精细化营销意味着要在数以亿计的人群中优选出那些最具潜力的目标受众#xff0c;这无疑对提供基础引擎支持的数据仓库能力#xff0… 由于流量红利逐渐消退越来越多的广告企业和从业者开始探索精细化营销的新路径取代以往的全流量、粗放式的广告轰炸。精细化营销意味着要在数以亿计的人群中优选出那些最具潜力的目标受众这无疑对提供基础引擎支持的数据仓库能力提出了极大的技术挑战。 本篇内容将聚焦字节跳动OLAP引擎技术和落地经验以字节跳动内部场景为例具体拆解广告业务的实现逻辑和业务效果。 广告精准投放场景 广告投放过程一般包含数据收集-数据整合-人群圈选-广告投放-反馈分析等关键流程人群圈选是广告精准投放的关键步骤它帮助确定广告目标受众辅助投放平台根据不同受众和广告目标优化投放策略提升广告收益 人群预估 人群预估主要是根据一定的圈选条件确认命中的用户数目。在广告精准投放过程中广告主需要知道当前选定的人群组合中大概会有多少人用于辅助判断投放情况进而确定投放预算通常要求计算时间不能超过 5 秒。 广告投放 广告精准投放过程中遇到的问题与痛点 1. 数据预估 广告主需要对选定的人群组合进行预估以便判断投放情况并确定投放预算。但人群包数据量多基数大。平台的用户数上亿仅抖音的 DAU 就几亿抖音、头条对应的人群包在亿级别早期的预估版本采用ElasticSearch但由于数据过于庞大只能采用1/10抽样存储导致10%的误差业务难以接受。 2. 查询性能 广告主可以设定一个非常复杂的圈选条件导致计算复杂单次计算可能包含几百上千个人群包Hive和ES等方案在处理大数据量时查询速度会变得非常慢如果需要查询某个广告主的所有用户需要扫描整个用户库而这个过程可能需要几分钟甚至几个小时无法满足实时性要求。 3. 存储空间大 Hive和ES等方案需要额外的索引结构导致存储空间变大从而增加了存储成本。例如如果需要对用户属性进行索引就需要额外的存储空间来存储索引数据。 4. 不支持高并发 Hive和ES等方案在处理高并发请求时容易出现性能问题无法支持高效的广告投放。例如如果同时有多个广告主需要查询用户信息就可能会出现查询阻塞或响应延迟等问题。 5. 数据查询效率 采用ClickHouse支持预估但随着数据量的增长ClickHouse在当前存储引擎的支持下也难以保证查询时间。这导致了数据查询效率的问题影响了用户体验。 ByteHouse BitEngine方案 方案简介 新查询引擎 基于高性能、分布式特点ClickHouse可以满足大规模数据的分析和查询需求因此研发团队以开源ClickHouse为基础研发出火山引擎云原生数据仓库ByteHouse并在其中定制一套处理模型——BitEngine用于解决集合的交并补计算在实时分析场景中的性能提升问题。针对广告人群预估业务开发的新查询引擎基于ByteHouse提供的MergeTree Family系列引擎添加了新的bitmap64类型和一系列的相关聚合函数。BitEngine提供的bitmap64类型适合存储和计算大量的用户ID之间的关系在广告人群预估业务中bitmap64类型用于存储人群包数据然后将人群包之间的交并补计算转化为bitmap之间的交并补从而达到远超普通查询的性能指标。 实现步骤 创建一个bitmap64类型可以将用户ID直接存储在bitmap中提供一系列交并补的聚合计算并且还希望可以充分利用多核CPU的并行计算能力由此我们设计了BitEngine。示例如下 CREATE TABLE cdp.tag_uids_map ( tags String, uids BitMap64 BitEngineEncode )ENGINE  HaMergeTree(/clickhouse/xxxx/{shard}, {replica}) ORDER BY tag tag_uids_map存储格式如下 taguidsA{10001,20001,30001,40001,50001,60001,70001,80001,90001}B{10001,20001,20002,20003,20004,20005,20006,20007,20008} 要查询 AB 的结果 SQL 为 SELECT bitmapCount(AB) FROM tag_uids_map BitEngine实现逻辑 核心思想 对数据做分区划分和编码保证每个区间的数据之间不存在交集然后使用roaring bitmap保存数据计算时每个分区的数据可以独立的做聚合计算充分利用机器的并行能力每个分区内部的聚合计算就是多个bitmap之间的交并补利用roaring bitmap高效的交并补计算降低CPU和内存的使用通过字典将编码的结果反解回来数据编码是为了让数据的分布尽可能稠密roaring bitmap在存储和计算的时候就可以获得更好的性能。 业务应用 业务关键要素 人群包广告主自定义规则计算出来的人群数据标签是dmp团队根据市场需求定义的人群数据。标签ID每天定时根据产出规则更新一次人群ID是自增的每天根据广告主需求进行新建计算。 统一编码 为了对标签数据和人群数据的uid统一编码编码服务先将标签数据中的uid和人群数据中的uid提取出来进行统一编码将全量uid均匀hash到一万个桶中桶编号为i[0i9999]uid在每个桶内由1开始顺序编码每个桶的范围为i*2^40 - (i1)*2^40。uid数据每天都在增加因此需要支持增量编码 编码服务每天会先获取增量uidhash后顺序放置到每个桶中。 数据存储 完成编码后会先把字典数据统一写入hive表中便于字典的各种使用场景。在数据经过分区和编码之后ClickHouse可以以多种数据导入格式将数据以bitmap64类型存入磁盘。 数据计算 BitEngine如何充分利用计算机的并行能力完成每个分区多个bitmap之间的交并补计算 存在问题 假设存在四个bitmap分别为abcd则(a | c) (b | d)不一定等于(a b) | (c d)。 人群包 人群包A [10001, 20001300014000150001]人群包B [10001, 20001200022000320004] 期望结果 通过BitEngine计算AB [10001, 20001] 设计方案 人群包按照一定的规则划分为多个区间任意两个区间之间的人群包没有交集一个计算线程只读取同一个区间的人群包进行计算得到一个中间结果最终的中间结果只需要简单的进行bitmap or计算即可 对于这个设计BitEngine需要保证数据的读取和计算是严格按照区间进行。BitEngine在数据读取时会为每一个文件构建一个读任务由一个线程调度模块完成整个任务的调度和读取这个线程调度模块的调度原则是 不同分区的文件不会交叉读取ClickHouse的文件读取粒度小于文件粒度会存在多个线程先后读一个文件的情况一个分区也可能由多个文件组成即一个线程只会读A_1B_1不会在这之间读取A_2或者B_2。一个分区读取完成后可以立即触发聚合计算执行bitmap之间的计算逻辑获得中间结果。即A_1B_1 读取完成后可以立即计算A_1 B_1。线程计算完中间结果后可以继续读其他文件 BitEngine完成所有中间结果的计算后会按照结果的输出要求做一次数据合并 如果需要计算的结果是bitmap的基数的时候BitEngine直接将各个中间结果的基数相加如果计算结果需要的是bitmapBitEngine直接将所有的bitmap合并起来这里合并指的是bitmap or计算 业务效果 广告业务效果 数据存储空间缩小了 3 倍导入时间缩小了 3 倍查询 avg/pct99/max 都下降明显pct99 从 5 s 降低到 2 sCPU 使用下降明显PageCache 节省 100 G查询误差从10% 下降到 0% BitEngine上线前后查询耗时监控 BitEngine上线后CPU负载对比 PageCache 使用情况lower is better) 案例总结 BitEngine上线使用后经过大量调优在广告人群预估业务上取得了良好收益。目前BitEngine已经集成在火山引擎云原生数据仓库ByteHouse中对外输出。火山引擎ByteHouse主要为用户提供极速分析体验能够支撑实时数据分析和海量数据离线分析具备便捷的弹性扩缩容能力极致分析性能和丰富的企业级特性目前已经与中国地震台网中心、海王集团、莉莉丝游戏、极客邦科技等诸多行业企业达成合作深度助力各个行业数字化转型。未来BitEngine将继续增强功能以支撑广告业务场景包括引擎集成数据编码使编码对用户透明提供细粒度的缓存以缓存部分重复表达式的计算结果优化表达式解析等。
http://www.dnsts.com.cn/news/200421.html

相关文章:

  • 网站标题一样深圳高端网站定制设计
  • 网页制作自学杭州网站优化培训
  • 茂名住房和城乡建设厅网站北京专业英文网站建设
  • 广东专业高端网站建设移动端网站模板怎么做的
  • 创建网站大约多少钱2018天河区进一步
  • 最优的网站建设推广wordpress添加自定义字段面板
  • 宁波网站建设设计制作八大建筑央企排名
  • 旅游网站开发书籍wordpress 输出豆瓣
  • 哈尔滨网站开发工作室网站地址查询ip
  • 淘宝联盟 网站备案官网的网站设计公司
  • 信誉好的邢台做网站网站条形码如何做
  • 廊坊企业网站建设那个网站可以做双色球号码对比的
  • 外贸网站建设.cover网站开发 php python
  • 郑州网站建设douyanet赣州门户网站建设
  • 宁波公司建设网站网站开发的基本语言
  • 洪梅做网站简历模板文档
  • 网站界面设计要求网站设计需要那些人
  • 做企业信用贷的网站计算机专业学做网站吗
  • 个人做电商网站较好网站建设公司
  • 想做棋牌网站怎么做卡盟网站怎么做图片素材
  • 贵阳网站制作系统成都企业网站备案流程
  • 淘宝网店网站建设目的中国陕西省住房城乡建设厅官网
  • 海西电子商务网站建设网站建设方案是什么意思
  • 公明网站制作网站建设运营费用
  • 网站建设中两个月了宁波建设监理管理协会网站
  • 织梦 网站栏目管理 很慢常见的简单的设计云平台
  • 优化网站的步骤案列全响应网站
  • 设备管理系统网站模板抖音logo在线设计生成器免费
  • 直接IP做网站wordpress鼠标特效
  • 辽宁自助网站建设公司网站多快能收录seo