当前位置: 首页 > news >正文

兰州哪里做网站友情下载网站

兰州哪里做网站,友情下载网站,做网站一台电脑可以吗,手机网站域名怎么解析湖仓一体#xff08;Data Lakehouse#xff09;融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势#xff0c;帮助用户更加便捷地满足各种数据处理分析的需求。在过去多个版本中#xff0c;Apache Doris 持续加深与数据湖的融合#xff0c;已演进出一套成熟…湖仓一体Data Lakehouse融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势帮助用户更加便捷地满足各种数据处理分析的需求。在过去多个版本中Apache Doris 持续加深与数据湖的融合已演进出一套成熟的湖仓一体解决方案。 为便于用户快速入门我们将通过系列文章介绍 Apache Doris 与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南包括 Hudi、Iceberg、Paimon、OSS、Delta Lake、Kudu、BigQuery 等。目前我们已经发布了 Apache Doris Apache Hudi 快速搭建指南Lakehouse 使用手册一通过此文你可了解到在 Docker 环境下如何快速搭建 Apache Doris Apache Hudi 的测试及演示环境。 本文我们将再续前言为大家介绍 Lakehouse 使用手册二之 Apache Doris Apache Paimon 搭建指南。 Apache Doris Apache Paimon Apache Paimon 是一种数据湖格式并创新性地将数据湖格式和 LSM 结构的优势相结合成功将高效的实时流更新能力引入数据湖架构中这使得 Paimon 能够实现数据的高效管理和实时分析为构建实时湖仓架构提供了强大的支撑。 为了充分发挥 Paimon 的能力提高对 Paimon 数据的查询效率Apache Doris 对 Paimon 的多项最新特性提供了原生支持 支持 Hive Metastore、FileSystem 等多种类型的 Paimon Catalog。原生支持 Paimon 0.6 版本发布的 Primary Key Table Read Optimized 功能。原生支持 Paimon 0.8 版本发布的 Primary Key Table Deletion Vector 功能。 基于 Apache Doris 的高性能查询引擎和 Apache Paimon 高效的实时流更新能力用户可以实现 数据实时入湖 借助 Paimon 的 LSM-Tree 模型数据入湖的时效性可以降低到分钟级同时Paimon 支持包括聚合、去重、部分列更新在内的多种数据更新能力使得数据流动更加灵活高效。高性能数据处理分析 Paimon 所提供的 Append Only Table、Read Optimized、Deletion Vector 等技术可与 Doris 强大的查询引擎对接实现湖上数据的快速查询及分析响应。 未来 Apache Doris 将会逐步支持包括 Time Travel、增量数据读取在内的 Apache Paimon 更多高级特性共同构建统一、高性能、实时的湖仓平台。 本文将会再 Docker 环境中为读者讲解如何快速搭建 Apache Doris Apache Paimon 测试 演示环境并展示各功能的使用操作。 使用指南 本文涉及脚本代码从该地址获取https://github.com/apache/doris/tree/master/samples/datalake/iceberg_and_paimon 01 环境准备 本文示例采用 Docker Compose 部署组件及版本号如下 Apache Doris 2.1.5 为全新发布 下载地址 Release Notes 02 环境部署 1. 启动所有组件 bash ./start_all.sh2. 启动后可以使用如下脚本登陆 Flink 命令行或 Doris 命令行 bash ./start_flink_client.sh bash ./start_doris_client.sh03 数据准备 首先登陆 Flink 命令行后可以看到一张预构建的表。表中已经包含一些数据我们可以通过 Flink SQL 进行查看。 Flink SQL use paimon.db_paimon; [INFO] Execute statement succeed.Flink SQL show tables; ------------ | table name | ------------ | customer | ------------ 1 row in setFlink SQL show create table customer; ------------------------------------------------------------------------ | result | ------------------------------------------------------------------------ | CREATE TABLE paimon.db_paimon.customer (c_custkey INT NOT NULL,c_name VARCHAR(25),c_address VARCHAR(40),c_nationkey INT NOT NULL,c_phone CHAR(15),c_acctbal DECIMAL(12, 2),c_mktsegment CHAR(10),c_comment VARCHAR(117),CONSTRAINT PK_c_custkey_c_nationkey PRIMARY KEY (c_custkey, c_nationkey) NOT ENFORCED ) PARTITIONED BY (c_nationkey) WITH (bucket 1,path s3://warehouse/wh/db_paimon.db/customer,deletion-vectors.enabled true )| ------------------------------------------------------------------------- 1 row in setFlink SQL desc customer; ------------------------------------------------------------------------------------- | name | type | null | key | extras | watermark | ------------------------------------------------------------------------------------- | c_custkey | INT | FALSE | PRI(c_custkey, c_nationkey) | | | | c_name | VARCHAR(25) | TRUE | | | | | c_address | VARCHAR(40) | TRUE | | | | | c_nationkey | INT | FALSE | PRI(c_custkey, c_nationkey) | | | | c_phone | CHAR(15) | TRUE | | | | | c_acctbal | DECIMAL(12, 2) | TRUE | | | | | c_mktsegment | CHAR(10) | TRUE | | | | | c_comment | VARCHAR(117) | TRUE | | | | ------------------------------------------------------------------------------------- 8 rows in setFlink SQL select * from customer order by c_custkey limit 4; ------------------------------------------------------------------------------------------------------------------------------------------------------ | c_custkey | c_name | c_address | c_nationkey | c_phone | c_acctbal | c_mktsegment | c_comment | ------------------------------------------------------------------------------------------------------------------------------------------------------ | 1 | Customer#000000001 | IVhzIApeRb ot,c,E | 15 | 25-989-741-2988 | 711.56 | BUILDING | to the even, regular platel... | | 2 | Customer#000000002 | XSTf4,NCwDVaWNe6tEgvwfmRchLXak | 13 | 23-768-687-3665 | 121.65 | AUTOMOBILE | l accounts. blithely ironic... | | 3 | Customer#000000003 | MG9kdTD2WBHm | 1 | 11-719-748-3364 | 7498.12 | AUTOMOBILE | deposits eat slyly ironic,... | | 32 | Customer#000000032 | jD2xZzi UmId,DCtNBLXKj9q0Tl... | 15 | 25-430-914-2194 | 3471.53 | BUILDING | cial ideas. final, furious ... | ------------------------------------------------------------------------------------------------------------------------------------------------------ 4 rows in set04 数据查询 如下所示Doris 集群中已经创建了名为paimon 的 Catalog可通过 SHOW CATALOGS 查看。以下为该 Catalog 的创建语句 -- 已创建无需执行 CREATE CATALOG paimon PROPERTIES (type paimon,warehouse s3://warehouse/wh/,s3.endpointhttp://minio:9000,s3.access_keyadmin,s3.secret_keypassword,s3.regionus-east-1 );你可登录到 Doris 中查询 Paimon 的数据 mysql use paimon.db_paimon; Reading table information for completion of table and column names You can turn off this feature to get a quicker startup with -ADatabase changed mysql show tables; --------------------- | Tables_in_db_paimon | --------------------- | customer | --------------------- 1 row in set (0.00 sec)mysql select * from customer order by c_custkey limit 4; ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | c_custkey | c_name | c_address | c_nationkey | c_phone | c_acctbal | c_mktsegment | c_comment | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | 1 | Customer#000000001 | IVhzIApeRb ot,c,E | 15 | 25-989-741-2988 | 711.56 | BUILDING | to the even, regular platelets. regular, ironic epitaphs nag e | | 2 | Customer#000000002 | XSTf4,NCwDVaWNe6tEgvwfmRchLXak | 13 | 23-768-687-3665 | 121.65 | AUTOMOBILE | l accounts. blithely ironic theodolites integrate boldly: caref | | 3 | Customer#000000003 | MG9kdTD2WBHm | 1 | 11-719-748-3364 | 7498.12 | AUTOMOBILE | deposits eat slyly ironic, even instructions. express foxes detect slyly. blithely even accounts abov | | 32 | Customer#000000032 | jD2xZzi UmId,DCtNBLXKj9q0Tlp2iQ6ZcO3J | 15 | 25-430-914-2194 | 3471.53 | BUILDING | cial ideas. final, furious requests across the e | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 4 rows in set (1.89 sec)05 读取增量数据 我们可以通过 Flink SQL 更新 Paimon 表中的数据 Flink SQL update customer set c_addressc_address_update where c_nationkey 1; [INFO] Submitting SQL update statement to the cluster... [INFO] SQL update statement has been successfully submitted to the cluster: Job ID: ff838b7b778a94396b332b0d93c8f7ac等 Flink SQL 执行完毕后在 Doris 中可直接查看到最新的数据 mysql select * from customer where c_nationkey1 limit 2; --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | c_custkey | c_name | c_address | c_nationkey | c_phone | c_acctbal | c_mktsegment | c_comment | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | 3 | Customer#000000003 | c_address_update | 1 | 11-719-748-3364 | 7498.12 | AUTOMOBILE | deposits eat slyly ironic, even instructions. express foxes detect slyly. blithely even accounts abov | | 513 | Customer#000000513 | c_address_update | 1 | 11-861-303-6887 | 955.37 | HOUSEHOLD | press along the quickly regular instructions. regular requests against the carefully ironic s | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 2 rows in set (0.19 sec)Benchmark 我们在 Paimon0.8版本的 TPCDS 1000 数据集上进行了简单的测试分别使用了 Apache Doris 2.1.5 版本和 Trino 422 版本均开启 Primary Key Table Read Optimized 功能。 从测试结果可以看到Doris 在标准静态测试集上的平均查询性能是 Trino 的 3 -5 倍后续我们将针对 Deletion Vector 进行优化进一步提升真实业务场景下的查询效率。 查询优化 对于基线数据来说Apache Paimon 在 0.6 版本中引入 Primary Key Table Read Optimized 功能后使得查询引擎可以直接访问底层的 Parquet/ORC 文件大幅提升了基线数据的读取效率。对于尚未合并的增量数据 INSERT、UPDATE 或 DELETE 所产生的数据增量来说可以通过 Merge-on-Read 的方式进行读取。此外Paimon 在 0.8 版本中还引入的 Deletion Vector 功能能够进一步提升查询引擎对增量数据的读取效率。 Apache Doris 支持通过原生的 Reader 读取 Deletion Vector 并进行 Merge on Read我们通过 Doris 的 EXPLAIN 语句来演示在一个查询中基线数据和增量数据的查询方式。 mysql explain verbose select * from customer where c_nationkey 3; ------------------------------------------------------------------------------------------------------------------------------------------------ | Explain String(Nereids Planner) | ------------------------------------------------------------------------------------------------------------------------------------------------ | ............... | | | | 0:VPAIMON_SCAN_NODE(68) | | table: customer | | predicates: (c_nationkey[#3] 3) | | inputSplitNum4, totalFileSize238324, scanRanges4 | | partition3/0 | | backends: | | 10002 | | s3://warehouse/wh/db_paimon.db/customer/c_nationkey1/bucket-0/data-15cee5b7-1bd7-42ca-9314-56d92c62c03b-0.orc start: 0 length: 66600 | | s3://warehouse/wh/db_paimon.db/customer/c_nationkey1/bucket-0/data-5d50255a-2215-4010-b976-d5dc656f3444-0.orc start: 0 length: 44501 | | s3://warehouse/wh/db_paimon.db/customer/c_nationkey2/bucket-0/data-e98fb7ef-ec2b-4ad5-a496-713cb9481d56-0.orc start: 0 length: 64059 | | s3://warehouse/wh/db_paimon.db/customer/c_nationkey0/bucket-0/data-431be05d-50fa-401f-9680-d646757d0f95-0.orc start: 0 length: 63164 | | cardinality18751, numNodes1 | | pushdown aggNONE | | paimonNativeReadSplits4/4 | | PaimonSplitStats: | | SplitStat [typeNATIVE, rowCount1542, rawFileConvertabletrue, hasDeletionVectortrue] | | SplitStat [typeNATIVE, rowCount750, rawFileConvertabletrue, hasDeletionVectorfalse] | | SplitStat [typeNATIVE, rowCount750, rawFileConvertabletrue, hasDeletionVectorfalse] | | tuple ids: 0 | ............... | | ------------------------------------------------------------------------------------------------------------------------------------------------ 67 rows in set (0.23 sec)可以看到对于刚才通过 Flink SQL 更新的表包含 4 个分片并且全部分片都可以通过 Native Reader 进行访问paimonNativeReadSplits4/4。并且第一个分片的hasDeletionVector的属性为 true表示该分片有对应的 Deletion Vector读取时会根据 Deletion Vector 进行数据过滤。 结束语 以上是基于 Apache Doris 与 Apache Paimon 快速搭建测试 / 演示环境的详细指南后续我们还将陆续推出 Apache Doris 与各类主流数据湖格式及存储系统构建湖仓一体架构的系列指南包括 Iceberg、OSS、Delta Lake 等欢迎持续关注。
http://www.dnsts.com.cn/news/218158.html

相关文章:

  • 工程建设项目网站什么是网上商店
  • 一级a做片性视频 网站在线观看哈尔滨最新政策
  • 吴兴网站建设python 网站开发入门
  • 北京网站建设那家好大丰做网站的公司
  • 上海网站定制公司做淘宝那样的网站要多少钱
  • 青山湖网站建设网上购物平台哪个最正规
  • 怎样才可以知道网站是否优化微信上微网站怎么做的
  • 二级域名怎么做网站wordpress付费问答
  • 济源网站建设哪家好在线做简单的网站吗
  • 建设银行征信中心个人信用查询官方网站松阳建设网站
  • 网站规划图花生壳做的网站
  • 活动网站怎么建设无锡建设网站的公司
  • 成都房地产网站建设重庆专业微网站建设
  • 中国建设银行注册网站百度2022最新版本
  • 在哪个网站注册域名110平米三室一厅简装
  • 微网站开发协议做淘宝网站需要多少钱
  • 网站备案后 还是需要再备案吗wordpress用什么主题
  • 天猫网站什么时候建设vs2012建设空网站
  • 中国建设银行官网appseo优化便宜
  • 网站建设 山东大庆做网站的
  • 捕鱼游戏网站开发商推广互联网工具是什么意思
  • 手机网站开发 图库类网站建设简单模板
  • 好口碑自适应网站建设WordPress20w文章
  • 常见的网站建设程序有哪些做哪些网站可以赚钱的
  • 企业网站怎么做排名广告专业的前景和就业方向
  • 专业搭建网站公司凡客诚品网站
  • 苏州网站建设方案外包常宁网站
  • 网站域名备案变更wordpress纯文本
  • 做网站维护的是什么公司中天建设集团有限公司西南分公司
  • 钓鱼网站链接怎么做网站如何做软文推广