创立一个网站需要什么,微信群,广州关于进一步优化,做网站可视化接上篇----------Doris分区与分桶
在建表语句的最后 PROPERTIES 中#xff0c;可以指定以下两个参数#xff1a;
replication_num
每个 Tablet 的副本数量。默认为 3#xff0c;建议保持默认即可。在建表语句中#xff0c;所有 Partition 中的 Tablet 副本数量统一指定。…接上篇----------Doris分区与分桶
在建表语句的最后 PROPERTIES 中可以指定以下两个参数
replication_num
每个 Tablet 的副本数量。默认为 3建议保持默认即可。在建表语句中所有 Partition 中的 Tablet 副本数量统一指定。而在增加新分区时可以单独指定新分区中 Tablet 的副本数量。
副本数量可以在运行时修改。强烈建议保持奇数。
最大副本数量取决于集群中独立 IP 的数量注意不是 BE 数量。Doris 中副本分布的原则是不允许同一个 Tablet 的副本分布在同一台物理机上而识别物理机即通过 IP。所以即使在同一台物理机上部署了 3 个或更多 BE 实例如果这些 BE 的 IP 相同则依然只能设置副本数为 1。
对于一些小并且更新不频繁的维度表可以考虑设置更多的副本数。这样在 Join 查询时可以有更大的概率进行本地数据 Join。
storage_medium storage_cooldown_time
BE 的数据存储目录可以显式的指定为 SSD 或者 HDD通过 .SSD 或者 .HDD 后缀区分。建表时可以统一指定所有 Partition 初始存储的介质。注意后缀作用是显式指定磁盘介质而不会检查是否与实际介质类型相符。默认初始存储介质可通过 fe 的配置文件 fe.conf 中指定default_storage_mediumxxx如果没有指定则默认为 HDD。如果指定为 SSD则数据初始存放在 SSD 上。
如果没有指定 storage_cooldown_time则默认 30 天后数据会从 SSD 自动迁移到 HDD 上。如果指定了 storage_cooldown_time则在到达 storage_cooldown_time 时间后数据才会迁移。
注意当指定 storage_medium 时如果 FE 参数 enable_strict_storage_medium_check 为False 该参数只是一个“尽力而为”的设置。
即使集群内没有设置 SSD 存储介质也不会报错而是自动存储在可用的数据目录中。 同样如果 SSD 介质不可访问、空间不足都可能导致数据初始直接存储在其他可用介质上。
而数据到期迁移到 HDD 时如果 HDD 介质不可访问、空间不足也可能迁移失败但是会不断尝试。
如果FE 参数enable_strict_storage_medium_check 为 True 则当集群内没有设置 SSD 存储介质时会报错 Failed to find enough host in all backends with storage medium is SSD。 ENGINE
本示例中ENGINE 的类型是 olap即默认的 ENGINE 类型。在 Doris 中只有这个ENGINE 类型是由 Doris 负责数据管理和存储的。其他 ENGINE 类型如 mysql、broker、es 等等本质上只是对外部其他数据库或系统中的表的映射以保证 Doris 可以读取这些数据。而 Doris 本身并不创建、管理和存储任何非 olap ENGINE 类型的表和数据。
其他
IF NOT EXISTS 表示如果没有创建过该表则创建。注意这里只判断表名是否存在而不会判断新建表结构是否与已存在的表结构相同。