当前位置: 首页 > news >正文

莲塘网站建设快速仿站网站建设

莲塘网站建设,快速仿站网站建设,轻云服务器 多个网站,人力资源公司注册需要什么条件“大数据”已死——现今我们最重要的事情不是担心数据大小#xff0c;而是专注于我们将如何使用它来做出更好的决策。数据库行业发展至今#xff0c;在数据层面有很多的加速和变革#xff0c;尤其是过去几年的云数仓爆炸式增长#xff0c;带来了行业的很多变化。毫无疑问而是专注于我们将如何使用它来做出更好的决策。数据库行业发展至今在数据层面有很多的加速和变革尤其是过去几年的云数仓爆炸式增长带来了行业的很多变化。毫无疑问云数据仓库已成为企业数据堆栈的基石各种规模的公司和组织习惯使用数据仓库来分析业务数据。Snowflake 的迅速崛起就是这一趋势的典型代表。但如果我们把大数据的变量拆成速度、数量和多样性三个维度我们发现大家最关注的维度仍然是速度。当我们重新审视对“大数据”的定义并且结合数据资产的要素我们最重要的需求是从 OLTP [1] 数据库处理的数据资产上的微服务对低延迟消耗的要求。与此同时很多大数据部门购买了所有新工具并从遗留系统迁移之后他们发现仍然无法去理解这些数据也许数据大小根本不是问题所在。世界的数据量变大了但硬件也以更快的速度变大了供应商仍在推动硬件的能力扩展。今天我们就来聊一家有点“不一样”思路的数据库创业公司——MotherDuck看看他们的产品 DuckDB 是如何来理解这个世界的。历史沿革欧美合作的商业化产物说起 MotherDuck 的前世今生首先还是要从产品 DuckDB 讲起。DuckDB 是一个专门构建的进程内在线分析处理数据库管理系统其旨在实现高效数据分析。从 2019 年 DuckDB 第一个开源版本发布到 2021 年短短两年间DuckDB 的周下载量增长迅速。此时这个原本由荷兰数学和计算机科学研究学会 (CWI) 创立的项目被分拆出来独立运作项目研究人员 Hannes Mühleisen 和 Mark Raasveldt 成立了 DuckDB Labs。故事至此为什么 MotherDuck 还未出现呢别急我们还缺少另一位主角——谷歌 Big Query 的创始工程师 Jordan Tigani他也关注着 DuckDB并一直寻求为市场提供轻型数据库产品。在和 DuckDB Labs 的联合创始人 Mühleisen 沟通并获得支持后Tigani 开始尝试将开源的 DuckDB 商业化。新公司 MotherDuck 就此诞生并获得了由红点资本(美国) 领投的 1250 万美元天使轮融资和 A16Z 领投 3500 万美元 A 轮融资公司估值 1.75 亿美元。回头来看作为一家起步时间不长的初创公司获得这样的资本认可不可谓不成功。由于 DuckDB 并非 MotherDuck 的原创开源产品因此想要未来长久且稳定地基于开源产品构建服务得到项目创始团队的支持至关重要。在双方的合作中 DuckDB 团队一定程度上参与了 MotherDuck而 MotherDuck 又是 DuckDB 基金会的成员该非营利组织拥有 DuckDB 的大部分知识产权。DuckDB 自己的商业部门 DuckDB Labs 是 MotherDuck 的股东。不得不说 Tigani 与 DuckDB Labs 合作是聪明之举通过此举双方利益得以绑定。定位OLAP 领域的 SQLite要聊 DuckDB我们先来看看 SQLite其可以称得上世界上使用最多的关系型数据库系统我们几乎在每台手机、每个浏览器和操作系统上都能找到它的身影它甚至也在飞机上运行。由于 SQLite 是嵌入式的因此其不需要外部服务器管理。同时他几乎绑定了每种语言也正是基于这些特点让其更容易使用我们必须承认 SQLite 的伟大。但与此同时其问题也突出。SQLite 是为 OLTP 而设计的采用行存储不能利用内存来加快计算速度查询优化器非常有限所以对于分析来说非常不友好。正是基于此DuckDB 看到了机会。简单来讲它是用于分析 (OLAP 领域 [2] )的 SQLite作为一个进程内数据库它使开发人员、数据科学家、数据工程师和数据分析师能够使用纯 SQL 以极快的分析能力为它的代码提供支持。此外它有能力在可能存在的地方分析数据例如在笔记本电脑或云端。DuckDB 使用了一个列式矢量化查询引擎该引擎仍会解释查询但会在一次操作中处理大量向量由此减少传统系统 (如 PostgreSQL、MySQL 或 SQLite) 中按顺序处理每一行的开销提升查询性能。SQLite 是小型的关系型数据库可用于进程内的部署。DuckDB 所处象限认知数据库行业的“非共识”与行业大部分公司不同MotherDuck 拥有不一样的行业信仰。首先Tigani 认为大多数客户和组织的数据存储适中并不大。同时客户数据大小服从幂律分布。最大客户的存储量是第二大客户的两倍第三大客户的存储量是第二大客户的一半依此类推。因此虽然有客户拥有数百 PB 的数据但大小很快就会下降。其次存算分离中存在存储偏差数据大小增速快于计算。假如业务是静态的既不增长也不收缩数据随时间线性增长但计算需求不会改变太多因为大多数分析都是针对近期数据进行的。这种存算偏差让我们可能根本不需要进行分布式处理。而且很多用户希望他们的问题得到简单快速的答案 —— 他们不想等待云。最后大多数数据很少被查询。得到处理的数据中有很大一部分不到 24 小时。到数据保存一周时查询的可能性或许比最近一天低 20 倍。历史数据往往很少被查询这也就意味着数据工作集大小比我们预期的易于管理。如果有一个包含 10 年数据的 PB 表这些数据最后可能被压缩至不到 50 GB。所以很多云厂商专注于 100TB 的查询性能这可能不仅与大多用户无关且会分散他们提供出色用户体验的能力。因此MotherDuck 提出了自己的观点大数据是真实存在的但大多数人可能不需要担心。“大数据”已死——现今我们最重要的事情不是担心数据大小而是专注于我们将如何使用它来做出更好的决策。我们也会时常问自己组织真的会生成大量数据吗如果生成了真的需要一次使用大量数据吗如果需要数据真的太大而无法放在一台机器上吗也许不同的组织会给出不同的答案。大数据已死未来没有“银弹”没有万能的选择我们目前所处的时代高速变化产生了很多数据库管理系统。正如我们看到的情况目前这个世界还没有万能的数据库管理系统。大家都会采取不同的权衡取舍以更好地适应特定的用例DuckDB 也是如此。有时我们需要侧重考虑为多个并发用户提供服务有时我们也需要一个对单用户工作负载非常快的嵌入式数据库。DuckDB 会成功吗答案也许并不确定。不过我们确实看到了一个充满活力的开源社区正在形成虽然还未有任何商业化的信息披露但我们应有耐心给予这个 A 轮公司毕竟故事才刚刚开始。DuckDB 在 Github 的 star 数量变化注释:[1] OLTPOn-Line Transaction Processing 联机事务处理过程也称为面向交易的处理过程。[2] OLAPOnline Analytical Processing 联机分析处理。联机分析处理 OLAP 是一种软件技术它使分析人员能够迅速、一致、交互地从各个方面观察信息以达到深入理解数据的目的。作者简介郑博Aka Harbour 哈博。崔牛会非著名牛油人到中年的 2B 基础架构创业老炮CnosDB 云原生时序数据库开源社区发起人。CnosDB简介CnosDB是一款高性能、高易用性的开源分布式时序数据库现已正式发布及全部开源。欢迎关注我们的社区网站https://www.cnosdb.com
http://www.dnsts.com.cn/news/260115.html

相关文章:

  • 钓鱼网站怎么做响应式购物网站模板
  • 怎么进入公司网站wordpress 哪个版本
  • 网站一站 手机微信600 900手机卡盟网站建设
  • 临安网站建设定制网站开发公司
  • 苏州的建筑公司网站网站建设的利益分析
  • 顶尖网站建设青海玉树网站建设
  • 网站开发的发展行政单位建设网站方案
  • 东莞信科做网站ocin wordpress主题
  • 网站建设需要哪些基础wordpress 编辑器设置
  • 手机被网站安装软件有哪些内容html页面 wordpress
  • vps如何创建网站嘉兴品牌网站
  • 网站建设宣传wordpress 搬家出错
  • 怎样免费建企业网站wordpress 腾讯云短信
  • 怎么找淘宝客网站wordpress企业网站制作视频教程
  • 专业html5网站建设小程序开发平台售后服务怎样
  • 合肥品牌型网站建设地址树莓派wordpress建站
  • 和平苏州网站建设上海网站建设案例
  • 中航建设集团有限公司网站一起做网站
  • 网站制作在哪里比较好如何使用ps做网站
  • 青岛cms建站系统seo推广工具
  • 自己做网站和外包wordpress转到手机端
  • 网站权重提升工具《网站开发实践》 实训报告
  • 广州医院网站建设备案价网站
  • 常州网站建设专业的公司软件开发培训机构加盟
  • 企业建站划算吗365网站
  • 那个网站详情页做的好做影视网站违法莫
  • 专业网站设计 网络服务专业手机建站价格
  • php网站投票源码网站建设销售一个月开几个单
  • 网站项目团队介绍找外贸客户的网站
  • 金融投资公司网站建设论文卡点视频免费制作软件