ClickHouse、Doris、 Impala等MPP架构详解
我们常用的大数据计算引擎有很多都是MPP架构的,像我们熟悉的Impala、ClickHouse、Druid、Doris等都是MPP架构。 亿级秒开 详解MPP架构MPP架构与批处理架构的异同点采用MPP架构的OLAP引擎介绍 一...
「Hive进阶篇」万字长文超详述Hive企业级优化
文章字数:13271字 预计阅读需:18分钟 有需要可 点赞+在看 关注公众号《大数据阶梯之路》找小编获取文档保存本地吧,学习和复习都是绝佳,公众号不断分享技术相关文章 一、问题背景 主要从...
16种ETL平台优劣对比,谁才是企业的最佳选择?
1、数据源层 (Data Sources Layer) 2、开发层 (Development Layer) 3、控制层 (Control Layer) 4、执行层 (Execution Layer) 5、存储层 (Storage Layer) 三、全面ETL平台对比分析 1、开源平台评...
17种数据质量管理平台优劣对比,谁才是企业的最佳选择?
正文开始 本文将全面解读数据质量管理平台的架构、数据质量管理平台评价标准、17个主流数据质量管理平台对比分析及企业适配选型的建议。 一、数据质量管理平台的架构 接入适配层规则引擎层问题...
MySQL数据库基础(十二):子查询(三步走)
子查询(三步走) 一、子查询(嵌套查询)的介绍 在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句,外部那个select语句则称为主查询。 主查询和子...
8k 字详述 Flink 四大天王之一的状态本地化!
Flink状态原理及异常容错机制 在1.2.3节,笔者强调了Flink是一个高可用的有状态计算引擎,在第5章的案例中,也频繁出现了状态这个概念。那么状态是什么呢?有状态计算又是什么呢?Flink基于状态...
为数据仓库设计一个完美的指标体系
正文开始: 一、什么是数据指标体系? 数据:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽...
3 小时搞定 5 万字段!LLM 自动生成数据字典实战指南
“十万字段,没有一个注释,交接时你崩溃过吗?” 相信我,你不是一个人在战斗。写数据字典,这活儿又累又不讨好,但偏偏重要到不行。 上个月我们团队接手一个“祖传”数据库,15 张核心表,上...
ClickHouse 在什么场景下才管用?
ClickHouse 是近年来分析型数据库的热点,一向以快著称,很多其它以性能为卖点的分析型数据库也常常会用它作为一个对比标杆。很多用户碰到数据库运算性能问题时,也会考虑转向求助于 ClickHouse...














