360商业化基于Doris的统一OLAP应用实践
导读:Akin 业务场景 在正式介绍 Apache Doris 在 360 商业化的应用之前,我们先对广告业务中的典型使用场景进行简要介绍: 实时大盘: 广告账户的实时消费数据场景: 实时数仓演进 第一代架构 ...
深入剖析HDFS 3.0版本EC技术,节省一半存储但拥有三副本机制相同的容错能力
正文开始: HDFS 3.x 数据存储新特性-纠删码 纠删码 1. EC介绍 Erasure Coding 简称 EC,中文名:纠删码 条带化技术就是一种自动将 I/O 的负载均衡到多个物理磁盘上的技术 条带化单元 2. HDFS...
ClickHouse、Doris、 Impala等MPP架构详解
我们常用的大数据计算引擎有很多都是MPP架构的,像我们熟悉的Impala、ClickHouse、Druid、Doris等都是MPP架构。 亿级秒开 详解MPP架构MPP架构与批处理架构的异同点采用MPP架构的OLAP引擎介绍 一...
「Hive进阶篇」万字长文超详述Hive企业级优化
文章字数:13271字 预计阅读需:18分钟 有需要可 点赞+在看 关注公众号《大数据阶梯之路》找小编获取文档保存本地吧,学习和复习都是绝佳,公众号不断分享技术相关文章 一、问题背景 主要从...
PostgreSQL基础(三):PostgreSQL的基础操作
PostgreSQL的基础操作 只在psql命令行(客户端)下,执行了一次l,查看了所有的库信息。 可以直接基于psql查看一些信息,也可以基于psql进入到命令行后,再做具体操作。 可以直接基于psql去玩 ...
大数据架构、高性能、数据治理面试题及答案
A. 大数据的高级处理技术(占比5%) 单选题: 1. 以下__不属于大数据的关键技术 A. 数据技术 B. 大数据安全技术和大数据质量技术 C. 虚拟化技术和云计算平台技术 D. 海量数据的存储技术 答案...
全面认识数仓开发之数据指标体系
什么是数据指标体系? 数据指标指标数据 数据:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、...
Paimon数据丢失的常见场景和注意事项(避坑版)
Paimon数据丢失的常见场景和注意事项(避坑版) 大家好,我们又见面了。今天的内容很短小,关于写Paimon数据丢失的几种场景。 Paimon是数据湖领域最被广泛使用的框架之一。数据入Paimon的过程中造...
基于Flink构建全场景实时数仓
本文目录: 一. 实时计算初期 二. 实时数仓建设 三. Lambda架构的实时数仓 四. Kappa架构的实时数仓 五. 流批结合的实时数仓 实时计算初期 虽然实时计算在最近几年才...
BI和报表的区别,终于有人说清楚了!
BI商业智能和报表工具不是同一个东西吗?有啥区别? 其实这是相当错误的理解,但有这种错误观念也不怪大家,因为这两者都是大数据时代下的数据工具,两者的功能确实也有所重合,但两者在本质上...













