华为大数据解决方案 (文末附PPT下载)
导读: 一、内容 1. 大数据发展趋势 2. 华为大数据平台关键技术 3. 华为大数据平台行业实践 4. 华为大数据平台案例详述4. 华为大数据平台案例详述
2万字揭秘阿里巴巴数据治理实践经验
00 前言 阿里巴巴一直将数据作为自己的核心资产与能力之一,通过多年的实践探索建设数据应用,支撑业务发展。在不断升级和重构的过程中,我们经历了从分散的数据分析到平台化能力整合,再到...
Hive知识体系保姆级教程
Hive涉及的知识点如下图所示,本文将逐一讲解: 正文开始: 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功...
五万字 _ Flink知识体系保姆级总结
本文目录: 一、Flink简介二、Flink 部署及启动三、Flink 运行架构四、Flink 算子大全五、流处理中的 Time 与 Window六、Flink 状态管理七、Flink 容错八、Flink SQL九、Flink CEP十、Flink CDC...
数仓指标体系搭建实战
正文 曹雷 | 作者 滴滴技术 | 来源 指标体系 1. 痛点分析 业务、技术、产品 业务视角 业务分析场景指标、维度不明确; 频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐; 用户分析具体...
大数据之数据治理体系全面指南
好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。 如何构建企业数据治理体系?企业数据治理过程需要注意哪些问题?总体而言,不能一口...
小米基于Spark3.1搭建数据开发平台实践
1. Multiple Catalog 落地与应用 2. Hive SQL 迁移 Spark SQL 3. 离线场景下 Spark 的稳定性与性能优化 4. 未来规划 5. 问答环节 01 2.Spark3的元数据管理 Hive SQL迁移 Spark SQL 2.语法...
《可信数据空间标准体系建设指南(2025年版)》正式发布
2025年6月29日,《可信数据空间标准体系建设指南(2025年版)》(以下简称《指南》)正式发布。 该指南由可信数据空间发展联盟组织120家成员单位共同完成,旨在构建一套体系完备、层次清晰、协...
Kafka在美团数据平台的实践(好文收藏)
1. 现状和挑战 1.1 现状 Kafka是一个开源的流处理平台,业界有很多互联网企业也都在使用这款产品。我们首先了解一下Kafka在美团数据平台的现状。 如图1-1所示,蓝色部分描述了Kafka在数据平台定...














