排序
一文读懂数仓模型与数据建模全过程
一文读懂数仓模型与数据建模全过程 ================================================== 在不少企业的数据系统中,可能会遇到这样的问题: 不同系统里都有个叫“客户ID”的字段,一个是营销系...
Hive SQL底层执行过程详细剖析
Hive是什么?Hive 是数据仓库工具,再具体点就是一个 SQL 解析引擎,因为它即不负责存储数据,也不负责计算数据,只负责解析 SQL,记录元数据。 Hive直接访问存储在 HDFS 中或者 HBase 中的文件...
数据治理难的不是技术,而是“讲规矩”
数据标准体系建设需要得到企业高层的重视和支持,更需要企业的所有部门共同参与。形成高层决策、数据标准管理部门统筹、各部门参与的数据标准管理的长效机制。其中高层是数据标准化工作的最高决...
数据仓库之数据质量建设(深度好文)
正文开始: 数仓建设真正的难点不在于数仓设计,而在于后续业务发展起来,业务线变的庞大之后的数据治理数据质量治理 数据产生->数据接入->数据存储->数据处理->数据输出->数据...
ChatGPT:1小时学会DAMA数据管理(上篇)
满足企业及其利益相关方的信息需求 确保数据的质量、完整性和安全性 保护数据隐私和机密性 防止数据被未经授权或不当访问和使用 确保数据能有效服务于企业增值目标 将数据视为独特属性的资产 重...
数仓主题域与主题划分
这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题域划分,同时会引申出主题划分,和数据域是什么,业务过程等。 这个对于大数据数仓工程师来说是必备的能力,比如当你面临着一个新业务的...
一篇讲明白 Hadoop 生态的三大部件
一篇讲明白 Hadoop 生态的三大部件 ================================================== 大数据技术的发展并不是偶然的,它的背后是对于成本的考量。集中式数据库或者基于MPP架构的分布数据库...
2万字揭秘阿里巴巴数据治理实践经验
00 前言 阿里巴巴一直将数据作为自己的核心资产与能力之一,通过多年的实践探索建设数据应用,支撑业务发展。在不断升级和重构的过程中,我们经历了从分散的数据分析到平台化能力整合,再到...
6个月vs6年,为什么有人一直停在取数岗?
正文开始 注:本故事基于多人的实际经历改编而成。 序:一条深夜的微信 2023年12月的最后一个工作日,凌晨两点,我收到了老王的微信:'老师,晋升结果出来了,我又没过...' 消息框上方显示着他...










