9000字详解数据治理和数据分类分级
01 数据分类分级提出的背景 数据的价值 1.数据爆炸时代,数据量呈指数级增长 我们要如何看待数据这个话题。数据大爆炸已经成为了一个趋势,随着数字化转型的步伐逐步加快,数据的诞生不断加快。...
8k 字详述 Flink 四大天王之一的状态本地化!
Flink状态原理及异常容错机制 在1.2.3节,笔者强调了Flink是一个高可用的有状态计算引擎,在第5章的案例中,也频繁出现了状态这个概念。那么状态是什么呢?有状态计算又是什么呢?Flink基于状态...
6个月vs6年,为什么有人一直停在取数岗?
正文开始 注:本故事基于多人的实际经历改编而成。 序:一条深夜的微信 2023年12月的最后一个工作日,凌晨两点,我收到了老王的微信:'老师,晋升结果出来了,我又没过...' 消息框上方显示着他...
ChatGPT、Claude的数据分析能力已经到了何种水平?
ChatGPT 4o现在也具备了该能力,但距离Claude 3.5有差距,比如针对案例一,其识别出的数据明显不准确,200602的离网用户数被识别为了52000,但肉眼可见的数据应该在70000以上。 针对案例二,把...
ChatGPT:1小时学会DAMA数据管理(上篇)
满足企业及其利益相关方的信息需求 确保数据的质量、完整性和安全性 保护数据隐私和机密性 防止数据被未经授权或不当访问和使用 确保数据能有效服务于企业增值目标 将数据视为独特属性的资产 重...
ChatGPT:1小时学会DAMA数据管理(下)
ChatGPT:1小时学会DAMA数据管理(上) ChatGPT:1小时学会DAMA数据管理(中) 第12章 元数据管理 (一)数据的故事 某大型零售连锁企业决定实施元数据管理项目,以提升数据治理能力和决策效率...
ClickHouse、Doris、 Impala等MPP架构详解
我们常用的大数据计算引擎有很多都是MPP架构的,像我们熟悉的Impala、ClickHouse、Druid、Doris等都是MPP架构。 亿级秒开 详解MPP架构MPP架构与批处理架构的异同点采用MPP架构的OLAP引擎介绍 一...
ClickHouse 在什么场景下才管用?
ClickHouse 是近年来分析型数据库的热点,一向以快著称,很多其它以性能为卖点的分析型数据库也常常会用它作为一个对比标杆。很多用户碰到数据库运算性能问题时,也会考虑转向求助于 ClickHouse...
ChatGPT:1小时帮你读懂DAMA(中)
《DAMA数据管理支持体系指南(原书第2版)》 17个章节共2.5万字 第7章到第11章 数据安全 数据集成和互操作 文件和内容管理 参考数据和主数据 数据仓库和商务智能 为了降低理解门槛,本文会按照...













