8k 字详述 Flink 四大天王之一的状态本地化!
Flink状态原理及异常容错机制 在1.2.3节,笔者强调了Flink是一个高可用的有状态计算引擎,在第5章的案例中,也频繁出现了状态这个概念。那么状态是什么呢?有状态计算又是什么呢?Flink基于状态...
Hive SQL底层执行过程详细剖析
Hive是什么?Hive 是数据仓库工具,再具体点就是一个 SQL 解析引擎,因为它即不负责存储数据,也不负责计算数据,只负责解析 SQL,记录元数据。 Hive直接访问存储在 HDFS 中或者 HBase 中的文件...
MySQL数据库基础(七):DDL数据表操作
DDL数据表操作 特别注意: 一、数据表的基本操作 1、数据表的创建 创建 => create 数据表 => table 创建 + 数据表 = create table 数据表名称 基本语法: 案例:创建一个admin管理员表,...
数据中台解决方案(限时分享)
一、前言 1.1 本PPT的核心理念 1.2 本PPT的核心架构:1.2 本PPT的核心架构 一套企业架构: 一套数据治理体系: 建设路线规划: 1.3 本PPT的核心原则 坚持“业务牵引,咨询、平台、实施三位一体推...
【实战讲解】数据血缘落地实施
在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。 今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。 蔡博士...
ChatGPT、Claude的数据分析能力已经到了何种水平?
ChatGPT 4o现在也具备了该能力,但距离Claude 3.5有差距,比如针对案例一,其识别出的数据明显不准确,200602的离网用户数被识别为了52000,但肉眼可见的数据应该在70000以上。 针对案例二,把...
为数据仓库设计一个完美的指标体系
正文开始: 一、什么是数据指标体系? 数据:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽...
领导问:那个信息部门一天到晚在做什么?
一谈起企业数字化转型建设,就不得不说一下信息部门,在整个数字化建设过程中不同的企业由于对数字化认知的不同,信息部门要么被重视,要么被边缘化,在数字化价值体现难的情况下信息部门的地位...
2万字揭秘阿里巴巴数据治理实践经验
00 前言 阿里巴巴一直将数据作为自己的核心资产与能力之一,通过多年的实践探索建设数据应用,支撑业务发展。在不断升级和重构的过程中,我们经历了从分散的数据分析到平台化能力整合,再到...
Hive知识体系保姆级教程
Hive涉及的知识点如下图所示,本文将逐一讲解: 正文开始: 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功...












