排序
基于Flink建设实时数仓
正文开始: 本文目录: 一. 实时计算初期 二. 实时数仓建设 三. Lambda架构的实时数仓 四. Kappa架构的实时数仓 五. 流批结合的实时数仓 实时计算初期 虽然实时计算在...
数智化?别逗了,业务只会提报表取数!
这是一篇给所有在数据泥潭中挣扎的同行的漫画。如果你笑了,说明你经历过;如果你觉得无奈,说明你正在经历。 第一幕:我曾相信光 宏伟蓝图 未来大脑 第一次接触 梦碎的声音 第二幕:你好,报表...
万字详解整个数据仓库建设体系(好文收藏)
本文目录: 二、数仓建模方法 三、维度建模 四、实际业务中数仓分层 数据仓库的基本概念 数据仓库概念: 英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据...
数据指标体系建设方法 (干货建议收藏)
指标=数据+业务场景 1、使用场景(who、when、where) 2、指标定义(what) 3、指标用途(why) 海盗指标法(AARRR): 第一关键指标法: 不同行业在不同发展阶段,最终绘制出来的“指标树”可...
MCP在数据领域的应用探索
在一个周五的深夜,老王被一通紧急电话从梦中叫醒。电话来自某零售巨头的首席营销官(CMO),他急需一份关于“本季度华东区新客转化率最高的营销活动及其关联的用户负面反馈”的报告,用于周一...
BI和报表的区别,终于有人说清楚了!
BI商业智能和报表工具不是同一个东西吗?有啥区别? 其实这是相当错误的理解,但有这种错误观念也不怪大家,因为这两者都是大数据时代下的数据工具,两者的功能确实也有所重合,但两者在本质上...
Spark底层执行原理详细解析
Spark简介 大规模数据处理高容错性高可伸缩性 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执...
MySQL数据库基础(四):图形化开发工具DataGrip
图形化开发工具DataGrip 一、DataGrip介绍 DataGrip是JetBrains公司推出的管理数据库的产品,功能非常强大,可以兼容各种数据库,另外,JetBrains公司还有一款知名的IDE开发工具IDEA,用户体验非...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
数据开发的魅力,从来不是 “我能写多复杂的 SQL”
最近和几位数据团队负责人聊天,发现一个挺普遍的情况: 大家都在说 “数据开发难”,可真问起难在哪儿,说法却不一样。 这些吐槽背后,其实是对数据开发的理解偏了: 很多人觉得数据开发就是 ...










