实时数仓演进&方案对比选型落地
实时数仓演进&方案对比选型落地 ================================================== 【作者介绍】王磊,阿里云 MVP,华院计算技术总监。 著有:《图解 Spark 大数据快速分析实战》;《off...
数据仓库:详解维度建模之事实表
本文目录如下: 一、事实表基础二、事实表设计规则三、事实表设计方法四、有事实的事实表五、无事实的事实表六、聚集型事实表 正文开始: 每个数据仓库都包含一个或者多个事实数据表。其中可能...
算得准、能协同、够灵活!Agent BI破解企业数据分析全场景难题
当 ChatBI 凭借自然语言交互的便捷性,逐渐成为企业数据分析的常用工具,不少数据同行却慢慢陷入瓶颈:对话式分析始终跳不出“查数”的局限,面对找根因、做预测、提解决方案这类复杂需求时,总...
Spark重要知识汇总
一、Spark 是什么 大规模数据处理的统一分析引擎,也可说是分布式内存迭代计算框架。 二、Spark 四大特点 三、Spark框架模块介绍 3.1、Spark Core的RDD详解 3.1.1、什么是RDD 不可变、可分区、...
数据孤岛被打破,采集1万+,使用100张?
'我们终于把数据孤岛打通了!集团所有系统的数据全接进来了,一万多张表!' 前阵子,一家传统制造企业的朋友打电话给我,声音里透着那种项目验收后的亢奋。 我心里咯噔一下,但还是问:'牛啊!...
我,数据负责人,带团队走出了该死的“报表地狱”
第一章:深陷泥潭 第1幅:理想 VS 现实 第2幅:夺命连环Call 第3幅:疲于奔命的“救火队” 第4幅:推行规范的尝试(失败) 第5幅:教科书的困境 第6幅:溺水者如何造船?(关键隐喻页) 第7幅:...
6个月vs6年,为什么有人一直停在取数岗?
正文开始 注:本故事基于多人的实际经历改编而成。 序:一条深夜的微信 2023年12月的最后一个工作日,凌晨两点,我收到了老王的微信:'老师,晋升结果出来了,我又没过...' 消息框上方显示着他...
Linux性能问题分析流程与性能优化思路
排查顺序 1. 整体情况 top/htop/atop 命令查看进程/线程、CPU、内存使用情况,CPU使用情况; dstat 2 查看CPU、磁盘IO、网络IO、换页、中断、切换,系统I/O状态; vmstat 2 查看内存使用情况,内...
「数仓建设篇」从0到1搭建无忧搬家数仓
一、前言 1.1 背景 从而有以下问题: 1.直接从ods贴源层取数据,业务研发侧一改造则下游链路级联影响改动很大 2.各数据分析下游从源头贴源层就直接各自依赖计算,数据链路十分零散不好管理 3.贴...
关于数仓建设及数据治理的超全概括
本文分为两大节介绍,第一节是数仓建设,第二节是数据治理,内容较长,还请耐心阅读! 在谈数仓之前,先来看下面几个问题: 数仓为什么要分层? 用空间换时间,通过大量的预处理来提升应用系统...












