排序
ETL的灵魂:调度系统
ETL的灵魂:调度系统 ================================================== 大家好,我是一哥,最近有小伙伴私聊我说他们的调度系统经常出问题,领导要求大家人在哪电脑背到哪,家庭生活一地鸡...
数据仓库:详解维度建模之事实表
本文目录如下: 一、事实表基础二、事实表设计规则三、事实表设计方法四、有事实的事实表五、无事实的事实表六、聚集型事实表 正文开始: 每个数据仓库都包含一个或者多个事实数据表。其中可能...
我,数据开发者,找不到工作
故事从某大厂的P7失业了开始....... 一、螺丝钉的困境 “判决书” 需求的“万箭穿心” “数据神坛” “系统深渊” 绩效“B” 二、我们落伍了 曾经很牛逼 配置机器 提线木偶 “舒适温泉” 生锈的...
Hadoop_Spark 太重,esProc SPL 很轻
Hadoop/Spark 之重 轻量级的选择 SPL 集群计算的代码也非常简单,比如前面提到的订单分析计算,具体要求是:大订单表分段存储在 4 个节点上,小产品表则加载到每个节点的内存中,两表关联之后要...
PostgreSQL基础(八):表的基本操作(二)
表的基本操作(二) 一、视图 跟MySQL的没啥区别,把一些复杂的操作封装起来,还可以隐藏一些敏感数据。 视图对于用户来说,就是一张真实的表,可以直接基于视图查询一张或者多张表的信息。 视...
如何保障数仓数据质量?
导读 文|傅宇康 有赞数据报表中心为商家提供了丰富的数据指标,包括30+页面,100+数据报表以及400+不同类型的数据指标,它们帮助商家更合理、科学地运营店铺,同时也直接提供分析决策方法供商...
别混淆逻辑、应用、系统、技术及企业架构!12张架构图一次性讲透
在软件工程领域,“架构”是一个被频繁使用但又常常引起混淆的术语。逻辑架构、应用架构、技术架构、集成架构、TOGAF企业架构……这些概念从何而来,又彼此关联? 本文旨在拨开迷雾,通过构建一...
数仓之路:数仓中的问题与解决方案
小A进入一家网约车出现服务公司,负责公司数仓建设,试用期主要一项 OKR是制定数据仓库建设规划;因此小 A 本着从问题出发为原点,先对公司数仓现状进行一轮深入了解,理清存在问题,然后在以不...
大数据OLAP引擎底层原理
由Facebook开源的Presto是其中的佼佼者,它是以MPP为架构的OLAP引擎中的中流砥柱。如果你学习过Spark、Flink的源码,会惊喜地发现,其中的多个设计思路和实现都参考了Presto,甚至于2019年在北...
浅谈DeepSeek对于数据分析师的赋能
在数据驱动决策的时代,效率就是生产力。DeepSeek作为AI助手,如何帮助数据分析师解放双手、提升10-100倍效率?本文带你深入了解这一革命性工具。 引言 数据分析师的日常是什么?清洗数据、探索...











