数仓进阶_基于Bitmap快速实现留存指标计算
我们在计算留存指标(次留、3留、7留、15留、30留)的时候,通常情况下会使用以下公式: 第N日留存率公式 = (T日访问用户)∩ (T+N日访问用户) / (T日访问用户),这种实现方式,具有很好的代码可维...
PostgreSQL基础(七):表的基本操作(一)
表的基本操作(一) 表的构建语句,基本都会。 核心在于构建表时,要指定上一些约束。 一、约束 1、主键 2、非空 3、唯一 4、检查 5、外键 目前国内很多公司不玩这个,坑比较多,最好不要玩,真...
Hive SQL底层执行过程详细剖析
Hive SQL底层执行过程详细剖析 ================================================== 点击上方卡片进入主页,然后右上角“设为星标” 比别人更快接收好文章 整体到细节 Hive Hive是什么?Hive ...
「数仓建设篇」从0到1搭建无忧搬家数仓
一、前言 1.1 背景 从而有以下问题: 1.直接从ods贴源层取数据,业务研发侧一改造则下游链路级联影响改动很大 2.各数据分析下游从源头贴源层就直接各自依赖计算,数据链路十分零散不好管理 3.贴...
大数据架构平台搭建指南及数据仓库演进
一、大数据架构平台搭建指南 虽然大数据平台组件很多,但是对于没有参与建设过大数据平台的朋友来说,当前众多的大数据组件和平台架构容易让人眼花缭乱。 本文首先介绍了大数据架构平台的组件架...
业务部门的“不作为”杀死了数据治理?
'我们业务太忙!' 当你想把数据治理的失败归咎于这句话时,就要想想:业务为什么不配合? 这就像一个项目经理抱怨开发不写文档——你也得先问问自己,写这文档到底有什么用。 业务其实一直在做...
ChatGPT:1小时学会DAMA数据管理(下)
ChatGPT:1小时学会DAMA数据管理(上) ChatGPT:1小时学会DAMA数据管理(中) 第12章 元数据管理 (一)数据的故事 某大型零售连锁企业决定实施元数据管理项目,以提升数据治理能力和决策效率...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
MySQL数据库基础(十五):PyMySQL使用介绍
PyMySQL使用介绍 提前安装MySQL数据库(可以使用Linux系统的,也可以使用Windows版本) 一、为什么要学习PyMySQL 如何实现将100000条数据插入到MySQL数据库? 如果使用之前学习的MySQL客户端来...
算得准、能协同、够灵活!Agent BI破解企业数据分析全场景难题
当 ChatBI 凭借自然语言交互的便捷性,逐渐成为企业数据分析的常用工具,不少数据同行却慢慢陷入瓶颈:对话式分析始终跳不出“查数”的局限,面对找根因、做预测、提解决方案这类复杂需求时,总...












