Hive SQL底层执行过程详细剖析
Hive SQL底层执行过程详细剖析 ================================================== 点击上方卡片进入主页,然后右上角“设为星标” 比别人更快接收好文章 整体到细节 Hive Hive是什么?Hive ...
数仓进阶_基于Bitmap快速实现留存指标计算
我们在计算留存指标(次留、3留、7留、15留、30留)的时候,通常情况下会使用以下公式: 第N日留存率公式 = (T日访问用户)∩ (T+N日访问用户) / (T日访问用户),这种实现方式,具有很好的代码可维...
PostgreSQL基础(七):表的基本操作(一)
表的基本操作(一) 表的构建语句,基本都会。 核心在于构建表时,要指定上一些约束。 一、约束 1、主键 2、非空 3、唯一 4、检查 5、外键 目前国内很多公司不玩这个,坑比较多,最好不要玩,真...
「数仓建设篇」从0到1搭建无忧搬家数仓
一、前言 1.1 背景 从而有以下问题: 1.直接从ods贴源层取数据,业务研发侧一改造则下游链路级联影响改动很大 2.各数据分析下游从源头贴源层就直接各自依赖计算,数据链路十分零散不好管理 3.贴...
大数据架构平台搭建指南及数据仓库演进
一、大数据架构平台搭建指南 虽然大数据平台组件很多,但是对于没有参与建设过大数据平台的朋友来说,当前众多的大数据组件和平台架构容易让人眼花缭乱。 本文首先介绍了大数据架构平台的组件架...
MySQL数据库基础(十五):PyMySQL使用介绍
PyMySQL使用介绍 提前安装MySQL数据库(可以使用Linux系统的,也可以使用Windows版本) 一、为什么要学习PyMySQL 如何实现将100000条数据插入到MySQL数据库? 如果使用之前学习的MySQL客户端来...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
BI到底是什么,是否所有企业都应该上BI?
BI到底是什么,是否所有企业都应该上BI? 为什么要花时间来解释这个并不新鲜的问题? 大概是因为逐渐发现这问题的答案可能并没有问题本身普及得开。因此,今天来写这篇文章帮助大家系统认识、理...
一文学完所有的Hive SQL(两万字最全详解)
一文学完所有的Hive SQL(两万字最全详解) ================================================== 进入主页,点击右上角“设为星标” 比别人更快接收好文章 Hive SQL 大全 本文基本涵盖了Hive日...
MySQL数据库基础(十三):关系型数据库三范式介绍
关系型数据库三范式介绍 一、什么是三范式 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余...













