大数据分享共204篇
数仓进阶_基于Bitmap快速实现留存指标计算-22l2-技术成就未来

数仓进阶_基于Bitmap快速实现留存指标计算

我们在计算留存指标(次留、3留、7留、15留、30留)的时候,通常情况下会使用以下公式: 第N日留存率公式 = (T日访问用户)∩ (T+N日访问用户) / (T日访问用户),这种实现方式,具有很好的代码可维...
admin的头像-22l2-技术成就未来admin6个月前
08415
PostgreSQL基础(七):表的基本操作(一)-22l2-技术成就未来

PostgreSQL基础(七):表的基本操作(一)

表的基本操作(一) 表的构建语句,基本都会。 核心在于构建表时,要指定上一些约束。 一、约束 1、主键 2、非空 3、唯一 4、检查 5、外键 目前国内很多公司不玩这个,坑比较多,最好不要玩,真...
admin的头像-22l2-技术成就未来admin6个月前
0815
Hive SQL底层执行过程详细剖析-22l2-技术成就未来

Hive SQL底层执行过程详细剖析

Hive SQL底层执行过程详细剖析 ================================================== 点击上方卡片进入主页,然后右上角“设为星标” 比别人更快接收好文章 整体到细节 Hive Hive是什么?Hive ...
admin的头像-22l2-技术成就未来admin7个月前
0817
「数仓建设篇」从0到1搭建无忧搬家数仓-22l2-技术成就未来

「数仓建设篇」从0到1搭建无忧搬家数仓

一、前言 1.1 背景 从而有以下问题: 1.直接从ods贴源层取数据,业务研发侧一改造则下游链路级联影响改动很大 2.各数据分析下游从源头贴源层就直接各自依赖计算,数据链路十分零散不好管理 3.贴...
admin的头像-22l2-技术成就未来admin6个月前
0748
大数据架构平台搭建指南及数据仓库演进-22l2-技术成就未来

大数据架构平台搭建指南及数据仓库演进

一、大数据架构平台搭建指南 虽然大数据平台组件很多,但是对于没有参与建设过大数据平台的朋友来说,当前众多的大数据组件和平台架构容易让人眼花缭乱。 本文首先介绍了大数据架构平台的组件架...
admin的头像-22l2-技术成就未来admin7个月前
06510
业务部门的“不作为”杀死了数据治理?-22l2-技术成就未来

业务部门的“不作为”杀死了数据治理?

'我们业务太忙!' 当你想把数据治理的失败归咎于这句话时,就要想想:业务为什么不配合? 这就像一个项目经理抱怨开发不写文档——你也得先问问自己,写这文档到底有什么用。 业务其实一直在做...
admin的头像-22l2-技术成就未来admin5个月前
0659
ChatGPT:1小时学会DAMA数据管理(下)-22l2-技术成就未来

ChatGPT:1小时学会DAMA数据管理(下)

ChatGPT:1小时学会DAMA数据管理(上) ChatGPT:1小时学会DAMA数据管理(中) 第12章 元数据管理 (一)数据的故事 某大型零售连锁企业决定实施元数据管理项目,以提升数据治理能力和决策效率...
admin的头像-22l2-技术成就未来admin7个月前
06514
Hive窗口函数保姆级教程-22l2-技术成就未来

Hive窗口函数保姆级教程

在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
admin的头像-22l2-技术成就未来admin7个月前
0649
MySQL数据库基础(十五):PyMySQL使用介绍-22l2-技术成就未来

MySQL数据库基础(十五):PyMySQL使用介绍

PyMySQL使用介绍 提前安装MySQL数据库(可以使用Linux系统的,也可以使用Windows版本) 一、为什么要学习PyMySQL 如何实现将100000条数据插入到MySQL数据库? 如果使用之前学习的MySQL客户端来...
admin的头像-22l2-技术成就未来admin6个月前
0625
Flink+Kafka存在诸多限制,下一代实时存储组件来解决!-22l2-技术成就未来

Flink+Kafka存在诸多限制,下一代实时存储组件来解决!

5. Fluss 开源 当前业界呈现出一个显著的趋势,即大数据的处理正在从离线模式转向实时化。我们可以观察到,多个行业和应用场景都在进行实时化的演进。例如,互联网、车联网和金融等领域都正通过...
admin的头像-22l2-技术成就未来admin6个月前
06115