2024版最新最强大数据面试宝典
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待! 目前已经更新到第5版,广受好评! 复习大数据面试题,看这一套...
数仓进阶_基于Bitmap快速实现留存指标计算
我们在计算留存指标(次留、3留、7留、15留、30留)的时候,通常情况下会使用以下公式: 第N日留存率公式 = (T日访问用户)∩ (T+N日访问用户) / (T日访问用户),这种实现方式,具有很好的代码可维...
OLAP数仓入门与进阶问答篇
什么是OLAP,其与OLTP有什么区别? 如果展开来说,这个问题估计可以写好几篇文章,这里简单谈谈个人的理解。 OLTP是Online transaction processing的英文缩写,指在线/联机事务处理 OLAP是Onlin...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
浅谈DeepSeek对于数据分析师的赋能
在数据驱动决策的时代,效率就是生产力。DeepSeek作为AI助手,如何帮助数据分析师解放双手、提升10-100倍效率?本文带你深入了解这一革命性工具。 引言 数据分析师的日常是什么?清洗数据、探索...
别混淆逻辑、应用、系统、技术及企业架构!12张架构图一次性讲透
在软件工程领域,“架构”是一个被频繁使用但又常常引起混淆的术语。逻辑架构、应用架构、技术架构、集成架构、TOGAF企业架构……这些概念从何而来,又彼此关联? 本文旨在拨开迷雾,通过构建一...
BI到底是什么,是否所有企业都应该上BI?
BI到底是什么,是否所有企业都应该上BI? 为什么要花时间来解释这个并不新鲜的问题? 大概是因为逐渐发现这问题的答案可能并没有问题本身普及得开。因此,今天来写这篇文章帮助大家系统认识、理...
大数据面试大厂真题-附答案详细解析
第一题:大数据笔试题-Java相关(美菜网) 写出下列程序的输出: 运行结果: 分析: 这道程序题考察的是Java中的静态代码块、构造代码块、构造函数的概念。 静态代码块 static {} 随着类的加载...
Hive SQL底层执行过程详细剖析
Hive是什么?Hive 是数据仓库工具,再具体点就是一个 SQL 解析引擎,因为它即不负责存储数据,也不负责计算数据,只负责解析 SQL,记录元数据。 Hive直接访问存储在 HDFS 中或者 HBase 中的文件...
PostgreSQL基础(十):PostgreSQL的并发问题
PostgreSQL的并发问题 一、事务的隔离级别 在不考虑隔离性的前提下,事务的并发可能会出现的问题: 脏读: 不可重复读: 幻读: 针对这些并发问题,关系型数据库有一些事务的隔离级别,一般用4...














