bi共15篇
数仓进阶_基于Bitmap快速实现留存指标计算-22l2-技术成就未来

数仓进阶_基于Bitmap快速实现留存指标计算

我们在计算留存指标(次留、3留、7留、15留、30留)的时候,通常情况下会使用以下公式: 第N日留存率公式 = (T日访问用户)∩ (T+N日访问用户) / (T日访问用户),这种实现方式,具有很好的代码可维...
admin的头像-22l2-技术成就未来admin2个月前
07615
Spark知识体系五万字讲解,学习与面试收藏这篇就够了!-22l2-技术成就未来

Spark知识体系五万字讲解,学习与面试收藏这篇就够了!

一、Spark 基础二、Spark Core三、Spark SQL四、Spark Streaming五、Structured Streaming六、Spark 两种核心 Shuffle七、Spark 底层执行原理八、Spark 数据倾斜九、Spark 性能调优十、Spark 故...
admin的头像-22l2-技术成就未来admin2个月前
05314
Hive知识体系保姆级教程-22l2-技术成就未来

Hive知识体系保姆级教程

Hive涉及的知识点如下图所示,本文将逐一讲解: 正文开始: 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功...
admin的头像-22l2-技术成就未来admin2个月前
05110
一文讲透数据仓库命名规范-22l2-技术成就未来

一文讲透数据仓库命名规范

正文开始 引言 在当今数据驱动的商业环境中,数据仓库已成为企业决策的核心支撑。然而,随着数据量的急剧增长和数据复杂性的提高,如何有效管理和使用这些数据成为了一个巨大的挑战。其中,一个经常...
admin的头像-22l2-技术成就未来admin2个月前
05115
MySQL数据库基础(六):DDL数据库操作-22l2-技术成就未来

MySQL数据库基础(六):DDL数据库操作

DDL数据库操作 一、MySQL的组成结构 注: 一个MySQL DBMS可以同时存放多个数据库,理论上一个项目就对应一个数据库。如博客项目blog数据库、商城项目shop数据库、微信项目wechat数据库。 一个数...
admin的头像-22l2-技术成就未来admin2个月前
05015
基于大模型进行数据分类分级实操指南-22l2-技术成就未来

基于大模型进行数据分类分级实操指南

正文开始 当前,数据安全与合规性的重要性愈发凸显。如何根据数据的敏感程度进行分级,并配套相应的安全管控措施,是所有数据从业者必须面临且亟需解决的重要课题。 大模型能够理解和生成自然语...
admin的头像-22l2-技术成就未来admin2个月前
0395
数据安全治理已迫在眉睫!-22l2-技术成就未来

数据安全治理已迫在眉睫!

你是否遭遇过如下场景: 不知何时,你的手机暴响,一个暧昧或口气浑浊的女音如同刚刚和你劈过腿的问你:大哥,你最近股票赚吗?我拉你进一个免费的股票交流群吧! 你果断挂掉电话,将其拉入黑名...
admin的头像-22l2-技术成就未来admin2个月前
0385
Linux性能问题分析流程与性能优化思路-22l2-技术成就未来

Linux性能问题分析流程与性能优化思路

排查顺序 1. 整体情况 top/htop/atop 命令查看进程/线程、CPU、内存使用情况,CPU使用情况; dstat 2 查看CPU、磁盘IO、网络IO、换页、中断、切换,系统I/O状态; vmstat 2 查看内存使用情况,内...
admin的头像-22l2-技术成就未来admin2个月前
0378
PostgreSQL基础(十五):PostgreSQL的主从操作-22l2-技术成就未来

PostgreSQL基础(十五):PostgreSQL的主从操作

PostgreSQL的主从操作 PostgreSQL自身只支持简单的主从,没有主从自动切换,仿照类似Nginx的效果一样,采用keepalived的形式,在主节点宕机后,通过脚本的执行完成主从切换。 一、主从实现(异...
admin的头像-22l2-技术成就未来admin2个月前
03611
「Hive进阶篇」大表join大表优化-22l2-技术成就未来

「Hive进阶篇」大表join大表优化

来源:CSDN技术博客 36678 一、问题场景 问题场景如下:A表为一个汇总表,汇总的是卖家买家最近N天交易汇总信息,即对于每个卖家最近N天,其每个买家共成交了多少单,总金额是多少,假设N取90天...
admin的头像-22l2-技术成就未来admin2个月前
0357