排序
一文讲透数据仓库命名规范
正文开始 引言 在当今数据驱动的商业环境中,数据仓库已成为企业决策的核心支撑。然而,随着数据量的急剧增长和数据复杂性的提高,如何有效管理和使用这些数据成为了一个巨大的挑战。其中,一个经常...
数仓进阶_基于Bitmap快速实现留存指标计算
我们在计算留存指标(次留、3留、7留、15留、30留)的时候,通常情况下会使用以下公式: 第N日留存率公式 = (T日访问用户)∩ (T+N日访问用户) / (T日访问用户),这种实现方式,具有很好的代码可维...
MySQL数据库基础(六):DDL数据库操作
DDL数据库操作 一、MySQL的组成结构 注: 一个MySQL DBMS可以同时存放多个数据库,理论上一个项目就对应一个数据库。如博客项目blog数据库、商城项目shop数据库、微信项目wechat数据库。 一个数...
Spark知识体系五万字讲解,学习与面试收藏这篇就够了!
一、Spark 基础二、Spark Core三、Spark SQL四、Spark Streaming五、Structured Streaming六、Spark 两种核心 Shuffle七、Spark 底层执行原理八、Spark 数据倾斜九、Spark 性能调优十、Spark 故...
「Hive进阶篇」万字长文超详述Hive企业级优化
文章字数:13271字 预计阅读需:18分钟 有需要可 点赞+在看 关注公众号《大数据阶梯之路》找小编获取文档保存本地吧,学习和复习都是绝佳,公众号不断分享技术相关文章 一、问题背景 主要从...
大数据NiFi(二十):实时同步MySQL数据到Hive
实时同步MySQL数据到Hive 案例:将mysql中新增的数据实时同步到Hive中。 以上案例需要用到的处理器有:“CaptureChangeMySQL”、“RouteOnAttribute”、“EvaluateJsonPath”、“ReplaceText”...
PostgreSQL基础(五):PostgreSQL基本操作和数据类型介绍
PostgreSQL基本操作和数据类型介绍 一、单引号和双引号 在PGSQL中,写SQL语句时,单引号用来标识实际的值。双引号用来标识一个关键字,比如表名,字段名。 二、数据类型转换 第一种方式:只需要...
MySQL数据库基础(二):MySQL数据库介绍
MySQL数据库介绍 一、MySQL介绍 MySQL是一个关系型数据库管理系统,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件,它是由瑞典...
PostgreSQL基础(十五):PostgreSQL的主从操作
PostgreSQL的主从操作 PostgreSQL自身只支持简单的主从,没有主从自动切换,仿照类似Nginx的效果一样,采用keepalived的形式,在主节点宕机后,通过脚本的执行完成主从切换。 一、主从实现(异...
五万字 _ Flink知识体系保姆级总结
本文目录: 一、Flink简介二、Flink 部署及启动三、Flink 运行架构四、Flink 算子大全五、流处理中的 Time 与 Window六、Flink 状态管理七、Flink 容错八、Flink SQL九、Flink CEP十、Flink CDC...









