Spark数据倾斜解决
一、数据倾斜表现 数据倾斜就是数据分到各个区的数量不太均匀,可以自定义分区器,想怎么分就怎么分。 Spark中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,是由于不同的key对应的数据...
BI到底是什么,是否所有企业都应该上BI?
BI到底是什么,是否所有企业都应该上BI? 为什么要花时间来解释这个并不新鲜的问题? 大概是因为逐渐发现这问题的答案可能并没有问题本身普及得开。因此,今天来写这篇文章帮助大家系统认识、理...
MySQL数据库基础(二):MySQL数据库介绍
MySQL数据库介绍 一、MySQL介绍 MySQL是一个关系型数据库管理系统,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件,它是由瑞典...
华为大数据解决方案 (文末附PPT下载)
导读: 一、内容 1. 大数据发展趋势 2. 华为大数据平台关键技术 3. 华为大数据平台行业实践 4. 华为大数据平台案例详述4. 华为大数据平台案例详述
最强最全面的数仓建设规范指南
最强最全面的数仓建设规范指南 ================================================== 进入主页,点击右上角“设为星标” 比别人更快接收好文章 本文将全面讲解数仓建设规范,从数据模型规范,到...
12天16场大数据模拟面试和复盘,以下是总结。
大家好,我们又见面了。 文章停更了一周多,原因是事情全部扎堆了。除了工作中的,还有个人工作室的,以及安排给我们大数据提高班同学们进行密集的模拟面试和面试复盘。 因为9到10月份是一个招...
PostgreSQL基础(十五):PostgreSQL的主从操作
PostgreSQL的主从操作 PostgreSQL自身只支持简单的主从,没有主从自动切换,仿照类似Nginx的效果一样,采用keepalived的形式,在主节点宕机后,通过脚本的执行完成主从切换。 一、主从实现(异...
3 小时搞定 5 万字段!LLM 自动生成数据字典实战指南
“十万字段,没有一个注释,交接时你崩溃过吗?” 相信我,你不是一个人在战斗。写数据字典,这活儿又累又不讨好,但偏偏重要到不行。 上个月我们团队接手一个“祖传”数据库,15 张核心表,上...














