最容易出错的 HiveSQL 详解
最容易出错的 HiveSQL 详解 ================================================== 正文开始: 前言 在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的...
PostgreSQL基础(十一):PostgreSQL的锁介绍
PostgreSQL的锁介绍 PostgreSQL中主要有两种锁,一个表锁一个行锁 PostgreSQL中也提供了页锁,咨询锁,但是这个不需要关注,他是为了锁的完整性。 一、表锁 表锁显而易见,就是锁住整张表。表锁...
Spark的两种核心Shuffle详解
由于 Shuffle 涉及磁盘的读写和网络 I/O,因此 Shuffle 性能的高低直接影响整个程序的性能 Spark Shuffle Spark Shuffle 分为两种:一种是基于 Hash 的 Shuffle;另一种是基于 Sort 的 Shuffle...
数仓建设中最常用模型–Kimball维度建模详解
先来介绍下此书,此书是基于作者 60 多年的实际业务环境而总结的经验及教训,为读者提供正式的维度设计和开发技术。面向数仓和BI设计人员,书中涉及到的内容非常广泛,围绕一系列的商业场景或案...
ETL的灵魂:调度系统
ETL的灵魂:调度系统 ================================================== 大家好,我是一哥,最近有小伙伴私聊我说他们的调度系统经常出问题,领导要求大家人在哪电脑背到哪,家庭生活一地鸡...
2万字长文,最全面的Hive开窗函数讲解和实战指南(必看)
导读: 文章来源于:白程序员的自习室 预计阅读需:20分钟 分享这篇好文的原因是我觉得契合我最近写作的主题【Hive开发】,《大数据阶梯之路》公众号内分享的文章也都是我经过挑选的,欢迎大家...
干货下载 _ 自然堂集团ChatBI(AI+BI)建设与实践案例精讲
当下大模型技术如火如荼,为BI领域带来了前所未有的想象力和创新空间。相较传统BI,ChatBI不再局限于传统的报告和仪表板,而是向着更加智能、更简洁的交互式方向发展,有效降低了企业数据应用门...
一文读懂AI黑话:31个最流行的大模型术语(图解珍藏版)
一、时代基石 构成整个大语言模型时代的根基,是理解一切的前提。 1. 生成式AI (Generative AI) 2. Transformer架构 (Transformer Architecture) 3. 基础模型 (Foundation Models) 4. 预训练与...
平安人寿ChatBI:大模型智能化报表的深度实践
正文开始 导读 1. 项目背景和目标 2. 解决方案 3. 产品效果 4. 落地挑战 5. 总结和展望 6. 问答环节 分享嘉宾|刘行行 中国平安人寿保险股份有限公司 财企及产品数据服务组分组经理 编辑...
16种ETL平台优劣对比,谁才是企业的最佳选择?
1、数据源层 (Data Sources Layer) 2、开发层 (Development Layer) 3、控制层 (Control Layer) 4、执行层 (Execution Layer) 5、存储层 (Storage Layer) 三、全面ETL平台对比分析 1、开源平台评...














