admin-22l2-技术成就未来-第12页
admin的头像-22l2-技术成就未来
徽章-资深玩家-22l2-技术成就未来徽章-备受喜爱-22l2-技术成就未来徽章-人气佳作-22l2-技术成就未来6枚徽章管理员超级版主
这家伙很懒,什么都没有写...
Spark知识体系五万字讲解,学习与面试收藏这篇就够了!-22l2-技术成就未来

Spark知识体系五万字讲解,学习与面试收藏这篇就够了!

一、Spark 基础二、Spark Core三、Spark SQL四、Spark Streaming五、Structured Streaming六、Spark 两种核心 Shuffle七、Spark 底层执行原理八、Spark 数据倾斜九、Spark 性能调优十、Spark 故...
2个月前
05414
《可信数据空间标准体系建设指南(2025年版)》正式发布-22l2-技术成就未来

《可信数据空间标准体系建设指南(2025年版)》正式发布

2025年6月29日,《可信数据空间标准体系建设指南(2025年版)》(以下简称《指南》)正式发布。 该指南由可信数据空间发展联盟组织120家成员单位共同完成,旨在构建一套体系完备、层次清晰、协...
2个月前
02710
「Hive进阶篇」万字长文超详述Hive企业级优化-22l2-技术成就未来

「Hive进阶篇」万字长文超详述Hive企业级优化

  文章字数:13271字 预计阅读需:18分钟 有需要可 点赞+在看 关注公众号《大数据阶梯之路》找小编获取文档保存本地吧,学习和复习都是绝佳,公众号不断分享技术相关文章 一、问题背景 主要从...
2个月前
03414
「Hive进阶篇」大表join大表优化-22l2-技术成就未来

「Hive进阶篇」大表join大表优化

来源:CSDN技术博客 36678 一、问题场景 问题场景如下:A表为一个汇总表,汇总的是卖家买家最近N天交易汇总信息,即对于每个卖家最近N天,其每个买家共成交了多少单,总金额是多少,假设N取90天...
「数仓建设篇」从0到1搭建无忧搬家数仓-22l2-技术成就未来

「数仓建设篇」从0到1搭建无忧搬家数仓

一、前言 1.1 背景 从而有以下问题: 1.直接从ods贴源层取数据,业务研发侧一改造则下游链路级联影响改动很大 2.各数据分析下游从源头贴源层就直接各自依赖计算,数据链路十分零散不好管理 3.贴...
2个月前
0688
「数仓建设篇」数仓总线矩阵架构设计-22l2-技术成就未来

「数仓建设篇」数仓总线矩阵架构设计

如何设计一套切实可行的数据仓库呢? 帮助数据架构师清晰地梳理整个数据体系 帮助决策者(Boss)从宏观的角度了解数据仓库的整体情况 让所有的数据仓库参与者了解数据仓库的设计 如何编写总线矩...
2个月前
03115
【原创长文】数据仓库指北 聊聊这表那表(附PDF获取)-22l2-技术成就未来

【原创长文】数据仓库指北 聊聊这表那表(附PDF获取)

1. 数据仓库的基础必备问题2. 数据仓库的几种数据表3. 数据仓库分层设计及各层作用4. 数据仓库几种数据模型5. 维度建模 一、 灵魂十二问 Q1:大数据的数据来源? 埋点上报数据业务数据库数据日...
2个月前
03814
【实战讲解】数据血缘落地实施-22l2-技术成就未来

【实战讲解】数据血缘落地实施

在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。 今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。 蔡博士...
2个月前
04010
Hive窗口函数保姆级教程-22l2-技术成就未来

Hive窗口函数保姆级教程

在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
2个月前
02412
Spark底层执行原理详细解析-22l2-技术成就未来

Spark底层执行原理详细解析

Spark简介 大规模数据处理高容错性高可伸缩性 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执...
2个月前
05314

随便看看