排序
《可信数据空间标准体系建设指南(2025年版)》正式发布
2025年6月29日,《可信数据空间标准体系建设指南(2025年版)》(以下简称《指南》)正式发布。 该指南由可信数据空间发展联盟组织120家成员单位共同完成,旨在构建一套体系完备、层次清晰、协...
关于数仓建设及数据治理的超全概括
本文分为两大节介绍,第一节是数仓建设,第二节是数据治理,内容较长,还请耐心阅读! 在谈数仓之前,先来看下面几个问题: 数仓为什么要分层? 用空间换时间,通过大量的预处理来提升应用系统...
菠菜公司开了60K,坐牢还是坐班?
大家好,今天分享的内容有点劲爆。 事情还得从我们提高班同学面试过程说起。 起因是找工作的过程中猎头推了一个岗位,办公需要remote的方式,通过zoom远程办公。这个同学的offer就属于这类,并...
大数据平台中的企业级数仓建设(好文收藏)
本文目录:一、模型设计二、数据架构三、数据治理 随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据的产生,越来越多的企业开始在大数据平台下进行数据处...
MySQL数据库基础(十一):多表查询
多表查询 一、交叉连接(了解) 它是所有连接的基础,其功能就是将表1和表2中的每一条数据进行连接。 结果: 字段数 = 表1字段 + 表2的字段 记录数 = 表1中的总数量 * 表2中的总数量(笛卡尔积...
一文读懂Hive底层数据存储格式(好文收藏)
性能也能得到数量级的提升 Hive 数据存储常用的格式如下: 行式存储 文本格式(TextFile) 二进制序列化文件 (SequenceFile) 列式存储 行列式文件(RCFile) 优化的行列式文件(ORCFile) Apa...
大数据面试大厂真题-附答案详细解析
第一题:大数据笔试题-Java相关(美菜网) 写出下列程序的输出: 运行结果: 分析: 这道程序题考察的是Java中的静态代码块、构造代码块、构造函数的概念。 静态代码块 static {} 随着类的加载...
Spark底层执行原理详细解析
Spark简介 大规模数据处理高容错性高可伸缩性 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执...











