关于数仓建设及数据治理的超全概括
本文分为两大节介绍,第一节是数仓建设,第二节是数据治理,内容较长,还请耐心阅读! 在谈数仓之前,先来看下面几个问题: 数仓为什么要分层? 用空间换时间,通过大量的预处理来提升应用系统...
万字长文详解HiveSQL执行计划
本文目录:一、前言二、SQL的执行计划 一、前言 可以说执行计划是打开SQL优化大门的一把钥匙 要想学SQL执行计划,就需要学习查看执行计划的命令:explain,在查询语句的SQL前面加上关键字explai...
Spark底层执行原理详细解析
Spark简介 大规模数据处理高容错性高可伸缩性 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执...
DeepSeek狂飙,你的数据跟上了吗?“数据编织”了解一下
想象一座城市中的孤岛,过去我们建造实体桥梁(数据复制)连接它们;而数据编织则是创建'虚拟传送门',让这些孤岛在保持独立的同时实现无缝连接。它解决的不仅是数据的物理隔离,更是数据的理解...
菠菜公司开了60K,坐牢还是坐班?
大家好,今天分享的内容有点劲爆。 事情还得从我们提高班同学面试过程说起。 起因是找工作的过程中猎头推了一个岗位,办公需要remote的方式,通过zoom远程办公。这个同学的offer就属于这类,并...
最容易出错的 HiveSQL 详解
最容易出错的 HiveSQL 详解 ================================================== 正文开始: 前言 在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的...
智能体工作流的七种设计模式
当前,人工智能领域正在经历一场深刻的变革。我们已经超越了通过单一提示词(Prompt)获取惊艳结果的阶段。真正的挑战在于如何构建能够自主解决复杂、多步骤问题的持久化系统。这就是**智能体工...
领导问:那个信息部门一天到晚在做什么?
一谈起企业数字化转型建设,就不得不说一下信息部门,在整个数字化建设过程中不同的企业由于对数字化认知的不同,信息部门要么被重视,要么被边缘化,在数字化价值体现难的情况下信息部门的地位...
算得准、能协同、够灵活!Agent BI破解企业数据分析全场景难题
当 ChatBI 凭借自然语言交互的便捷性,逐渐成为企业数据分析的常用工具,不少数据同行却慢慢陷入瓶颈:对话式分析始终跳不出“查数”的局限,面对找根因、做预测、提解决方案这类复杂需求时,总...
《可信数据空间标准体系建设指南(2025年版)》正式发布
2025年6月29日,《可信数据空间标准体系建设指南(2025年版)》(以下简称《指南》)正式发布。 该指南由可信数据空间发展联盟组织120家成员单位共同完成,旨在构建一套体系完备、层次清晰、协...













