大数据分享 第9页
万字详解整个数据仓库建设体系(好文收藏)-22l2-技术成就未来

万字详解整个数据仓库建设体系(好文收藏)

本文目录: 二、数仓建模方法 三、维度建模 四、实际业务中数仓分层 数据仓库的基本概念 数据仓库概念: 英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据...
admin的头像-22l2-技术成就未来admin2个月前
04313
万字详解数据仓库、数据湖、数据中台和湖仓一体-22l2-技术成就未来

万字详解数据仓库、数据湖、数据中台和湖仓一体

本文目录: 一、前言 数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据...
admin的头像-22l2-技术成就未来admin2个月前
0435
一文读懂Hive底层数据存储格式(好文收藏)-22l2-技术成就未来

一文读懂Hive底层数据存储格式(好文收藏)

性能也能得到数量级的提升 Hive 数据存储常用的格式如下: 行式存储 文本格式(TextFile) 二进制序列化文件 (SequenceFile) 列式存储 行列式文件(RCFile) 优化的行列式文件(ORCFile) Apa...
admin的头像-22l2-技术成就未来admin2个月前
0516
一文读懂AI黑话:31个最流行的大模型术语(图解珍藏版)-22l2-技术成就未来

一文读懂AI黑话:31个最流行的大模型术语(图解珍藏版)

一、时代基石 构成整个大语言模型时代的根基,是理解一切的前提。 1. 生成式AI (Generative AI) 2. Transformer架构 (Transformer Architecture) 3. 基础模型 (Foundation Models) 4. 预训练与...
admin的头像-22l2-技术成就未来admin2个月前
0236
一文讲透数据仓库命名规范-22l2-技术成就未来

一文讲透数据仓库命名规范

正文开始 引言 在当今数据驱动的商业环境中,数据仓库已成为企业决策的核心支撑。然而,随着数据量的急剧增长和数据复杂性的提高,如何有效管理和使用这些数据成为了一个巨大的挑战。其中,一个经常...
admin的头像-22l2-技术成就未来admin2个月前
05115
【果总谈BI】数据归IT,分析归业务-22l2-技术成就未来

【果总谈BI】数据归IT,分析归业务

企业知识开源首席布道师陈果的答案是:数据归IT,分析归业务。即IT部门主要负责管理好数据、提供好工具,分析本质上是业务要做的事情。 为何会有这样的结论?陈果在「敏捷·创变——2024观远数...
admin的头像-22l2-技术成就未来admin2个月前
02814
Spark底层执行原理详细解析-22l2-技术成就未来

Spark底层执行原理详细解析

Spark简介 大规模数据处理高容错性高可伸缩性 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执...
admin的头像-22l2-技术成就未来admin2个月前
05314
Hive窗口函数保姆级教程-22l2-技术成就未来

Hive窗口函数保姆级教程

在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
admin的头像-22l2-技术成就未来admin2个月前
02312
【实战讲解】数据血缘落地实施-22l2-技术成就未来

【实战讲解】数据血缘落地实施

在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。 今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。 蔡博士...
admin的头像-22l2-技术成就未来admin2个月前
04010
【原创长文】数据仓库指北 聊聊这表那表(附PDF获取)-22l2-技术成就未来

【原创长文】数据仓库指北 聊聊这表那表(附PDF获取)

1. 数据仓库的基础必备问题2. 数据仓库的几种数据表3. 数据仓库分层设计及各层作用4. 数据仓库几种数据模型5. 维度建模 一、 灵魂十二问 Q1:大数据的数据来源? 埋点上报数据业务数据库数据日...
admin的头像-22l2-技术成就未来admin2个月前
03814