大数据分享 第2页
Hive SQL优化笔记-22l2-技术成就未来

Hive SQL优化笔记

hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。 其中在开发过程中主要涉及到的可能是SQL优化这块。 优化的核心思想是: 减少数据量(例如分区、列剪裁); 避免数据倾斜(例如加...
admin的头像-22l2-技术成就未来admin2个月前
03015
「数仓建设篇」数仓总线矩阵架构设计-22l2-技术成就未来

「数仓建设篇」数仓总线矩阵架构设计

如何设计一套切实可行的数据仓库呢? 帮助数据架构师清晰地梳理整个数据体系 帮助决策者(Boss)从宏观的角度了解数据仓库的整体情况 让所有的数据仓库参与者了解数据仓库的设计 如何编写总线矩...
admin的头像-22l2-技术成就未来admin2个月前
03115
数仓中数据清洗的方法-22l2-技术成就未来

数仓中数据清洗的方法

在数据采集的过程中,需要从不同渠道获取数据并汇集在数仓中,采集的原始数据首先需要进行解析,然后对不准确、不完整、不合理、格式、字符等不规范数据进行过滤清洗,清洗过的数据才能更加符合...
admin的头像-22l2-技术成就未来admin1个月前
05015
MySQL数据库基础(十):DQL数据查询语言-22l2-技术成就未来

MySQL数据库基础(十):DQL数据查询语言

DQL数据查询语言 一、数据集准备 插入数据: 二、select查询 三、简单查询 四、条件查询 1、比较查询 2、范围查询 3、逻辑查询 4、模糊查询 5、非空查询 五、排序查询 六、聚合查询 之前我们做...
admin的头像-22l2-技术成就未来admin2个月前
03915
2024年《安全大模型技术与市场研究报告》重磅发布-22l2-技术成就未来

2024年《安全大模型技术与市场研究报告》重磅发布

AI在网络安全的历史应用:报告回顾了AI技术如专家系统、机器学习算法(包括SVM、决策树等)和深度学习技术在网络安全中的应用,强调了这些技术在恶意软件检测、入侵检测系统、钓鱼网站识别等方...
admin的头像-22l2-技术成就未来admin3个月前
03015
Hive参数与性能企业级调优(建议收藏)-22l2-技术成就未来

Hive参数与性能企业级调优(建议收藏)

Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。 但是如果我们只局限于会使用Hive,而不考虑性能问题,就难搭建出一个完美的数...
admin的头像-22l2-技术成就未来admin2个月前
04815
数据仓库架构落地版-22l2-技术成就未来

数据仓库架构落地版

正文开始:
admin的头像-22l2-技术成就未来admin2个月前
03315
ChatGPT:1小时学会DAMA数据管理(下)-22l2-技术成就未来

ChatGPT:1小时学会DAMA数据管理(下)

ChatGPT:1小时学会DAMA数据管理(上) ChatGPT:1小时学会DAMA数据管理(中) 第12章 元数据管理 (一)数据的故事 某大型零售连锁企业决定实施元数据管理项目,以提升数据治理能力和决策效率...
admin的头像-22l2-技术成就未来admin3个月前
05614
Spark知识体系五万字讲解,学习与面试收藏这篇就够了!-22l2-技术成就未来

Spark知识体系五万字讲解,学习与面试收藏这篇就够了!

一、Spark 基础二、Spark Core三、Spark SQL四、Spark Streaming五、Structured Streaming六、Spark 两种核心 Shuffle七、Spark 底层执行原理八、Spark 数据倾斜九、Spark 性能调优十、Spark 故...
admin的头像-22l2-技术成就未来admin2个月前
05314
【果总谈BI】数据归IT,分析归业务-22l2-技术成就未来

【果总谈BI】数据归IT,分析归业务

企业知识开源首席布道师陈果的答案是:数据归IT,分析归业务。即IT部门主要负责管理好数据、提供好工具,分析本质上是业务要做的事情。 为何会有这样的结论?陈果在「敏捷·创变——2024观远数...
admin的头像-22l2-技术成就未来admin2个月前
02714