「Hive进阶篇」大表join大表优化
来源:CSDN技术博客 36678 一、问题场景 问题场景如下:A表为一个汇总表,汇总的是卖家买家最近N天交易汇总信息,即对于每个卖家最近N天,其每个买家共成交了多少单,总金额是多少,假设N取90天...
DeepSeek在数据领域的100个应用场景
DeepSeek作为一款前沿的人工智能技术,以其卓越的适应性和多功能性,在众多领域展现出非凡的应用价值。 以下是100个DeepSeek在数据领域的应用场景,展示了DeepSeek如何为数据行业注入智能化动力...
大数据建模最佳实践(含需求分析、模型设计、实施落地等)
在数据团队待久了,总会遇到两种让人头疼的情况: 其实数据建模这事儿,就是把业务需求和技术实现连起来的那根线,看着基础,却藏着不少坑。它真不是画几张图、写几行代码那么简单,得真懂业务...
早7晚11,大厂节奏崩不住了!附生存落地指南。
大家好,今天我们分享的内容是关于中大公司Landing。 前两天有小伙伴拿到某大厂的Offer,入职后发现节奏超级快,有点难以适应。 可能因为项目紧张,工作时间上,早上7点就要出门,晚上10点才能...
万字长文详解HiveSQL执行计划
本文目录:一、前言二、SQL的执行计划 一、前言 可以说执行计划是打开SQL优化大门的一把钥匙 要想学SQL执行计划,就需要学习查看执行计划的命令:explain,在查询语句的SQL前面加上关键字explai...
DeepSeek智能数据治理整体方案
DeepSeek智能数据治理整体方案 ================================================== 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: ...
一个数据的自白:我的一生
献给所有在数据海洋中默默耕耘的同仁们 第一章:诞生篇 序幕 诞生时刻 初识世界 身份认证 第二章:成长篇 ETL的洗礼 进入ODS层 升入DWD层 DWS层的聚合 ADS层的展示 第三章:职业生涯篇 数据血缘...
MySQL数据库基础(三):Linux系统下的MySQL安装与使
Linux系统下的MySQL安装与使用 一、MySQL部署安装 1. 卸载自带的MySQL8 2. 删除自带配置文件 3. 下载MySQL源 4. 安装MySQL源 5. 使用yum安装MySQL 注: 执行完之后再执行安装 启动MySQL 6. 获取...
别混淆逻辑、应用、系统、技术及企业架构!12张架构图一次性讲透
在软件工程领域,“架构”是一个被频繁使用但又常常引起混淆的术语。逻辑架构、应用架构、技术架构、集成架构、TOGAF企业架构……这些概念从何而来,又彼此关联? 本文旨在拨开迷雾,通过构建一...
Hive十亿级以上数据全局排序的一种实现方式
背景 大数据时代,日常工作中经常会处理数以亿计的数据。笔者近期就遇到了一个十亿级以上的数据排序需求,并输出序号。如果是小规模数据我们直接使用row_number全局排序就可以了,但是当数据规模...












