MySQL数据库基础(十一):多表查询
多表查询 一、交叉连接(了解) 它是所有连接的基础,其功能就是将表1和表2中的每一条数据进行连接。 结果: 字段数 = 表1字段 + 表2的字段 记录数 = 表1中的总数量 * 表2中的总数量(笛卡尔积...
「Hive进阶篇」大表join大表优化
来源:CSDN技术博客 36678 一、问题场景 问题场景如下:A表为一个汇总表,汇总的是卖家买家最近N天交易汇总信息,即对于每个卖家最近N天,其每个买家共成交了多少单,总金额是多少,假设N取90天...
数据仓库:详解维度建模之事实表
本文目录如下: 一、事实表基础二、事实表设计规则三、事实表设计方法四、有事实的事实表五、无事实的事实表六、聚集型事实表 正文开始: 每个数据仓库都包含一个或者多个事实数据表。其中可能...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
Elasticsearch 保姆级教程(文末送书)
Elasticsearch 介绍 1. Elasticsearch Elasticsearch 是一个基于 Apache Lucene 的开源搜索引擎。无论在开源还是专有领域,Lucene 可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎...
PostgreSQL基础(四):图形化界面安装与数据类型介绍
图形化界面安装与数据类型介绍 一、图形化界面安装 图形化界面可以连接PGSQL的很多,Navicat(收费)。 也可以直接使用PostgreSQL官方提供的图形化界面。(完全免费) 官方提供的:https://www....
万字详解数据仓库、数据湖、数据中台和湖仓一体
本文目录: 一、前言 数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据...
数据指标体系建设方法 (干货建议收藏)
指标=数据+业务场景 1、使用场景(who、when、where) 2、指标定义(what) 3、指标用途(why) 海盗指标法(AARRR): 第一关键指标法: 不同行业在不同发展阶段,最终绘制出来的“指标树”可...
最容易出错的 HiveSQL 详解
最容易出错的 HiveSQL 详解 ================================================== 正文开始: 前言 在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的...














