数据仓库:详解维度建模之事实表
本文目录如下: 一、事实表基础二、事实表设计规则三、事实表设计方法四、有事实的事实表五、无事实的事实表六、聚集型事实表 正文开始: 每个数据仓库都包含一个或者多个事实数据表。其中可能...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
Elasticsearch 保姆级教程(文末送书)
Elasticsearch 介绍 1. Elasticsearch Elasticsearch 是一个基于 Apache Lucene 的开源搜索引擎。无论在开源还是专有领域,Lucene 可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎...
PostgreSQL基础(四):图形化界面安装与数据类型介绍
图形化界面安装与数据类型介绍 一、图形化界面安装 图形化界面可以连接PGSQL的很多,Navicat(收费)。 也可以直接使用PostgreSQL官方提供的图形化界面。(完全免费) 官方提供的:https://www....
万字详解数据仓库、数据湖、数据中台和湖仓一体
本文目录: 一、前言 数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据...
数据指标体系建设方法 (干货建议收藏)
指标=数据+业务场景 1、使用场景(who、when、where) 2、指标定义(what) 3、指标用途(why) 海盗指标法(AARRR): 第一关键指标法: 不同行业在不同发展阶段,最终绘制出来的“指标树”可...
最容易出错的 HiveSQL 详解
最容易出错的 HiveSQL 详解 ================================================== 正文开始: 前言 在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的...
BI和报表的区别,终于有人说清楚了!
BI商业智能和报表工具不是同一个东西吗?有啥区别? 其实这是相当错误的理解,但有这种错误观念也不怪大家,因为这两者都是大数据时代下的数据工具,两者的功能确实也有所重合,但两者在本质上...
Linux性能问题分析流程与性能优化思路
排查顺序 1. 整体情况 top/htop/atop 命令查看进程/线程、CPU、内存使用情况,CPU使用情况; dstat 2 查看CPU、磁盘IO、网络IO、换页、中断、切换,系统I/O状态; vmstat 2 查看内存使用情况,内...














