排序
BI和报表的区别,终于有人说清楚了!
BI商业智能和报表工具不是同一个东西吗?有啥区别? 其实这是相当错误的理解,但有这种错误观念也不怪大家,因为这两者都是大数据时代下的数据工具,两者的功能确实也有所重合,但两者在本质上...
Spark底层执行原理详细解析
Spark简介 大规模数据处理高容错性高可伸缩性 Spark源码从1.x的40w行发展到现在的超过100w行,有1400多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执...
大数据NiFi(二十):实时同步MySQL数据到Hive
实时同步MySQL数据到Hive 案例:将mysql中新增的数据实时同步到Hive中。 以上案例需要用到的处理器有:“CaptureChangeMySQL”、“RouteOnAttribute”、“EvaluateJsonPath”、“ReplaceText”...
大数据OLAP引擎底层原理
由Facebook开源的Presto是其中的佼佼者,它是以MPP为架构的OLAP引擎中的中流砥柱。如果你学习过Spark、Flink的源码,会惊喜地发现,其中的多个设计思路和实现都参考了Presto,甚至于2019年在北...
2024版最新最强大数据面试宝典
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待! 目前已经更新到第5版,广受好评! 复习大数据面试题,看这一套...
PostgreSQL基础(十二):PostgreSQL备份和恢复介绍
PostgreSQL备份和恢复介绍 防止数据丢失的第一道防线就是备份。数据丢失有的是硬件损坏,还有人为的误删之类的,也有BUG的原因导致误删数据。 正常备份和恢复,如果公司有DBA,一般咱们不用参与...
Elasticsearch 保姆级教程(文末送书)
Elasticsearch 介绍 1. Elasticsearch Elasticsearch 是一个基于 Apache Lucene 的开源搜索引擎。无论在开源还是专有领域,Lucene 可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎...
浅谈DeepSeek对于数据分析师的赋能
在数据驱动决策的时代,效率就是生产力。DeepSeek作为AI助手,如何帮助数据分析师解放双手、提升10-100倍效率?本文带你深入了解这一革命性工具。 引言 数据分析师的日常是什么?清洗数据、探索...
数仓面试中3个常考的SQL数据分析题
在数据类岗位招聘过程中,经常会考察求职者的SQL能力,这里整理了3个常考的SQL数据分析题,按照由简单到复杂排序,一起来测试一下你掌握了么? PS:以下SQL代码在MySQL8.0及其以上版本运行。 题...
大数据必备技能:资源调度器Yarn技术原理解析
注:本文节选自清华大学出版社出版的《Hadoop海量数据处理:技术原理与项目实践》,略有改动,以纸质书出版为准。 --文末赠书-- 解析Yarn基本架构 资源调度器Yarn,主要由Resource Manager(RM...











