大数据NiFi(二十):实时同步MySQL数据到Hive
实时同步MySQL数据到Hive 案例:将mysql中新增的数据实时同步到Hive中。 以上案例需要用到的处理器有:“CaptureChangeMySQL”、“RouteOnAttribute”、“EvaluateJsonPath”、“ReplaceText”...
抖音集团数据血缘深度应用:架构、指标与优化实践
正文开始 导读 本次分享将聚焦于资产体系中的全链路血缘,文章将围绕下面四点展开:本次分享将聚焦于资产体系中的全链路血缘,文章将围绕下面四点展开: 1. 抖音集团血缘整体介绍 2. 抖音集团...
2023版最新最强大数据面试宝典
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待! 目前已经更新到第4版,广受好评! 复习大数据面试题,看这一套...
DeepSeek在数据领域的100个应用场景
DeepSeek作为一款前沿的人工智能技术,以其卓越的适应性和多功能性,在众多领域展现出非凡的应用价值。 以下是100个DeepSeek在数据领域的应用场景,展示了DeepSeek如何为数据行业注入智能化动力...
MySQL数据库基础(十三):关系型数据库三范式介绍
关系型数据库三范式介绍 一、什么是三范式 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余...
「数仓建设篇」数仓总线矩阵架构设计
如何设计一套切实可行的数据仓库呢? 帮助数据架构师清晰地梳理整个数据体系 帮助决策者(Boss)从宏观的角度了解数据仓库的整体情况 让所有的数据仓库参与者了解数据仓库的设计 如何编写总线矩...
告别宽表,用DQL成就新一代BI
BI 商业智能这个概念已经提出好几十年了,这个概念本身比较宽泛,不同人也有不同的理解和定义,但落实到技术环节,特别是面向业务用户的环节,所称的 BI,基本就是指的多维分析或者自助报表 不...
Kafka 知识体系保姆级教程宝典
本文目录 一、消息队列 Apache Pulsar Pulsar 与 Kafka 对比二、Kafka基础三、Kafka架构及组件四、Kafka集群操作五、Kafka的JavaAPI操作六、Kafka中的数据不丢失机制七、Kafka配置文...
Gartner:数据中台即将消亡,取而代之的是数智基建
在上图中,数据中台处于幻灭的深渊(Trough of Disillusionment);而数智基建则处于技术萌芽期(Innovation Trigger)。 数据中台最早于 2015 年年底被阿里巴巴首次提出,数据中台的核心任务就...













