2025年08月的文章 第3页
Kafka在美团数据平台的实践(好文收藏)
1. 现状和挑战 1.1 现状 Kafka是一个开源的流处理平台,业界有很多互联网企业也都在使用这款产品。我们首先了解一下Kafka在美团数据平台的现状。 如图1-1所示,蓝色部分描述了Kafka在数据平台定...
Kafka 知识体系保姆级教程宝典
本文目录 一、消息队列 Apache Pulsar Pulsar 与 Kafka 对比二、Kafka基础三、Kafka架构及组件四、Kafka集群操作五、Kafka的JavaAPI操作六、Kafka中的数据不丢失机制七、Kafka配置文...
IT管理者的自白:技术让我坐上了会议桌,但业务语言让我在桌前有发言权
正文开始 技术语言侧重细节和过程 业务语言强调结果和价值 技术语言多用专业术语 业务语言倾向通用词汇 技术语言解释'如何做' 业务语言阐明'为什么做'和'带来什么好处' '我们用了React前端框架,...
Hive窗口函数保姆级教程
在SQL中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。但是有时我们想要既显示聚集前的数据...
36个顶级数据分析方法与模型!
好的数据分析师不仅熟练地掌握了分析工具,还掌握了大量的数据分析方法和模型。 今天从以下6个维度36种分析模型和方法逐个简略介绍,赶紧点赞收藏! 战略与组织 质量与生产 营销服务 财务管理 ...
360商业化基于Doris的统一OLAP应用实践
导读:Akin 业务场景 在正式介绍 Apache Doris 在 360 商业化的应用之前,我们先对广告业务中的典型使用场景进行简要介绍: 实时大盘: 广告账户的实时消费数据场景: 实时数仓演进 第一代架构 ...
3 小时搞定 5 万字段!LLM 自动生成数据字典实战指南
“十万字段,没有一个注释,交接时你崩溃过吗?” 相信我,你不是一个人在战斗。写数据字典,这活儿又累又不讨好,但偏偏重要到不行。 上个月我们团队接手一个“祖传”数据库,15 张核心表,上...
2万字长文,最全面的Hive开窗函数讲解和实战指南(必看)
导读: 文章来源于:白程序员的自习室 预计阅读需:20分钟 分享这篇好文的原因是我觉得契合我最近写作的主题【Hive开发】,《大数据阶梯之路》公众号内分享的文章也都是我经过挑选的,欢迎大家...
2万字揭秘阿里巴巴数据治理实践经验
00 前言 阿里巴巴一直将数据作为自己的核心资产与能力之一,通过多年的实践探索建设数据应用,支撑业务发展。在不断升级和重构的过程中,我们经历了从分散的数据分析到平台化能力整合,再到...
2024版最新最强大数据面试宝典
此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题,你的大数据能力将会大大提升,进入大厂指日可待! 目前已经更新到第5版,广受好评! 复习大数据面试题,看这一套...











