关于数据中台的深度思考与总结
本文将总结下数据中台的相关理论知识。Flink平台化需要改进的点等等。 参考:《数据中台》 数据中台 数据汇聚 数据汇聚是数据中台必须提供的核心工具,把各种异构网络、异构数据源的数据方便地...
一篇文章教会你数据仓库之详解拉链表怎么做!
一篇文章教会你数据仓库之详解拉链表怎么做! ================================================== 前言 先分享一下拉链表的用途、什么是拉链表。 通过一些小的使用场景来对拉链表做近一步的阐...
PostgreSQL基础(八):表的基本操作(二)
表的基本操作(二) 一、视图 跟MySQL的没啥区别,把一些复杂的操作封装起来,还可以隐藏一些敏感数据。 视图对于用户来说,就是一张真实的表,可以直接基于视图查询一张或者多张表的信息。 视...
一篇讲明白 Hadoop 生态的三大部件
一篇讲明白 Hadoop 生态的三大部件 ================================================== 大数据技术的发展并不是偶然的,它的背后是对于成本的考量。集中式数据库或者基于MPP架构的分布数据库...
普通人如何抓住DeepSeek红利?(65页PPT)
下面这份PPT探讨了普通人如何利用 DeepSeek 这款通用人工智能工具来提升工作效率、学习效率和生活质量。介绍了 DeepSeek 的功能和能力,包括文本生成、语义分析、代码生成等,并展示了其深度思...
智能体工作流的七种设计模式
当前,人工智能领域正在经历一场深刻的变革。我们已经超越了通过单一提示词(Prompt)获取惊艳结果的阶段。真正的挑战在于如何构建能够自主解决复杂、多步骤问题的持久化系统。这就是**智能体工...
实时数仓演进&方案对比选型落地
实时数仓演进&方案对比选型落地 ================================================== 【作者介绍】王磊,阿里云 MVP,华院计算技术总监。 著有:《图解 Spark 大数据快速分析实战》;《off...
小米基于Spark3.1搭建数据开发平台实践
小米基于Spark3.1搭建数据开发平台实践 ================================================== 1. Multiple Catalog 落地与应用 2. Hive SQL 迁移 Spark SQL 3. 离线场景下 Spark 的稳定性与...
Flink+Kafka存在诸多限制,下一代实时存储组件来解决!
5. Fluss 开源 当前业界呈现出一个显著的趋势,即大数据的处理正在从离线模式转向实时化。我们可以观察到,多个行业和应用场景都在进行实时化的演进。例如,互联网、车联网和金融等领域都正通过...
Hive SQL底层执行过程详细剖析
Hive SQL底层执行过程详细剖析 ================================================== 点击上方卡片进入主页,然后右上角“设为星标” 比别人更快接收好文章 整体到细节 Hive Hive是什么?Hive ...














