大数据分享 第18页
ETL的灵魂:调度系统-22l2-技术成就未来

ETL的灵魂:调度系统

ETL的灵魂:调度系统 ================================================== 大家好,我是一哥,最近有小伙伴私聊我说他们的调度系统经常出问题,领导要求大家人在哪电脑背到哪,家庭生活一地鸡...
admin的头像-22l2-技术成就未来admin2个月前
0466
2万字长文,最全面的Hive开窗函数讲解和实战指南(必看)-22l2-技术成就未来

2万字长文,最全面的Hive开窗函数讲解和实战指南(必看)

导读: 文章来源于:白程序员的自习室 预计阅读需:20分钟 分享这篇好文的原因是我觉得契合我最近写作的主题【Hive开发】,《大数据阶梯之路》公众号内分享的文章也都是我经过挑选的,欢迎大家...
admin的头像-22l2-技术成就未来admin3个月前
0326
干货下载 _ 自然堂集团ChatBI(AI+BI)建设与实践案例精讲-22l2-技术成就未来

干货下载 _ 自然堂集团ChatBI(AI+BI)建设与实践案例精讲

当下大模型技术如火如荼,为BI领域带来了前所未有的想象力和创新空间。相较传统BI,ChatBI不再局限于传统的报告和仪表板,而是向着更加智能、更简洁的交互式方向发展,有效降低了企业数据应用门...
admin的头像-22l2-技术成就未来admin1个月前
0476
一文读懂AI黑话:31个最流行的大模型术语(图解珍藏版)-22l2-技术成就未来

一文读懂AI黑话:31个最流行的大模型术语(图解珍藏版)

一、时代基石 构成整个大语言模型时代的根基,是理解一切的前提。 1. 生成式AI (Generative AI) 2. Transformer架构 (Transformer Architecture) 3. 基础模型 (Foundation Models) 4. 预训练与...
admin的头像-22l2-技术成就未来admin2个月前
0256
平安人寿ChatBI:大模型智能化报表的深度实践-22l2-技术成就未来

平安人寿ChatBI:大模型智能化报表的深度实践

正文开始 导读 1. 项目背景和目标 2. 解决方案 3. 产品效果 4. 落地挑战 5. 总结和展望 6. 问答环节 分享嘉宾|刘行行 中国平安人寿保险股份有限公司 财企及产品数据服务组分组经理 编辑...
admin的头像-22l2-技术成就未来admin1个月前
0346
一文读懂Hive底层数据存储格式(好文收藏)-22l2-技术成就未来

一文读懂Hive底层数据存储格式(好文收藏)

性能也能得到数量级的提升 Hive 数据存储常用的格式如下: 行式存储 文本格式(TextFile) 二进制序列化文件 (SequenceFile) 列式存储 行列式文件(RCFile) 优化的行列式文件(ORCFile) Apa...
admin的头像-22l2-技术成就未来admin2个月前
0526
16种ETL平台优劣对比,谁才是企业的最佳选择?-22l2-技术成就未来

16种ETL平台优劣对比,谁才是企业的最佳选择?

1、数据源层 (Data Sources Layer) 2、开发层 (Development Layer) 3、控制层 (Control Layer) 4、执行层 (Execution Layer) 5、存储层 (Storage Layer) 三、全面ETL平台对比分析 1、开源平台评...
admin的头像-22l2-技术成就未来admin3个月前
0346
PostgreSQL基础(九):PostgreSQL的事务介绍-22l2-技术成就未来

PostgreSQL基础(九):PostgreSQL的事务介绍

PostgreSQL的事务介绍 一、什么是ACID(常识) 在日常操作中,对于一组相关操作,通常要求要么都成功,要么都失败。在关系型数据库中,称这一组操作为事务。为了保证整体事务的安全性,有ACID这...
admin的头像-22l2-技术成就未来admin2个月前
0446
SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比-22l2-技术成就未来

SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

产品概述 Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 A...
admin的头像-22l2-技术成就未来admin2个月前
0476
Shuffle慢?数据倾斜?Spark 1.0~4.0调优秘籍-22l2-技术成就未来

Shuffle慢?数据倾斜?Spark 1.0~4.0调优秘籍

一、背景 Spark SQL 通过缓存优化、分区管理、统计信息利用和动态执行计划调整等技术,显著提升 DataFrame 或 SQL 任务的性能。合理配置以下策略可解决数据倾斜、内存溢出、执行效率低下等常见...
admin的头像-22l2-技术成就未来admin2个月前
0256