ChatGPT、Claude的数据分析能力已经到了何种水平?
ChatGPT 4o现在也具备了该能力,但距离Claude 3.5有差距,比如针对案例一,其识别出的数据明显不准确,200602的离网用户数被识别为了52000,但肉眼可见的数据应该在70000以上。 针对案例二,把...
为数据仓库设计一个完美的指标体系
正文开始: 一、什么是数据指标体系? 数据:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽...
领导问:那个信息部门一天到晚在做什么?
一谈起企业数字化转型建设,就不得不说一下信息部门,在整个数字化建设过程中不同的企业由于对数字化认知的不同,信息部门要么被重视,要么被边缘化,在数字化价值体现难的情况下信息部门的地位...
2万字揭秘阿里巴巴数据治理实践经验
00 前言 阿里巴巴一直将数据作为自己的核心资产与能力之一,通过多年的实践探索建设数据应用,支撑业务发展。在不断升级和重构的过程中,我们经历了从分散的数据分析到平台化能力整合,再到...
Hive知识体系保姆级教程
Hive涉及的知识点如下图所示,本文将逐一讲解: 正文开始: 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功...
五万字 _ Flink知识体系保姆级总结
本文目录: 一、Flink简介二、Flink 部署及启动三、Flink 运行架构四、Flink 算子大全五、流处理中的 Time 与 Window六、Flink 状态管理七、Flink 容错八、Flink SQL九、Flink CEP十、Flink CDC...
数仓指标体系搭建实战
正文 曹雷 | 作者 滴滴技术 | 来源 指标体系 1. 痛点分析 业务、技术、产品 业务视角 业务分析场景指标、维度不明确; 频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐; 用户分析具体...
大数据之数据治理体系全面指南
好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。 如何构建企业数据治理体系?企业数据治理过程需要注意哪些问题?总体而言,不能一口...
小米基于Spark3.1搭建数据开发平台实践
1. Multiple Catalog 落地与应用 2. Hive SQL 迁移 Spark SQL 3. 离线场景下 Spark 的稳定性与性能优化 4. 未来规划 5. 问答环节 01 2.Spark3的元数据管理 Hive SQL迁移 Spark SQL 2.语法...
《可信数据空间标准体系建设指南(2025年版)》正式发布
2025年6月29日,《可信数据空间标准体系建设指南(2025年版)》(以下简称《指南》)正式发布。 该指南由可信数据空间发展联盟组织120家成员单位共同完成,旨在构建一套体系完备、层次清晰、协...













