大数据分享 第11页
数据管理、数据治理、数据资产管理_ 三者异同-22l2-技术成就未来

数据管理、数据治理、数据资产管理_ 三者异同

40188 文章导读: 如果要用一张图来描述它们三者之间的关系,你更赞成以下两幅图的哪个? 图1:数据治理包含数据管理,数据治理提出了数据管理的目标、架构和蓝图,数据管理是数据治理的技术实...
admin的头像-22l2-技术成就未来admin1个月前
03311
9000字详解数据治理和数据分类分级-22l2-技术成就未来

9000字详解数据治理和数据分类分级

01 数据分类分级提出的背景 数据的价值 1.数据爆炸时代,数据量呈指数级增长 我们要如何看待数据这个话题。数据大爆炸已经成为了一个趋势,随着数字化转型的步伐逐步加快,数据的诞生不断加快。...
admin的头像-22l2-技术成就未来admin3个月前
04412
MySQL数据库基础(七):DDL数据表操作-22l2-技术成就未来

MySQL数据库基础(七):DDL数据表操作

DDL数据表操作 特别注意: 一、数据表的基本操作 1、数据表的创建 创建 => create 数据表 => table 创建 + 数据表 = create table 数据表名称 基本语法: 案例:创建一个admin管理员表,...
admin的头像-22l2-技术成就未来admin2个月前
02910
Spark SQL 复杂类型高阶函数详解-22l2-技术成就未来

Spark SQL 复杂类型高阶函数详解

spark sql 2.4 新增了高阶函数功能,允许在数组类型中像 scala/python 一样使用高阶函数 背景 复杂类型的数据和真实数据模型相像,但是使用sql操作较为困难,一般需要借助于 explod/collect_lis...
admin的头像-22l2-技术成就未来admin2个月前
0319
关于数据中台的深度思考与总结-22l2-技术成就未来

关于数据中台的深度思考与总结

本文将总结下数据中台的相关理论知识。Flink平台化需要改进的点等等。 参考:《数据中台》 数据中台 数据汇聚 数据汇聚是数据中台必须提供的核心工具,把各种异构网络、异构数据源的数据方便地...
admin的头像-22l2-技术成就未来admin3个月前
0438
数仓中数据清洗的方法-22l2-技术成就未来

数仓中数据清洗的方法

在数据采集的过程中,需要从不同渠道获取数据并汇集在数仓中,采集的原始数据首先需要进行解析,然后对不准确、不完整、不合理、格式、字符等不规范数据进行过滤清洗,清洗过的数据才能更加符合...
admin的头像-22l2-技术成就未来admin1个月前
05015
如何重新定义LLM大模型的数据质量?-22l2-技术成就未来

如何重新定义LLM大模型的数据质量?

1粉丝:我们团队习惯了做业务数据的质量监控,有成熟的完整性、一致性、准确性校验方法。但现在接触音频、图像数据,以前的经验好像都用不上。这种非结构化数据,质量到底该怎么评估和提升? 说...
admin的头像-22l2-技术成就未来admin1个月前
0409
长文详解HiveSQL执行计划-22l2-技术成就未来

长文详解HiveSQL执行计划

长文详解HiveSQL执行计划 ================================================== 本文目录:一、前言二、SQL的执行计划 一、前言 可以说执行计划是打开SQL优化大门的一把钥匙 要想学SQL执行计划...
admin的头像-22l2-技术成就未来admin3个月前
04611
DeepSeek智能数据治理整体方案-22l2-技术成就未来

DeepSeek智能数据治理整体方案

DeepSeek智能数据治理整体方案 ================================================== 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: 图片 图片说明: ...
admin的头像-22l2-技术成就未来admin2个月前
0336
MySQL数据库基础(十四):E-R模型及表间关系-22l2-技术成就未来

MySQL数据库基础(十四):E-R模型及表间关系

E-R模型及表间关系 一、E-R模型的使用场景 对于大型公司开发项目,我们需要根据产品经理的设计,先使用建模工具, 如:power designer,db desinger等这些软件来画出实体-关系模型(E-R模型) 然后...
admin的头像-22l2-技术成就未来admin2个月前
0469