《可信数据空间标准体系建设指南(2025年版)》正式发布
2025年6月29日,《可信数据空间标准体系建设指南(2025年版)》(以下简称《指南》)正式发布。 该指南由可信数据空间发展联盟组织120家成员单位共同完成,旨在构建一套体系完备、层次清晰、协...
Flink+Kafka存在诸多限制,下一代实时存储组件来解决!
5. Fluss 开源 当前业界呈现出一个显著的趋势,即大数据的处理正在从离线模式转向实时化。我们可以观察到,多个行业和应用场景都在进行实时化的演进。例如,互联网、车联网和金融等领域都正通过...
一文讲透数据仓库命名规范
正文开始 引言 在当今数据驱动的商业环境中,数据仓库已成为企业决策的核心支撑。然而,随着数据量的急剧增长和数据复杂性的提高,如何有效管理和使用这些数据成为了一个巨大的挑战。其中,一个经常...
MySQL数据库基础(六):DDL数据库操作
DDL数据库操作 一、MySQL的组成结构 注: 一个MySQL DBMS可以同时存放多个数据库,理论上一个项目就对应一个数据库。如博客项目blog数据库、商城项目shop数据库、微信项目wechat数据库。 一个数...
我,数据开发者,找不到工作
故事从某大厂的P7失业了开始....... 一、螺丝钉的困境 “判决书” 需求的“万箭穿心” “数据神坛” “系统深渊” 绩效“B” 二、我们落伍了 曾经很牛逼 配置机器 提线木偶 “舒适温泉” 生锈的...
数据安全:一文讲透数据使用中的安全技术(访问、防泄漏、脱敏、水印、审计和监测)
目的:为不同角色分配完成职责所需的最小数据访问权限。 实现方式: a) 身份认证:确认用户身份 b) 权限分配:基于角色和职责分配访问权限 c) 最小授权原则:只给予完成任务所需的最小权限 技术...
Hive SQL优化笔记
hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。 其中在开发过程中主要涉及到的可能是SQL优化这块。 优化的核心思想是: 减少数据量(例如分区、列剪裁); 避免数据倾斜(例如加...
「数仓建设篇」数仓总线矩阵架构设计
如何设计一套切实可行的数据仓库呢? 帮助数据架构师清晰地梳理整个数据体系 帮助决策者(Boss)从宏观的角度了解数据仓库的整体情况 让所有的数据仓库参与者了解数据仓库的设计 如何编写总线矩...
数仓中数据清洗的方法
在数据采集的过程中,需要从不同渠道获取数据并汇集在数仓中,采集的原始数据首先需要进行解析,然后对不准确、不完整、不合理、格式、字符等不规范数据进行过滤清洗,清洗过的数据才能更加符合...
MySQL数据库基础(十):DQL数据查询语言
DQL数据查询语言 一、数据集准备 插入数据: 二、select查询 三、简单查询 四、条件查询 1、比较查询 2、范围查询 3、逻辑查询 4、模糊查询 5、非空查询 五、排序查询 六、聚合查询 之前我们做...













