排序
6个月vs6年,为什么有人一直停在取数岗?
正文开始 注:本故事基于多人的实际经历改编而成。 序:一条深夜的微信 2023年12月的最后一个工作日,凌晨两点,我收到了老王的微信:'老师,晋升结果出来了,我又没过...' 消息框上方显示着他...
Linux性能问题分析流程与性能优化思路
排查顺序 1. 整体情况 top/htop/atop 命令查看进程/线程、CPU、内存使用情况,CPU使用情况; dstat 2 查看CPU、磁盘IO、网络IO、换页、中断、切换,系统I/O状态; vmstat 2 查看内存使用情况,内...
SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比
产品概述 Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 A...
全面认识数仓开发之数据指标体系
什么是数据指标体系? 数据指标指标数据 数据:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、...
抖音集团数据血缘深度应用:架构、指标与优化实践
正文开始 导读 本次分享将聚焦于资产体系中的全链路血缘,文章将围绕下面四点展开:本次分享将聚焦于资产体系中的全链路血缘,文章将围绕下面四点展开: 1. 抖音集团血缘整体介绍 2. 抖音集团...
Paimon数据丢失的常见场景和注意事项(避坑版)
Paimon数据丢失的常见场景和注意事项(避坑版) 大家好,我们又见面了。今天的内容很短小,关于写Paimon数据丢失的几种场景。 Paimon是数据湖领域最被广泛使用的框架之一。数据入Paimon的过程中造...
一文学完所有的Hive SQL(两万字最全详解)
一文学完所有的Hive SQL(两万字最全详解) ================================================== 进入主页,点击右上角“设为星标” 比别人更快接收好文章 Hive SQL 大全 本文基本涵盖了Hive日...
DeepSeek在数据领域的100个应用场景
DeepSeek作为一款前沿的人工智能技术,以其卓越的适应性和多功能性,在众多领域展现出非凡的应用价值。 以下是100个DeepSeek在数据领域的应用场景,展示了DeepSeek如何为数据行业注入智能化动力...
MySQL数据库基础(十二):子查询(三步走)
子查询(三步走) 一、子查询(嵌套查询)的介绍 在一个 select 语句中,嵌入了另外一个 select 语句, 那么被嵌入的 select 语句称之为子查询语句,外部那个select语句则称为主查询。 主查询和子...
「数仓建设篇」从0到1搭建无忧搬家数仓
一、前言 1.1 背景 从而有以下问题: 1.直接从ods贴源层取数据,业务研发侧一改造则下游链路级联影响改动很大 2.各数据分析下游从源头贴源层就直接各自依赖计算,数据链路十分零散不好管理 3.贴...








