如何保障数仓数据质量?
导读 文|傅宇康 有赞数据报表中心为商家提供了丰富的数据指标,包括30+页面,100+数据报表以及400+不同类型的数据指标,它们帮助商家更合理、科学地运营店铺,同时也直接提供分析决策方法供商...
菠菜公司开了60K,坐牢还是坐班?
大家好,今天分享的内容有点劲爆。 事情还得从我们提高班同学面试过程说起。 起因是找工作的过程中猎头推了一个岗位,办公需要remote的方式,通过zoom远程办公。这个同学的offer就属于这类,并...
史上最全数据资产资本化知识地图(最新版):数据资产化全流程、数据资本化八大模式、数据资产入表实务、数据运营与治理、场景化应用案例
本文来源:优享智库 一、政策与制度框架 国家战略定位 数据列为第五大生产要素(2019年首次提出),2024年“会计处理暂行规定”实施,标志数据资产正式入表。 “数据二十条”(2022)构建数据产...
PostgreSQL基础(十一):PostgreSQL的锁介绍
PostgreSQL的锁介绍 PostgreSQL中主要有两种锁,一个表锁一个行锁 PostgreSQL中也提供了页锁,咨询锁,但是这个不需要关注,他是为了锁的完整性。 一、表锁 表锁显而易见,就是锁住整张表。表锁...
Spark的两种核心Shuffle详解
由于 Shuffle 涉及磁盘的读写和网络 I/O,因此 Shuffle 性能的高低直接影响整个程序的性能 Spark Shuffle Spark Shuffle 分为两种:一种是基于 Hash 的 Shuffle;另一种是基于 Sort 的 Shuffle...
数仓建设中最常用模型–Kimball维度建模详解
先来介绍下此书,此书是基于作者 60 多年的实际业务环境而总结的经验及教训,为读者提供正式的维度设计和开发技术。面向数仓和BI设计人员,书中涉及到的内容非常广泛,围绕一系列的商业场景或案...
ETL的灵魂:调度系统
ETL的灵魂:调度系统 ================================================== 大家好,我是一哥,最近有小伙伴私聊我说他们的调度系统经常出问题,领导要求大家人在哪电脑背到哪,家庭生活一地鸡...
2万字长文,最全面的Hive开窗函数讲解和实战指南(必看)
导读: 文章来源于:白程序员的自习室 预计阅读需:20分钟 分享这篇好文的原因是我觉得契合我最近写作的主题【Hive开发】,《大数据阶梯之路》公众号内分享的文章也都是我经过挑选的,欢迎大家...
干货下载 _ 自然堂集团ChatBI(AI+BI)建设与实践案例精讲
当下大模型技术如火如荼,为BI领域带来了前所未有的想象力和创新空间。相较传统BI,ChatBI不再局限于传统的报告和仪表板,而是向着更加智能、更简洁的交互式方向发展,有效降低了企业数据应用门...
一文读懂AI黑话:31个最流行的大模型术语(图解珍藏版)
一、时代基石 构成整个大语言模型时代的根基,是理解一切的前提。 1. 生成式AI (Generative AI) 2. Transformer架构 (Transformer Architecture) 3. 基础模型 (Foundation Models) 4. 预训练与...














