大数据分享 第21页
MySQL数据库基础(十五):PyMySQL使用介绍-22l2-技术成就未来

MySQL数据库基础(十五):PyMySQL使用介绍

PyMySQL使用介绍 提前安装MySQL数据库(可以使用Linux系统的,也可以使用Windows版本) 一、为什么要学习PyMySQL 如何实现将100000条数据插入到MySQL数据库? 如果使用之前学习的MySQL客户端来...
admin的头像-22l2-技术成就未来admin2个月前
0615
基于大模型进行数据分类分级实操指南-22l2-技术成就未来

基于大模型进行数据分类分级实操指南

正文开始 当前,数据安全与合规性的重要性愈发凸显。如何根据数据的敏感程度进行分级,并配套相应的安全管控措施,是所有数据从业者必须面临且亟需解决的重要课题。 大模型能够理解和生成自然语...
admin的头像-22l2-技术成就未来admin2个月前
0425
Hive、SparkSQL是如何决定写文件的数量的?-22l2-技术成就未来

Hive、SparkSQL是如何决定写文件的数量的?

1. Hive 1.1 without shuffle Hive在通过SQL写文件是通过MapReduce任务完成的,如下面这个例子: 在表中插入数据后,可以hdfs对应路径下找到存储的文件 可以看到插入生成了1个文件,这是因为每...
admin的头像-22l2-技术成就未来admin2个月前
0345
数仓主题域与主题划分-22l2-技术成就未来

数仓主题域与主题划分

这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题域划分,同时会引申出主题划分,和数据域是什么,业务过程等。 这个对于大数据数仓工程师来说是必备的能力,比如当你面临着一个新业务的...
admin的头像-22l2-技术成就未来admin1个月前
0495