“我们终于把数据孤岛打通了!集团所有系统的数据全接进来了,一万多张表!”
前阵子,一家传统制造企业的朋友打电话给我,声音里透着那种项目验收后的亢奋。
我心里咯噔一下,但还是问:”牛啊!那业务用起来怎么样?”
电话那头沉默了几秒,声音明显低了八度:”核心业务在用的……大概一百来张吧。”
1万 vs 100。
这个数字对比,扎心不?
轰轰烈烈搞集成,冷冷清清看使用。
每次我分享这个故事,总有人反驳:
“大鱼,你这是短视!业务都是急功近利的,如果都等他们提需求,数据工作不就永远被动挨打?我们做数据的,不应该未雨绸缪吗?”
好问题。
当下的业务价值 vs 未来的战略储备。
今天,我想认真回答这个问题。
01
“应接尽接”的正确废话
为什么企业都热衷于”大一统”式的数据采集?
因为政治正确啊!
“打破数据孤岛”、”构建统一数据平台”、”实现数据资产化”——这些口号在任何数据战略会议上都是第一条。
谁敢反对?谁反对谁就是”格局小”、”不懂数据价值”。
逻辑链条清晰得让人无法反驳:
于是,数据治理变成了一个纯粹的”供给侧”工程。
项目KPI特别好定:
这些数字在汇报PPT上,特别唬人。
但我们都在刻意回避一个问题:这些数据,业务真的需要吗?
就像你开了一家餐厅,把全世界的食材都采购回来,冷库塞得满满当当。
结果呢?客人只点蛋炒饭。
剩下的食材?慢慢烂在库里。
02
“战略储备”还是”战略负债”?
“就算现在用不上,先存着总没错吧?”
这句话的杀伤力,堪比”来都来了”、”大过年的”。
它让我们心安理得地把数据治理变成了仓鼠囤货——反正硬盘便宜,存就完了。
但大家可能忽略了一个残酷的事实:数据的维护成本,远高于采集成本。
我给你看一组某制造业集团的真实数据:
数据资产现状:
年度成本明细:
总计:1010万/年
关键是:95%的成本在维护没人用的数据。
但要让这1.2PB的表保持”可用”、”可信”?,还有更多的工作要做。
这是个无底洞。
更要命的是,业务系统在不断迭代:
那些被”战略储备”的数据,会以光速腐化成”数据僵尸”——占着资源,却谁也不敢用。
所以,你以为你在做”战略储备”,其实你在积累”战略负债”。
当然,我必须说明:某些行业的”战略储备”是刚需。
比如:
明确的边界清晰的用途
03
真正的未雨绸缪:建”高速公路”而非”停车场”
说了这么多,难道我们就该彻底躺平,天天等业务来喂需求?
当然不是。
需求驱动 ≠ 被动等待。
敏捷响应
打个比方:
你不需要把全国每条小路都修成高速公路,但你必须确保几条连接核心城市的主干道畅通无阻。
在数据治理里,这些”主干道”就是:
把80%的精力,投在这20%的核心数据上。
每一个业务问题都可能复用的底盘数据
剩下的?等需求来了再说。
“大鱼,你说得轻松!统一主数据才是最难的!”
没错,我知道。
一个”客户”的定义,就能让销售、市场、财务吵上三个月:
怎么办?
别追求一步到位的完美,先让一个场景跑起来。
比如先统一”活跃客户”的定义,让营销部门用起来,产生价值,形成示范效应。其他部门看到好处,自然会主动配合。
04
把方向盘交给业务
数据治理最大的误区,就是把它当成IT项目。
错了,大错特错。
数据治理是业务项目,只是恰好需要IT来实现。
我见过一些真正跑通的企业,都有这么几个特点:
1. 设立数据产品经理
这个角色不是传统的数据管理员,而是:
2. 建立“治理预案池”
3. 建立”数据市场”机制
4. 引入使用率指挥棒
简单粗暴但有效:
幸运的是,随着AI辅助治理工具的成熟,自动化的血缘分析、质量稽核,正在降低数据维护的边际成本。
技术能帮你更高效地维护,但它不能代替你做出“哪些数据值得被维护”的战略决策。
当”被使用”成为衡量数据价值的唯一标准时,面子工程就会原形毕露。
05
结语:少即是多,克制即是智慧
回到最开始那个问题:
采集1万张表,只用100张,到底是谁的错?
谁都没错,错的是我们对”大”的执念。
我们总以为:
但真相是:
真正的数据高手,不是数据的收藏家,而是数据的极简主义者。
他们知道:
所以,别再纠结为什么”只用了100张”。
真正该纠结的是:这100张表,你用透了吗?
最后,送你一句话:
数据治理的终极境界,不是”应采尽采”,而是”应删尽删”。
敢删,才是真本事。
对了,你们公司数据湖里有多少张表超过半年没人访问了?
别说你不知道。
你只是不敢查。









暂无评论内容