数据基础设施尚未得到足够重视 | 奇点云何夕
奇点云 2023-11-26

本文提出,数据要素市场出现了“剃头担子一头热”的情况,其背后有两大类原因:其一,大量待研究问题解决前,产业界不愿轻易进入实操环节;其二,国内企业普遍数字化程度不高的情况下,要推广数据要素市场,企业侧将面临大量实践性问题。

作者拆解细化了这两大类问题,进而探讨了相关对策。

作者何夕,战略咨询专家,写于2023.11.22

 

自从国家层面定义数据要素市场以来,数据上来看,整个要素市场似乎进入了快速发展的快车道。

 

根据《中国数据要素市场发展报告》的预测,2021年我国数据要素市场规模达815亿元,预计“十四五”期间市场规模复合增速将超过25%,数值将突破 1749 亿元,整体上进入高速发展阶段。

 

另一方面, 自2017年开始,相关政策文件密集出台,在推动各省市数字化转型同时,数据领域也有了较大的突破,根据东方证券数据,截止2022年8月,全国数据交易所已达40家,同时有多省成立了政府主导的大数据集团。

 

然而,在貌似火热的市场背后,却呈现出“剃头担子一头热”的情况:数据要素市场的讨论参与者多为学界、机构和政界人士,而产业界和企业数据从业者却对数据要素仅保持关注,仅有少数人加入到数据要素市场的讨论中来。

 

这种现状的背后,体现了当前数据要素市场面临的两大类问题:

一是仅仅对于数据要素市场的学术讨论,就存在大量的待研究和解决问题,在有定论之前,产业界并不愿意轻易进入到数据要素市场的实操环节;

二是数据从业者普遍不看好数据要素市场在实践过程中的落地,认为在国内企业普遍数字化程度不高的当下,要推广数据要素市场,企业侧面临大量实践性问题。

 

两类问题提醒我们,既要关注上层的理论研究和治理结构的搭建,也要关注企业实践和基础产业链的搭建。

 

 

第一大类问题中,综合公开数据和各方研究材料,可以总结出大家普遍认为数据要素市场的建设和推广会面临的四类难题:数据确权、数据定价、流通交易、协同治理

 

1. 数据确权难

- 数据所有权、使用权、经营权有待清晰界定。国家还没有针对数据产权归属问题出台法律。在实际交易中,数据权属的判断主要通过基础法律理念和朴素的法感。这种数据权属不明的情况使大部分拥有数据资源的企业不敢参与数据交易。

 

-  数据在大规模应用过程中由于其泛化能力和涌现能力产生的新数据,既不属于个人、企业和政府等原始数据所有者,也不属于数据产品持有人等数据委托经营的委托人和数据使用者,这会导致新的数据确权混乱。

 

2. 数据定价难

- 数据要素因其生产复杂性、可复制性、时效性以及非标准性,而造成定价困难。首先,数据要素产生的过程包括了数据采集、存储、计算、分析应用等众多环节,涉及众多贡献者、参与商,每一个环节都需要进行价值计量,因此带来阶段性定价的困难。其次,数据资源具有可复制性、时效性以及非标准性等特点,其实际价值会随着复制次数及供需关系改变而改变,难以进行价值定价。

- 数据定价的高低在于数据质量,而非数据规模大小,当前我国数据要素质量较低,数据价值不高,在管理、标准化、融合应用方面有待提高。

 

3. 流通交易难

- 大部分的数据集中在政府、国有企业和互联网平台企业等少数平台手中。这些数据的流动、应用、价值挖掘的程度都不够,造成了大量的浪费,一言以蔽之,“政府数据不公开,互联网公司数据难公开”。

 

- 我国数据资源化、资产化等过程尚未完成,数据要素权属界定、分类分级、估值定价、收益分配等方面缺乏系统框架,数据要素流通难以制定明确的规则。保障参与各方权益的共识还未达成,参与方之间信任机制的建立缺乏规则的指引。

 

- 当前不同区域间、人群间存在着数字素养的差异,即对数据要素的认知和利用水平的差异,这可能会带来数据收益分配的不公平情况出现。

 

4. 协同治理难

- 我国数据交易基础环境还不完善。首先,目前没有统一的数据交易平台和成熟的监管机制,尚未建立统一的数据要素登记制度、权威的全国数据登记平台。其次,近年来我国积极引导数据交易在场内进行。但我国基于平台的场内数据交易情况并不理想,仅占5%左右的水平。最后,数据交易所的层次不同、水平不等对数据要素市场带来了一定程度的干扰。

 

- 我国数据要素市场处于初始发展阶段,目前还没有针对数据要素的具体法规。数据权属确定法律制度、数据要素市场交易法律制度、数据要素市场监管法律制度等有待健全。具体的数据流通实践形式、流通市场准入等方面还没给出清晰的法律界定。主体难以把握监管和处罚尺度,对责任的判断没有稳定预期。

 

- 数据在大规模应用过程中由于其泛化能力和涌现能力,会关联产生大量新数据,极有可能会涉及到个人隐私、企业秘密和国家及公共安全。这类新信息收集获取并不适应于当前法律法规,或将成为数据安全面临的新挑战。

 

- 当前安全治理技术手段发展水平有限,还无法完全实现对数据的控制,导致涉及秘密和隐私数据失控,蕴含极大风险隐患,阻碍了各流通参与主体的意愿。

 

 

 

针对第二大类问题(数据要素市场要建立,在企业侧存在大量的实践性问题要解决,这些实践性问题会影响到企业对数据要素市场的信心和投入度问题),我们认为,数据要素要产业化、价值化,首先应当解决企业侧数据资源化和资产化的问题。我们建立了一个“战略-结构-机制-技术”的多层框架,尝试去理解企业面临的数据问题:

 

1. 战略

大多数企业尚未提升数据要素在企业内部的战略重要性,极大地延缓了数据要素产业生态的成型。

 

一般意义上而言,数据要素的产业链包含了数据采集、数据存储、数据加工、数据流通、数据分析、数据应用、生态保障等等。然而,在产业链的层面,国内的数据产业面临“碎、破、少”的企业数字化现状挑战,无法真正建立有效的产业分工,实现规模化发展。

 

碎,指的是企业的数据需求和供给缺乏统一规划和管理,呈现碎片化、个性化的特征,很少能出现数据领域真正的产业级机会。

 

大部分数据需求仅仅停留在数据可视化阶段,各个业务部门根据自己的需求往往选择不同的数据分析和应用,并且往往要求产品和应用进行个性化改造,缺少统一规划和管理,数据需求分散而且无法统一;从数据供给而言,很大部分生产数据的应用和系统不仅来源多样,而且都存在深度个性化定制和开发不规范的情况,甚至并未提供标准化的数据规范和数据接口,极大地加深了数据项目开展的难度,拉长了数据项目的实施周期。

 

破,指的是企业对数据治理的重要性认知不足,数据资产化程度不高,资产化数据占比低,企业仅仅开展了局部数据治理工作,全局数据质量通常不高,数据很“破”。其中,缺乏统一的战略规划、缺乏统一的标准规范、缺乏统一的管理组织,是其中最常见的一种情形,很多公司甚至连信息化时代的主数据治理和管理都尚未完成,更不要说数据资产化所必须要开展的元数据治理和管理。在实践过程中,经常存在“数字化补课”的情况。

 

少,指的是企业对数据资产和资产化所需人才没有概念,缺少现状盘点和评估,然而实践过程中企业却通常都存在存量数据少、数据增量少、数据维度少、数据人才少等等问题。由于大多数企业对业务数据都是一次性使用,业务数据存储策略上一般都不超过半年时间,甚至只有7天,导致实际可用数据量很少。传统企业全局数据量通常在几TB到几十TB之间,甚至用一台电脑就能装下。大部分企业没有专职的数据分析人员,通常由业务人员兼任。

 

以上现状,一方面源于企业对于数据的战略重要性认知不足,另一方面,也是企业对于数据如何实现要素化并没有清晰认知的表现。

 

未来需要持续提升企业数字化水平,既包括大企业在数据驱动业务方面能力的提升,也包括中小企业在使用数据能力上的提升。绘制企业架构(EA)或许是一种可以尝试的企业数字化方法,让企业的技术架构等等能充分反映业务的需要、管理的需要,从而实现数字化时代企业能力的全面提升,但要注意,不要让方法抢了目标的注意力。

 

本质上,是要从战略上重视和发掘“规模化数据供给”和“规模化数据消费”的机会,并匹配政策机遇,提升整体数据产业规模。

 

2. 结构

现有企业的业务、组织和技术结构无法应对“A用B的数据”问题。

 

最小化而言,数据要素流通要解决的是一个“A用B的数据”问题,也即不同主体的用户之间进行数据的安全共享,而要素市场定义的是通过市场作为配置手段。

 

在社会交互的人类活动中,“A用B的数据”是一个漫长的惯例化过程,首先A观察B的数据,给出需求和描述,其次B给予积极或消极的回应,消极回应则过程终止,积极过程则过程继续;当B给予A数据,A则回应以积极或消极反馈……这个过程重复几轮,如果一直都是积极过程,那么,A和B之间的交互就会成为类型化行动,但是,一旦超越了既定的数据范畴,那么,这个过程就需要重新来一遍。

 

实践过程中,影响该过程持续达成的影响因素既有数据如何驱动业务价值实现的问题,也有技术上面临解决数据存通用的数据架构、数据产品选型等等问题,最终都会表达成组织的问题——如何区分权责利,如何建设和保障数据组织,如何招募数据人才,如何设计激励政策。

 

业务、技术和组织的结构性问题,不管是在数据驱动管理的理论上,还是在数据管理的实践上,目前都缺乏体系化的案例研究。一般而言,从零到一的建设过程需要依赖于由丰富经验的数据顾问(内部/外部)展开,如果缺乏这方面的认知和投入,则数据资产化都无法开展,更不要说之后的资产要素化过程。

 

3. 机制

如何统一数据标准和规范,并持续面向数据资产实施管理动作,以及解决数据相关的成本和收入衡量问题。

 

简单而言,要梳理的是数据要素“谁拥有,谁使用,谁投入,谁受益”等一系列的流程、制度、责任分工等等,并最终在相关产品上进行管理过程的固化,让数据管理和运营机制紧密结合。

 

这其中,“用产品做管理”是国内在数据治理和管理过程中最需要注意改善的部分,也是和国外在数据文化上差别最大的部分。比如说,同样是实施数据质量管理,美国公司在实施过程中通常会把质量管理的一系列policy在数据平台上进行沉淀,形成policy库,多的可以到4000-5000条,通过产品来实施自动化管理;国内则仍然沿用了“人治”的方式,不重视工具,更不重视用相关工具来记录policy来管理数据。机制一定要落在产品上,这是当前企业在迈向数据资源化和资产化上的最大挑战。

 

4. 技术

数据基础设施尚未得到足够重视,需要进入企业核心系统。

 

数据要素和其他要素资源不同,数据的要素化需要完整的数据基础设施,至少要包含数据采集、数据存储、数据加工、数据分析/数据应用在内,才能实现数据的资产化和价值化,进而实现要素化。企业内部,数据要素化主要在PaaS层完成,其对应的数据产品被称为数据平台。

 

当前,在国家基础软件的定义中,仅包含操作系统、数据库和中间件,并未将数据平台等最新的数据产品包含在基础软件中;在企业实操层面,如何开展产品选型和技术实施,搭建长期可用的数据平台,开展数据资产化建设过程一直都是难题,根据Gartner的统计,大数据项目仅有不到30%的成功率。

 

国家层面要提升数据基础设施的重要性,把数据平台加入到基础软件中,并把基础软件提升到和数据要素市场匹配的政策高度上来。当前的数据要素市场更强调数据交易生态的构建,而较少提及数据产业生态的构建和扶持。

 

作者:何夕,奇点云资深战略咨询专家,中国通信标准化协会大数据技术标准推进委员会数据中台方向首批专家委员、数据应用工作组副组长。

 

热门搜索:数据中台数据云平台客户数据平台CDP数据智能数据应用鞋服地产美妆商超家装数据资产数据治理数据可视化

联系我们:
电话:400-080-0326     邮箱:business@startdt.com     时间:09:00 - 18:00(工作日) 杭州:浙江省杭州市余杭区良睦路 1399 号梦想小镇互联网村 15、17 幢(总部) 北京:北京市海淀区大钟寺东路 168 号中嘉大厦 402 室 上海:上海市徐汇区虹漕路 88 号 H88 越虹广场 B 栋 9 楼 B、C 单元 深圳:广东省深圳市南山区 高新南六路6号 迈科龙大厦 1402

2016 - 2022 StartDT.com 版权所有 ICP证: 浙ICP备17004958号 法律声明及隐私政策

浙公网安备 33011002015629号