财新传媒 财新传媒

阅读:0
听报道

#9月16日在CCF YOCSEF济南“数据要素流通——区块链信任的能与不能”上的引导发言,作了适当扩展和补充。“元界”首发。

数据已经成为继土地、劳动、资本和技术之后的第五大生产要素,但我们对数据要素的绝大部分研究,还在沿用对已有生产要素的分析和观察视角,尤其是还在沿用对土地、劳动和资本三大生产要素的分析和观察视角,由此导致很多研究结论与现有实际情况的严重偏离。为正确认识和分析作为生产要素的数据,我们需要一些新的观察视角和分析维度。

一、对数据属性的研究要由“物”的维度转向“数”的维度

我在最近出版的《元宇宙进化逻辑》中指出,元宇宙是人类历史的新纪元。这样说并不是无的放矢,也不是对元宇宙的无限拔高。我们传统的社会,基本上是建立在“物”的基础上的,也就是所谓的碳基社会。碳基社会的运行和治理,基本上都是基于“物”的逻辑构建起来的,也就是“物”和“物”权。而元宇宙,基本上是建立在“数”的基础上的,也就是所谓的硅基社会。

大多数“物”在一般情况下具有数量上的稀缺性,占有上的排他性,使用上的消耗性等特性,这些特性也是传统经济学建立的前提和基础,也就是供-需关系。同时,这些特性,也是传统社会运行和治理规则得以建立的前提和基础,包括法律法规、政策制度、人情风俗等。

而“数”在一般情况下不具有数量上的稀缺性,占有上也没有排他性,使用上也不存在消耗性。因此,对“数”的分析观察和研究,就不能再沿用对传统的土地、劳动和资本的分析观察视角和分析维度。

数据作为生产要素,与技术具有更多的相似性。比如,都具有固定成本高(对数据来说就是采集成本高),边际复制和使用成本低,使用无损耗等属性。技术在使用中还可以得到进一步优化和改进,数据在使用中也会获得数量和维度上的增长。

因此,观察分析和研究作为生产要素的“数据”,必须回到“数”本身的最基本属性,由此我们才有可能进一步推演出作为生产要素的“数据”的经济学上的相关定义和属性。由此,相关的技术也才有可能找到合适的用武之地。

二、对数据要素的研究要兼顾微观、中观和宏观视角

当前对数据的使用、观察和分析,尤其是在技术层面的研究和分析,大部分还局限在微观层面。这也好理解,因为在微观层面,数据与物一样,都是具体的,也都有具体的应用场景,而具体的内容总是容易被观察并被分析和使用的。

但如果要使数据真正成为生产要素,对数据的观察分析和研究,以及使用,就不能仅仅停留在微观层面,必须兼顾到中观和宏观层面。如果没有中观和宏观层面的研究,数据作为生产要素的价值,就难以真正被激发出来,其价值创造、价值传导、价值放大和价值实现也就难以真正实现。

比如在中观层面,隶属于某一特定区域或特定产业的数据,作为生产要素,它是如何形成和发挥其价值的?在价值形成和发挥过程中,数据自身以及受数据影响的更宽泛的区域和行业又面临哪些问题,这些问题又该通过哪些技术手段和技术工具得以解决?数据自身以及受数据影响的更宽泛的区域和行业又会发生哪些变化,这些变化又需要通过哪些技术手段和技术工具面对和处置?

比如在宏观层面,随着数字孪生、虚实相生和数字原生技术的发展,数据对社会各个领域的渗透会越来越全面,对人类生活的各个角落的渗透会越来越深入,在某些领域还会形成数据对现有人类生产生活和人类社会运行方式的替代。那么,数据的运行方式、数据对生产生活和人类社会方方面面的影响,数据对数据自身以及其他领域的治理等等问题,我们能否找到相应的观察分析研究的视角和维度?

在经济学中,宏观经济学就是货币理论,微观经济学就是价格理论。那么数据生产要素领域的宏观、中观和微观又分别是什么?

三、要努力寻找理解数据要素特点特征的新方法

数据作为一种生产要素,其与其他生产要素既有相同点,也有不同点。如果我们不能找到数据要素自身的更深层次的特点和特征,我们也就难以深入数据要素自身以及数据要素的价值创造和价值发挥层面。平时我们过多强调了数据要素与其他生产要素的不同,那数据与其他生产要素又有没有相同之处呢?

我们先分析一下数据要素与土地要素在属性上的类同。

首先从中观层面看。我们都知道,数据要素在使用上是有比较强的时间上的限制的,比如,几十年或者上百年的数据,从生产要素角度来讲,基本就没有什么价值了,但数据要素的使用在空间上是基本没有限制的,任何地方只要有需要,数据都可以被使用。而土地在空间上的使用是有比较严格的限制的,哪些土地适合什么用途,一般都会有比较明确的界定,但土地的使用在时间上基本上是没有限制的,只要地球和太阳还在,土地就可以一直被使用下去。

数据要素在空间上的使用是无限的,但在时间上的使用效用是衰减的,尽管这种衰减不等同于排他性,但可以大致认为是排他的另外一种表现形式。土地在空间的使用上是排他的,但在时间上的使用是可持续的。如果我们能够做一个时间-空间维度的变换,数据要素和土地要素是否可以近似类同地被看待和分析?

土地在使用过程中会带来地力的增加或减少,但一般情况下会在一定时间内保持大体恒定。数据在使用过程中一般情况下会带来数据数量的增加,也会带来数据维度的增加,但有可能会带来数据总体质量和平均质量的损耗。我们是否可以创造一个指标,以评判数据作为生产要素的可用效益指数,就类似于用一个指标来衡量土地的经济获取能力?

其次看微观层面。数据和土地的使用都会受到一定限制。比如具体一块土地所在的地理环境,周围有没有山川河流,所处的是平原还是山丘地带等,这些周围的地理环境会使这块土地在使用上受到一定的限制,比如只适合种植哪类作物,甚至在作为建筑用地时也会受到这种限制。而数据的使用则会受到使用场景上的限制,A行业B场景下的数据放在C行业D场景下可能就用处不大,或者根本就没有用处。

当然,技术的发展会在一定程度上突破这种限制。比如原来不适合种植经济作用的土地,在最新农业种植技术的加持下不但可以种植经济作物了,而且还可能高产;原来不适合盖高楼的沙地,在最新的建筑技术的加持下可能也可以盖高楼了等等。在数据领域,随着数据处理技术,尤其是人工智能技术的突破,原来很多没有关联的数据可能就找到了内在的关联,从而产生了新的用途等等。

当然,理解数据作为生产要素,推动数据要素价值发挥,肯定需要很多新的角度,上面也仅仅是从数据要素与土地要素从中观和微观层面进行的一点点类比分析。如果我们再拓展一下,用经济学家陈志武老师的定义“金融是货币的跨时间使用”作类比,我们就发现,跨时间使用并没有在土地要素上得以完全实现,因为土地作为生产要素没有冗余,我们没有办法预支未来的土地的使用,但却可以预支未来土地的收益。那么,数据是否可能实现跨时间的使用,或者数据能够以哪种方式实现跨时间使用?这是不是就是数据资本化的一种可能性呢?

四、在数据要素价值创造和价值发挥探寻层面要由线性变化视角转向涌现视角

我们人类的认知方法,更习惯和适应物理学的线性变化。线性变化看起来简单直接,更加符合逻辑和常理,在现实生活中也有大量的案例。但是仅有线性变化是远远不够的,因为线性变化难以解释很多事情的发生发展,比如生命是如何出现的?在化学元素周期表之中的哪些元素,通过哪种特定组合,在什么样的条件之下,这些元素就突然间组成了生命?

在技术领域也广泛地存在着非线性变化现象,比如区块链。区块链是一种利用非可信的技术组件,在不可信的网络环境下构建的一种可信网络应用。这种由A物种和B物种,在特定环境和条件下生成C物种的反应,就是涌现,也被称为复杂科学。复杂科学的学者2022年还获得了诺贝尔物理学奖。实际上,涌现才是价值生成的最主要方式。比如,我们需要产品C,产品C又是由产品A和产品B在特定环境条件下通过特定工艺生产的,但我们绝不可能简简单单地把产品A和产品B买来自己经过组装就可以使用并满足我们的需求的。

数据要素价值发挥方式,可能大体包括两类,一类是数据给万事万物赋能,第二类则可能数据本身就是万事万物,比如未来元宇宙中的数字原生世界,数据就是一切,数据就是价值。数据赋能的过程会发生大量的涌现现象,就是数据如何与其他物种相互作用,生成了价值。在数据就是一切、数据就是价值的领域,也会有更多的涌现现象发生。我们既需要在宏观和中观层面归纳总结数据作为生产要素的价值创造和价值发挥方式,更需要深入到每一种每一类,甚至每一个单独的数据单元参与的价值创造和价值发挥过程中,只有这样我们才能直接找到技术的着力点和技术作用的发挥点。

五、数据要素标准化可以从数据质量和数据处理能力的标准化开始

应该说,数据并不稀缺,但数据的处理能力,包括数据采集存储和传输能力、数据清洗能力、数据加工和再加工能力、利用数据创造价值和发挥价值的能力却总是稀缺的。数据无数不在,但能够成为生产要素的数据并不是无处不在的。因此,数据要素标准化至少应该包括两个层面的内容,一是数据处理能力的标准化,二是处理后的数据的质量的标准化。数据处理能力,狭义来讲就是人工智能的能力,因为海量数据处理必须依靠人工智能,而不能再依靠人通过打标签等低级方式来完成其相应的处理。

从市场交易来讲,当然还有数据作为生产要素的交易、定价、流转、交割等环节的标准化,但这些标准化主要是规范,而数据处理能力的标准化和处理后的数据质量的标准化,量多是对能力的要求。

首先来看数据质量的标准化。对于数据要素形成过程中处于不同阶段,以及面向不同应用领域和应用场景的数据,其数据质量都应该有其对应的标准。如果数据质量不达标,基于数据要素的价值创造和价值发挥也都会受影响。基于数据建立起来的人工智能算法也会受到影响。数据所处阶段至少包括了原始数据、资源资产和数据资本,可能未来还会有对数据要素形成过程中的更细粒度的阶段划分。此外,对不同应用领域和不同应用场景的数据质量也要有相应的要求。比如,在工业互联网、无人驾驶、大数据医疗等领域,其对数据质量的要求与信息互联网、消费互联网的数据要求就会完全不同。

需要引申一点的是,数据质量指的是数据对描述对象的精确和完整表达程度。如果数据是对人类社会的描述,而人类社会人类行为都具有一定的模糊性和不确定性,那么,从这个角度,不能将数据描述内容的模糊和不确定等同于数据本身质量的模糊和不确定,数据描述内容表现出来的模糊和不确定,恰恰是数据质量高的体现。

其次是针对特定场景下的数据处理能力的标准化,狭义来讲就是人工智能算法要有相应的标准。人工智能算法既是数据要素价值发挥的主要方式和途径,同时也是从原始数据到数据资产和数据资本形成过程中的必要工具。因此,人工智能是内在于数据要素的,而不是外在于数据要素的。

人工智能算法的质量既与数据质量相关,同时也有场景要求息息相关。有些场景的人工智能可以有较低的标准要求,比如在信息推送、消费场景下的产品服务推荐等,但有些场景下的人工智能算法则有比较严格的标准要求,比如工业互联网、无人驾驶、大数据医疗。因为在后者的环境下,人工智能算法要能够直接决定不同数据要素的连接匹配,而不是像在信息和消费领域,因为信息和消费领域的人工智能算法只是完成了连接匹配的推荐,至于是否要形成真正意义上的连接和匹配,是由人来作最后的决定的。但是在工业互联网、无人驾驶、大数据医疗等领域的人工智能算法必须可控可测可管理地自行完成不同数据要素的连接和匹配。

数据作为一种新的生产要素,其存在形态、特点特征、作用方式,对于我们来说都是新的。而人类在对事物的认识方式上则有一定的惯性。在对数据和数据要素的理解和认识上,人类既需要跳脱出原有的思维惯性和思维误区,同时也要寻找办法,将对数据和数据要素的理解和认识同以有的事物作类比,否则人类对数据和数据要素的理解认识也会陷入无矢之的。

 

话题:



0

推荐

高承实

高承实

119篇文章 20小时前更新

密码学博士,区块链和数字化转型领域知名专家,中国计算机学会高级会员、区块链专委会执委,中国工业与应用数学学会区块链专委会常务委员,曾任解放军战略支援部队信息工程大学计算机应用专业副教授/研究生导师。现为多所大学客座教授、企业导师。出版《元宇宙进化逻辑》《区块链技术本质与应用》《回归常识—高博士区块链观察》《区块链中的密码技术》等书。 邮箱:729075349@qq.com

文章