数字化背景下的经济社会发展的新特征 新趋势
01云计算、大数据、人工智能和区块链
云计算
云计算可以被理解成一个系统硬件,一个具有巨大的计算能力、 网络通信能力和存储能力的数据处理中心(Internet Data Center,简 称 IDC)。数据处理中心本质上是大量服务器的集合,数据处理中心 的功能、规模是以服务器的数量来衡量的。
比如,2015年北京市有2000多万部手机、2000多万部座机、七八百万台各种各样上网的笔记本电脑和台式电脑,以及七八百万台家庭的电视机机顶盒。中国移动、中国电信等电信公司处理所有北京市的上述信息的后台服务系统和数据处理中心拥有的服务器共计25万台。上海差不多也是20 多万台。谷歌处理全世界的互联网大 数据且需要进行智能化处理,它需要多少服务器呢?据悉,谷歌有150万台服务器分布在全世界七八个地方,现在正在建设的服务器还有100万台。
云计算有三个特点。第一,在数据信息的存储能力方面,服务器中能存储大量数据。第二,在计算能力方面,每个服务器实质上是一台计算机。与 20世纪60年代、70年代世界最大的计算机相比, 当代计算机的运算能力更强、占用空间更小。第三,在通信能力方面,服务器连接着千家万户的手机、笔记本电脑等移动终端,是互联网、物联网的通信枢纽,是网络通信能力的具体体现。
由此可见,数据处理中心、云计算的硬件功能,具有超大规模 化的通信能力、计算能力、存储能力,赋予其虚拟化、灵活性、伸 缩性的特点。服务商以 IDC 为硬件,以私有云、公共云作为客户服 务的接口,向客户提供数据服务。就像居民通过水龙头管道向自来 水厂买水一样,各类客户以按需购买的方式,利用 IDC 资源购买所 需的计算量、存储量、通信量,并按量结算费用。资源闲置时也可供其他客户使用,这样就能够有效、全面、有弹性地利用云计算架构中的资源,既能同时为千家万户服务,又能使大量服务器不发生 闲置。
大数据
大数据之大,有静态之大、动态之大和运算之后叠加之大。数据量之大有三个要点。第一是数据量大,例如大英博物馆的藏书能 全部以数字化的形式存储。第二是实时动态变量大。每一秒钟、每 一分钟、每一小时、每一天,数据都在产生变化。全球 70 亿人约有六七十亿部手机,这些手机每天都在打电话,每天都在计算,每天都在付款,每天都在搜索。所有的动态数据每天不断叠加、不断丰富、不断增长。“量变会引起质变”,就像累积 60 张静态照片可以形 成一秒钟的实时电影,大量静态数据的存放也会不断更新、累积,形成新的信息。第三是数据叠加处理后的变量之大。人们根据自身的主观需求,对动态的、静态的数据进行处理分析、综合挖掘,在 挖掘计算的过程中,又会产生复核计算以后的新数据。这种计算数据也是数据库不断累计的数据。
总之,所谓大数据之大,一是静态数据,二是动态数据,三是经过人类大脑和计算机处理、计算后产生的数据,这三者共同构成大数据的数据来源。
大数据若要转化为有用的信息、知识,则需要消除各种随机性和不确定性。数据在计算机中只是一串英语字母、字符或者阿拉伯数字,可能是混乱的、无序的。数据应用一般有三个步骤:数据—信息, 信息—知识,知识—智慧。
第一步,数据变信息。任何结构化、半结构化或非结构化的数 据本身是无用的、杂乱无章的,但数据经过分析去除随机性干扰以后,就变成了有指向的信息。数据变信息的处理过程用的工具有滤波器、关键词,滤波以后提炼出相关的信息。
第二步,信息中包含的规律,需要归纳总结成知识。知识改变命运,但知识不简单地等于信息。如果不能从信息中提取知识,每天在手机、电脑上看再多的信息也没用。
第三步,有知识后要运用,善于应用知识解决问题才是智慧。综合信息得出规律是将信息转化为知识的过程。有的人掌握了知识,对已发生的事讲得头头是道,但是一到实干就傻眼, 这是没智慧的表现。所谓智能,实际上就是在信息中抓取决策的意图、决策的背景等相关信息,最后在“临门一脚”时能够做出决策。
信息和知识是辅助决策系统,它们帮助人做出决策,人根据机器做出的决策实施,这就是智能化的过程。
所谓大数据蕴含着人工智能,就在于把杂乱无章的数据提取为信息,把信息归纳出知识,通过知识的综合做出判断,这就是大数据智能化所包含的三个环节。
人工智能
第一,人工智能如何让数据产生智慧?大数据之所以能够智能化,能够决策,能够辅助决策,是因为在人工智能或计算机操作过 程中有四个步骤:一是采集、抓取、推送,二是传输,三是存储, 四是分析、处理、检索和挖掘。第一步,在大数据中不断地过滤出 有一定目的意义的信息,也就是采集、抓取、推送。第二步、第三 步是传输和存储,内涵不言自明。大数据之大,不是在抽屉里静态的闲置大数据,而是在云里存储、动态传输的大数据。第四步是分 析、处理、检索和挖掘,关键技术在于算法。算法是辅助人类在非 常繁杂、非常巨大的海量数据空间中,快速找到目标、路径和方法的工具。
第二,人工智能依靠大数据在分析、处理、检索和挖掘中产生智能的关键在于大数据、算法以及高速度的计算处理能力。没有数据和大数据的长期积累、重复验证,有智能管理也没有用;有了算法和大数据,没有高速度的计算能力也没有用。算法是人工智能的 灵魂,它变得“有灵气”需要用大数据不断地“喂养”,不断地重复和训练。在这个意义上,大数据如果没有算法,就没有灵魂,就没有大数据处理的真正意义。
但是如果算法没有大数据来“喂养”,即使数学家想出好的算法,智能也未必有效。以柯洁与阿尔法围棋的人机大战为例,阿尔法围棋中的算法是来源于人类各种各样的棋谱、高明棋手的下棋步骤。人工智能工程师将这些数据全部放入谷歌的算法中运行,运行了几万次、几十万次。因为有网络深度学习的模块,每运行一次就聪明一点。这个过程是一个不断反复、不断学习的过程。
总而言之,人工智能、大数据和这些要素有关,转化为真正人工智能的时候,一靠大数据,二靠算法,三还要靠高速度。人类对工具使用的发展,本质上是一个计算能力不断提高的过程。
在农业社会,中国人曾用自己的聪明智慧发明了算盘。算盘一 秒钟两三个珠子拨动,每秒计算两三下。到了工业社会初期,电被 广泛运用。20 世纪 20 年代,以继电器作为基本器件的计算机问世。继电器计算机震动频率非常高,每秒抖动几十次,比算盘快 10~20 倍。到了 20 世纪 40 年代,第二次世界大战期间,电子管问世。电 子管计算机每秒可计算几万次,是继电器计算机的 1 000 倍,运算速 度非常快。到了 20 世纪 60 年代,半导体问世,以三极管、二极管 为元器件的电脑,一秒钟能运算几十万次到几百万次。到了 20 世纪 80 年代,半导体芯片问世,集成电路计算机的运算速度到达每秒几 千万次甚至几亿次。中国的超算在 10 年前达到了亿次,2015 年前后 到了 10 亿亿次,最新推出一个超算系统已经超过 100 亿亿次。但是, 超级计算机不是一个芯片、一个电脑的运算速度,而是几千个电脑、 几千个服务器组合而成一个矩阵和一个算法。超级计算机能够做到 一秒钟10亿亿次、100亿亿次,但单个芯片难以达到每秒运算10亿亿次。
我们为什么非常重视一个芯片每秒能计算 10 亿亿次呢?在 2012 年出版的《奇点临近》一书中提到,大概二三十年后,人造机器的 计算速度将超过人脑。作者提出,人脑的运算速度是每秒计算 10 亿 亿次。当计算机到了每秒计算 10 亿亿次以上时,其运算速度将超过人脑,拐点就会到来。大家讨论人工智能最终能不能超过人类智能, 人是不是会被人工智能圈养,各有各的说法。从科学的角度讲,人 工智能的计算能力不断增强,是人对工具使用的智慧不断发展的结 果。强大的计算能力、大数据、算法连在一起,超越了几千小时、 几万小时、几十万小时,人无法等待的时间,使得大智慧逐步发展。
第三,云计算、大数据、人工智能的软件植入在云计算厂商提 供的数据处理中心硬件中,对客户形成三种在线服务。云计算的云 是一个硬件,是一个具有通信能力、计算能力、存储能力的基础设 施。云中除了存放大数据之外,同时提供各种各样的算法作为一种 服务软件处理。大数据公司往往在搜集、组织管理了大量数据的基 础上,使用人工智能算法后为客户提供有效的数据服务,形成一个 大数据的服务平台。所谓的人工智能公司,往往是依靠大数据平台 支撑提供算法服务,算法软件也是一种服务。它们共同形成了“数 字化”的三大功能:第一个是 IaaS,是基础设施作为使用的服务;第 二个是 PaaS,是大数据的平台作为使用的服务;第三个是 SaaS,算 法软件也是一种服务。这三个词组代表了“数字化”三兄弟,三种 功能不同的软件。
当然,“数字化”也离不开互联网、移动互联网和物联网。一句 话解释就是,互联网的时代是 PC(个人电脑)时代,移动互联网的 时代是手机加笔记本电脑的时代,物联网时代就是万物万联的时代。
区块链
区块链本质上是一个去中心化的分布式存储数据库,它打破了 中心化机构授信,通过数据协议、加密算法、共识机制,点对点地 传输到这个区块中的所有其他节点,从而构建一种去中心化、不可 篡改、安全可验证的数据库,建立一种新的信任体系,这种信任体系表现为五个特征。一是开放性。区块链技术基础是开源的,除了 交易各方的私有信息被加密外,区块链数据对所有人开放,任何人 都可以通过公开接口查询区块链上的数据和开发相关应用,整个系 统信息高度透明。二是防篡改性。任何人要改变区块链里面的信息, 必须要攻击或篡改 51% 链上节点的数据库才能把数据更改掉,难度 非常大。三是匿名性。由于区块链各节点之间的数据交换必须遵循 固定的、预知的算法,因此区块链上节点之间不需要彼此认知,也 不需要实名认证,而只基于地址、算法的正确性进行彼此识别和数 据交换。四是去中心化。正因为区块链里所有节点都在记账,无须 有一个中心再去记账,所以它可以不需要中心。五是可追溯性。区 块链是一个分散数据库,每个节点数据(或行为)都被其他人记录, 所以区块链上的每个人的数据(或行为)都可以被追踪和还原。
| 按照目前的应用场景,区块链可以分成三大类。
一是公有链。主要指全世界任何人都可以读取、发送信息(或 交易)且信息(或交易)都能获得有效确认的,也可以参与其中的“共识过程的区块链”。
二是私有链,也称专有链。它是一条非公开的链,通常情况,未经授权不得加入(成为节点)。而且,私有链中各个节点的写入权 限皆被严格控制,读取权限则可视需求有选择性地对外开放。
三是联盟链。联盟链是指由多个机构共同参与管理的区块链, 每个组织或机构管理一个或多个节点,其数据只允许系统内不同的 机构进行读写和发送。
| 就当下而言,区块链涉及四大技术领域。
一是分布式账本技术。人类社会发明的记账技术先后有四种。早在原始社会时,人类发明了“结绳记账”,农业社会时发明了“记 流水账”,工业社会时发明了“复式记账”。复式记账的平衡表使账目一目了然,适应了工业社会的企业管理,但它避免不了经理人与 会计可能从原始数据源头造假。分布式账本是一种在网络成员之间 共享、复制和同步的数据库。分布式账本一起记录参与者间的数据 行为(如交易、资产交换行为等),这种技术所内含的防篡改、可追 溯特性从源头上杜绝了造假的可能,而共享机制降低了“因调解不 同账本”所产生的时间和成本。
二是非对称加密技术。存储在区块链上的交易信息是公开的, 但每个账户的身份信息是高度加密的。单个账户只有在拥有者授权 的情况下才能访问到,从而保证数据的安全和个人隐私。
三是共识机制技术。开发者必须首先考虑用怎样的技术可以使 更多人对一种规则达成共识,同时还要考虑通过多少个特殊节点的 确认,才能在很短的时间内实现对数据行为的验证,从而完成一笔 交易。一般而言,区块链技术需要若干利益不相干的节点对一笔交 易进行确认,如果确认就认为达成共识,认为全网对此也能达成共 识,这样才算完成一笔交易。
四是智能合约技术。基于大量可信的、不可篡改的数据,可以 自动化地执行一些预先定义好的规则和条款,比如彼此间定期、定 息、定额的借贷行为。
区块链技术属于信息技术、记账技术。从应用视角来看,基于 区块链能够解决信息不对称问题,实现多个主体之间的协作信任与 一致行动,无论是公有链、私有链,还是联盟链,其首要目标是确 保信息数据的安全、有效、无法篡改。
| 目前,区块链技术在社会中 的应用场景主要有以下几方面。
一是金融。金融已经数字化了,所以这是区块链应用最为得心 应手的领域。目前,在国际汇兑、信用证、股权登记和证券交易所 等领域已经开始尝试使用区块链技术,区块链在金融领域有着巨大的潜在应用价值。人们的探索是,将区块链技术应用在金融领域是 否可以“省去中介环节”,实现点对点对接,在降低交易成本的同 时,更加快速地完成交易。例如,利用区块链分布式架构和信任机 制,可以简化金融机构电汇流程,尤其是涉及多个金融机构间的复 杂交易。
二是供应链和物流。区块链在物联网以及物流单据管理领域也 有得天独厚的优势,企业通过区块链可以降低物流单据管理成本, 可以监控和追溯物品的生产、仓储、运送、到达等全过程,提高物 流链管理的效率。另外,区块链在供应链管理领域也被认为具有丰 富的应用场景,比如上下游之间的直接交易可以加大透明度,提高 信任和效率,如果区块链中包含供应链金融,那将大大提高金融的 效率,同时降低金融机构和企业的信用成本。
三是公共服务。区块链在公共服务、能源、交通等与民众生活息息相关的信息领域也有较为丰富的应用场景。比如,目前由于信 任缺失,中心管理者有时无法确定民众反映的需要解决的问题是个性问题还是共性问题,但使用区块链技术之后,这个问题可能瞬间就可以找到正确答案。
四是认证和公证。区块链具有不可篡改的特性,可以为经济社 会发展中的“存证”难题提供解决方案,为实现社会征信提供全新 思路,存在很大的市场空间。比如,最近,腾讯推出了“区块链电 子发票”,成为区块链技术应用的“爆款”。
五是公益和慈善。区块链上分布存储的数据的不可篡改性,天然 适合用于社会公益场景。公益流程中的相关信息,如捐赠项目、募集 明细、资金流向、受助人反馈等信息,均可以存放在一个特定的区块 链上,透明、公开,并通过公示达成社会监督的目的。
六是数字版权开发。通过区块链技术可以对作品进行鉴权,证明文字、视频、音频等作品的存在,保证权属的真实性和唯一性。作品在区块链上被确权后,后续交易都会进行实时的分布式记录, 实现数字版权的全生命周期管理,也可为侵权行为的司法取证提供 技术保障。
七是保险。在保险方面,保险机构负责资金归集、投资、理赔 等过程,往往管理和运营成本较高,但区块链技术有可能提高效率、 降低成本;尤其在理赔方面,通过区块链实现“智能合约”,则无须 投保人申请,也无须保险公司批准,只要投保人行为触发符合规定 的理赔条件,即可实现当即自动赔付。
八是信息和数据共享。目前,全国各级政府公共信息资源平台 在大力整合,目的是使各个信息系统之间的信息有效共享,节约存 储空间和提升使用效率。在实现技术上,如果能够利用区块链分布 式的特点,既可以打通监管部门间的“数据壁垒”,破除“数据孤 岛”,实现信息和数据共享,还能提升公众调取政府公开资源的效 率,减少资金浪费。
总体而言,区块链通过创造信任来创造价值,使离散程度高、管理链条长、涉及环节多的多方主体能够有效合作,从而提高协同效率、降低沟通成本。
评论