“我们可以从信息空间中
去改造一个物理空间”
2020年8月,创新工场董事长兼CEO李开复在一场活动中表示:新冠疫情正加速社会“AI化”。而“人工智能”,这个早在1956年就被提出,经历了相当一段时间低潮期的学科,正迎来前所未有的高潮。中国第一批投入人工智能方向的专家,中国工程院院士、国家新一代人工智能战略咨询委员会组长潘云鹤曾提到:新一代人工智能最本质的改变之一,是在原本的人类社会空间,和物理空间的基础上,增加了信息空间。
潘云鹤:比如说交通问题,过去我们只能够看到一个十字路口的变化,现在我们可以在信息空间里看到这个十字路口的变化,是怎么去影响周围四个十字路口的变化。不但可以看到它,而且可以改造它。我们可以从信息空间中,去改造一个物理空间。比如说,以前做一次人口调查要半年,需要成千上万个工作人员。五年以后我们再做一次人口调查,也许几个星期、几百个人就够了。当我们把大数据收集起来,例如户口大数据、电子购物大数据、医疗大数据等等,就可以给每一个人进行画像。
以前的人工智能,基本上是基于知识的人工智能。现在的人工智能实际上不再基于知识,而是基于数据。它们的不同之处在于,它能够自动地把数据变成知识。所以我们把它取了个新的名字,叫“大数据智能”。
另外一个非常重要的方向就是,老一代人工智能的目标,是想把机器人做好,造出越来越有用的机器人。那么新一代人工智能,不但要把计算机变得更聪明,而且应该把计算机和人连在一起,把它合成一个更加聪明的智能系统。
潘云鹤:我们现在遇到的数据,很多是很差的大数据,质量上面非常差,而且有的数据太偏,数据不完整。比如我拿到了很多数据,只是一个方面的,另外一方面的数据根本就没有,这些问题都会反映到最后形成的知识水平上面来。那么人为什么会逐渐地进行进化呢?就是因为人能够用学到的东西,去指导后面的大数据智能,他能够不断积累。现在的人工智能也能自己成长,但是它知识不够完整,它只能在那个圈子里成长。如果我们把知识再扩大一块,比如把人大脑中间的形象知识包括进去,让计算机能成长起来。
吴小莉:您觉得这个过程要多久?
潘云鹤:我估计大概要一、二十年。
大数据时代
该如何掌握数据安全的主动权?
方滨兴:大数据、人工智能的处理能力,前提都是要有原始的数据。数据为王,谁拥有数据,谁就是王。为什么欧洲有GDPR(通用数据保护条例),就是因为他们没有强大的服务能力,所以它会对别人的服务高度担心。如果它自己有这么大的企业,它可能也不会有这么多的担心。但现在它的全部数据都是在美国,所以他们就要有一个特别强硬的法律,来对它们加以限制,来保护自己。美国确实太强大了,它们基本上“吃遍”了全球。
我们看回中国的例子,原来别国的产品想要入驻中国时,中国说你可以运行,但是必须按照我们的要求进行管理,比方说,有害信息你不能跟着传播等等。但是它不接受,它说那我就不进了。那现在看来,中国就跟着起来了,中国就出来了百度、微信了。
吴小莉:BAT(百度、阿里巴巴、)。
方滨兴:所以从这方面,等于无形中让中国自己的产业做起来了。因为这个产业,它构成的是一种服务中心,这种服务中心能够获取一个国家的很多的核心信息。
国内开源生态 正在建立中
如今,各类创新应用场景催生出多样化的数据,使得业界对提出一种全新计算架构的呼声愈来愈烈。随着算力成为大数据时代各国的核心竞争力之一,巨型科技公司也逐渐开始自建能力开源。鹏城实验室主任、中国工程院院士高文提到:利用开源平台集合众人智慧,是推动软硬件智能化升级的重要一环。
高文:说到人工智能,它现在是叫“机器学习框架平台”。现在就有好几个版本, 国际上影响比较大的包括谷歌、亚马逊、Facebook、IBM、微软。它把人工智能的源程序都放在自己的开源框架里,供别人下载,如果别人再往上加东西,就需要再放回去。现在影响最大的是谷歌的,所有的大学、中学都在上面玩,所以它这个东西就会越滚越大。
吴小莉:其实开源开放的平台的优势在什么地方?
高文:开源其实是软件领域发展的一个新做法、新文化。以前软件都是卖版权的,比如我设计的软件,你想使用就需要支付版权费。但是大概三十多年前,MIT的一些教授就开始倡导开源软件。就是下载我的软件,是有许可证的。许可证要求的是你下载后,如果对这个软件有任何修改的地方,需要放回来。