科普园地 新闻中心

数字替身:探索人生的无数可能

冯杰

2018年11月05日 02:19

佩德罗·多明戈斯(Pedro Domingos) 翻译 崔迪潇
《光明日报》( 2018年10月17日 14版)


我们对于未来化场景的大多想象都是基于高度的自动化,但是每个人的生活习惯不同,所以每个人需要的自动化程序都不一样。那么,美好的未来生活怎么才能让每个人的自动化程序都合你的心意呢?


也许,你需要的仅仅是一个数字替身,它是“电子化”的你,了解你的一切生活习惯。这个替身会成为你的助手和管家,把你的工作和生活中按部就班的部分安排得井井有条。


事实上,人工智能最可能导致的情景就是“数字替身”的大量出现。“数字替身”是我们自身的虚拟模型,这些模型可以在各种各样的模拟中互动,帮助我们在日常生活中做出更快速、更全面的决策。如今的各种语音助手音箱已经是这个替身的雏形。人工智能将服务于人类,而不是控制人类。


1.从制造机器到机器学习


人类是唯一可以制造机器的动物。通过这种方法,我们扩展了自身的能力,超越了我们的生物极限。工具使我们的双手变得万能。汽车让我们行进得更快,飞机给了我们翱翔的翅膀。计算机赋予我们更强大的智力和记忆力,智能手机为我们安排日常生活。而现在,我们正在创造一项全新的技术,用代码赋予它通过数据和练习进行学习的能力,使其可以实现自我进化。它会最终取代我们吗?还是将以史无前例的方式提升我们的能力,增强我们的人性?


机器学习源于20世纪50年代部分科学家的开创性工作,如弗兰克·罗森布拉特(Frank Rosenblatt)设计了一种能够识别数字的电子神经元,阿瑟·塞缪尔(Arthur Samuel)开发了一种跳棋程序,可以通过和自己对弈来学习,并最终击败人类选手。但也仅仅是在过去十年,机器学习领域才开始真正腾飞,为我们带来了自动驾驶汽车、能(在一定程度上)理解我们指令的虚拟助手等各式各样的应用。


每年,我们都会开发数以千计的新算法。所谓的算法,就是用来指导计算机完成某些操作的指令序列。而自我学习机器的核心特点是,我们不需要为它们编写具体的程序,只需要给它们一个诸如“学习如何玩跳棋”的宽泛目标,接下来,机器就可以像人类一样,通过积累经验而不断优化。


对人工智能的追求可以看作是人类自我进化的一部分。自动化技术发展的下一阶段是发明出所谓的主算法,将把当前的5种机器学习方法整合为统一的框架。技术只是人类能力的拓展。除了达成我们给予的任务目标,机器并没有自由意志。我们应该担心的是人类对技术的滥用,而非被机器夺走了控制权。


现在机器学习算法大致可以分为5个大类,每一类都是从不同的学科领域获得了灵感。并不让人意外的是,有一种机器学习方法就是在模拟自然选择,我们称这样的算法为进化算法。例如,在哥伦比亚大学的创新机器实验室(Creative Machines Lab)中,有许多雏形机器人在尝试爬行或飞行,其中表现最优异的结构将定期融合和变异,产生新一代的3D打印样机。一开始这种随机组装的机器人几乎无法运动,但经历了数千次的迭代后,这种方法已经产生了类似蜘蛛或蜻蜓的机器人。


但这种进化是低效的。当前应用最广泛的机器学习方法是深度学习,它的灵感来自大脑。这种方法从模拟单个神经元功能的高度简化的数学模型出发,构建出包含数千个神经元的网络,并通过学习不断调整不同神经元之间的连接。如果两个神经元在处理数据时同时放电,它们之间的连接就会加强。这样的神经网络能以极高的准确度识别人脸、理解语音和翻译语言。机器学习也会借鉴心理学。与人类相似,这种以类比为基础的算法通过在已有的数据中寻找近似的问题来解决新的问题。这种特性可以实现自动化的客户服务,也可以让电商网站基于用户个人习惯推荐商品。


2.努力创造一个主算法


通过自动执行科学方法,机器也可以实现学习。为了引入新的假设,所谓的符号学习会进行逆向推理演绎:如果我知道苏格拉底是人类,要推断出他会死,我还需要知道什么信息?知道人会死或许就足够了,而且这个假设可以通过检查样本中其他人类是否会死来进行确认。英国曼切斯特大学的生物机器人Eve便是通过这种方法发现了一种有可能治疗疟疾的新药物。根据疟疾的相关数据和基本的分子生物学知识,Eve提出了什么样的药物可能具有疗效的假设,还设计了实验并在机器人实验室进行测试,然后修改或放弃一些假设,不断重复上述过程直到取得满意的效果。


最终,机器学习可以完全构建于数学原理之上,其中最重要的是贝叶斯定理。按照这个定理,我们可以基于现有知识,先给不同假设指定初始概率,然后提升与数据相符的假设的概率,并降低与数据不符的假设的概率,最后计算所有假设的加权平均值,就可以作出预测:概率越高的假设,权重也越高。基于贝叶斯定理的机器在某些医疗诊断中的准确率要高于人类医生,也是很多垃圾邮件过滤系和谷歌个性化广告推荐系统的核心技术。


这5类机器学习算法,每一种都既有优势,也有不足。例如,深度学习在解决视觉或语音识别等感知任务上性能卓越,但无法处理常识的获取和推理等认知任务。而符号学习则与之相反。尽管相比于神经网络,进化算法可以解决更为困难的问题,但解决这些问题要耗费大量的时间。类比方法可以从少量的数据实例中学习,但面对过多信息时却容易陷入混乱。贝叶斯学习是处理少量数据的最有效方法,但处理海量数据时却代价高昂。


因为不同的方法各有利弊,所以机器学习研究者一直致力于把各种方法的优势结合起来。就如同一把能打开所有锁的万能钥匙,我们也在努力创造一个所谓的主算法(master algorithm)——这个算法可以从数据中学习到一切特征,提取出所有可能得到的知识。


当前,机器学习领域面临的挑战和物理学家面临的挑战类似:量子力学可以在微观尺度上很好地描述宇宙,广义相对论则适用于宏观尺度,但这两个理论却是不相容的,有待调和。在粒子物理学的标准模型建立起来之前,詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)首先统一了光、电和磁;与此类似,包括我和华盛顿大学的同事在内,很多研究团队都提出了将两种或多种机器学习方法统一到一起的思路。但科学进步是断断续续、非线性发展的,因此很难预测这个大一统的主算法什么时候才能实现。不管怎样,这一目标的实现并不会导致一个全新的、强大的机器种族出现,相反,它会促进人类的进步。


3.人工智能与自由意志


一旦我们获得主算法,并输入由每个人产生的大量数据,人工智能系统就可能通过学习得出每个个体的非常准确和详细的模型:我们的口味和习惯、优点和缺点、记忆和愿望、信仰和个性、我们在乎的人和事,以及任何特定场景下我们会如何回应。我们的模型实质上能够预测我们将做出的选择,这既令人兴奋又令人不安。


许多人担心,拥有这些能力的机器会利用它们新获得的知识来夺走我们所有的工作,奴役我们,甚至消灭我们。但这是不可能发生的,因为它们没有自己的意志。基本上,所有的人工智能算法都是由我们设计的目标驱动的,比如“找到从酒店到机场的最短路线”。这些算法与普通算法的区别在于,它们可以灵活地决定如何实现我们为它们设定的目标,而不是需要执行预先定义的一系列步骤。即使通过不断执行任务而得到优化,它们的目标仍然没有改变。不能更好地实现目标的方案会被自动放弃。此外,人类会核查机器的成果是否符合我们的目标。我们还可以验证机器有没有违反我们对它们施加的限制,比如“遵守交通规则”。


然而,当我们想象人工智能时,我们倾向于将人类的特质,如意志和意识投射其上。我们中的大多数人也更熟悉家用机器人这样的类人人工智能,而不是无数工作在幕后的其他类型的人工智能。好莱坞将机器人和人工智能描绘成人类的形象,也促使我们产生了这种印象。当然,好莱坞采取这样的策略可以理解,这能让故事变得更有吸引力。人工智能只是一种解决难题的能力,而这一任务并不需要自由意志。它与人类作对的可能性,并不比你的手突然不听使唤,扇自己耳光更大。和其他技术一样,人工智能技术将永远是我们自身的扩展。我们所设计的人工智能系统越强大,人类也就受益越多。


那么,人工智能会让我们的未来变成什么样子呢?智能机器确实会取代许多工作,但对社会的影响可能类似于以前的自动化机器。200年前大多数美国人都是农民,如今机器已经取代了几乎所有的农民,却没有造成大规模的失业。末日论者认为,这一次是不同的,因为机器正在取代的不仅仅是我们的肌肉,更是我们的大脑,这将让人类无事可做。但是,人工智能距离承担我们的所有任务仍然非常遥远。在可预见的未来,人工智能和人类将擅长不同的事情。机器学习的主要作用将是大大降低智力成本。这种普及进程将让人工智能在更多的领域变得经济可行,创造新的就业机会,并改造旧的工作,让相同数量的人力能完成更多工作。


然后,还有未来学家雷·库兹韦尔(Ray Kurzweil)宣扬的“奇点”。他设想,技术进步会永远不断加速:机器学会制造更好的机器,而新的机器又能制造出比它还要好的机器。但我们知道这是不可能的,即便是量子计算机——它的计算能力也受到物理定律的严格限制,而且在某些方面,我们距离这样的极限已经不远了。人工智能的进步,就像其他一切的进步一样,最终会趋于平稳。


另一个在未来学家中流行的观点是,我们自身的计算机模型将变得非常完善,以至于与真实的我们没有区别。在这种情况下,我们可以把自己上传到云端,永远作为软件的一部分存在,不受现实世界的恼人的约束。不过这面临着一个问题:它在生物学上可能行不通。为了上传你自己,你需要一个精确的模型来描述你的每一个神经元,以及它们储存的记忆。你必须非常可靠地采集这些信息,使得模型的预测结果尽可能地符合真正神经元的行为——这确实是一个艰巨的任务。但即使这是一个可行的选择,如果你有机会,你真的会上传自己吗?你怎么能确定你的模型并没有丢失你的一些必要记忆——或者,这个模型真的拥有意识吗?如果一个小偷以最为绝对和完整的方式偷走了你的身份呢?我相信,只要人们可以,都会选择死守他们那黏黏的、以碳为基础、计算机科学家戏谑地称之为“湿件”(wetware)的本体——直到坚持不下去为止。


4.人工智能警察抓捕人工智能罪犯


人工智能,尤其是机器学习,事实上只是人类进化的延续。在《延伸表型》(Extended Phenotype)一书中,英国科学家理查德·道金斯(Richard Dawkins)谈到,动物基因控制的不只是它们的身体,还有环境,而且这种现象相当普遍——从杜鹃产蛋到河狸筑坝,都是如此。技术就是人类表型的延伸,我们今天所构建的是我们的另一层技术外骨骼。未来人类会如何运用人工智能?我认为最可能出现的情景要比通常的推测更有趣。


在十年内,我们中的每一个人都可能拥有一个“数字替身”,这个人工智能助手将比我们今天的智能手机更加不可或缺。你的数字替身不需要和你一起移动,它很可能存在于云中的某个地方,就像你现有的个人数据一样。我们可以在Siri、Alexa和Google助手等虚拟助手中看到它的雏形。数字替身的核心是一个你自身的模型,该模型将从你与数字世界互动时产生的一切数据中学习,包括桌面电脑、网站、可穿戴设备以及智能扬声器、恒温器、手机信号发射塔和摄像机等环境传感设备。


我们的学习算法越好,我们给数字替身提供的个人数据越多,它们就会变得越精确。一旦我们有了主算法,就可以通过增强现实设备和其他个人传感器连续捕捉你的感觉和运动信息,这样一来,数字替身会比你最好的朋友都更了解你。


你的数字模型和数据将由一个“数据银行”来维护,这与你用来储蓄和投资的传统银行不同。许多现有的公司肯定愿意为你提供这种服务。谷歌创始人谢尔盖·布林(Sergey Brin)表示,谷歌想成为“你的大脑的第三个半球”,但如果你大脑的一部分要通过向你展示广告来维持它的存在,你可能不愿意。最好是由利益冲突更少的新型公司或由与你志趣相投的人形成的数字联盟来给你提供更好的服务。


毕竟,人工智能最值得担心的地方不是它会自发地变邪恶,而是控制它的人会滥用它(用法国人的话说,cherchez l’humain——“看,问题根源总是在人类身上”)。因此,你的数据银行的首要任务是确保你的模型永远不会被用来损害你的利益。你和数据银行都必须保持警惕,时刻监控人工智能犯罪,因为这项技术同样也能增强坏人的能力。我们将会需要人工智能警察来抓捕人工智能罪犯。科幻作家威廉·吉布森(William Gibson)在1984年出版的小说《神经漫游者》(Neuromancer)中就描写了这样的警察,他称其为图灵警察。


当然,这也给某些机构提供了机会,让它们更容易监视和约束你。考虑到机器学习的发展速度,电影《少数派报告》(Minority Report)中的情景也可能出现——人们在即将犯罪时被提前逮捕。还有,在我们所有人都能获得一个数字替身前,世界已经适应了部分拥有数字替身的人的生活节奏,这对那些尚未获得数字替身的人也意味着不平等。


5.虚拟空间的无数种人生


作为个人,我们的首要任务是不要自满,不要盲目信任我们的数字替身,忽略它们才刚诞生没多久的事实。人们很容易忘记,人工智能就像具备某些超常能力的自闭症患者,而且在可预见的未来仍将如此。从外表看,人工智能似乎是客观,甚至完美的,但在内里,它们同我们一样有诸多缺陷,甚至更多,只是方式不同而已。例如,人工智能缺乏常识,很容易犯一个人永远不会犯的错误,比如把横穿马路的人误认成被风吹起的塑料袋。它们往往只能理解我们指令的字面意思,精确给出我们要求的东西,但那不是我们真正想要的。(所以,在告诉自动驾驶汽车不惜一切代价把你准时送到机场前,要三思。)


实际上,你的数字替身和你如此相似,以至于它可以在各种虚拟互动中替代你。它的工作不是像你一样生活,而是要帮助你选择那些你没有时间、耐心或知识亲自去选的东西。它会阅读亚马逊上的每一本书,推荐一些你最可能想要阅读的书。如果你需要一辆车,它会研究各种选项,并与汽车经销商的替身讨价还价。如果你在找工作,它会寻找所有符合你需要的职位,然后为你安排最有可能通过的真人面试。如果你被诊断出了癌症,它会尝试所有可能的治疗方法并推荐最有效的治疗方法。(让你的数字替身参与医学研究使得更多人受益也是你的道德责任。)如果你正在寻找爱侣,你的数字替身将会与所有符合条件的数字替身进行数百万次的虚拟约会。在虚拟空间中擦出爱情火花的情侣们则可以在现实生活中约会。


从本质上说,你的数字替身会在虚拟空间中度过无数种可能人生,这样活在真实物质世界中的你就可能选出其中最好的一个版本。你的模拟生活是否真实,你的数字化身是否有某种自我意识,就像英剧《黑镜》( Black Mirror)中的一些故事那样,都是有趣的哲学问题。


一些人担心,这意味着我们将把自己生活的控制权交给计算机。但它实际上给了我们更多的控制权,而不是更少。你的模型还将从每次虚拟体验的结果中学习(你享受这次约会吗?你喜欢你的新工作吗?)所以随着时间的推移,它给出的建议会越来越接近你本人的选择。


事实上,我们已经习惯了在潜意识的干预下做出我们的大多数决策,因为这就是我们大脑的运作机制。你的数字替身就像是大幅扩展了的潜意识,但它们之间有一个关键的区别:当你的潜意识在你的身体里独自生活时,你的数字替身将会不断地与他人和组织进行互动。每个人的数字替身都将继续努力学习其他人的模型,构成一个基于模型的社会,它们会以计算机的速度生活,探索所有的可能性,猜测我们在当下可能做出的选择。我们的机器将是我们的侦察兵,为独立个体和整个人类物种开辟一条通往未来的道路。它们将带领我们去往哪里?我们将选择奔赴何处?


本文由《环球科学》杂志社供稿


作者简介:佩德罗·多明戈斯是华盛顿大学的计算机科学教授。


本文译者:崔迪潇是西安交通大学人工智能与机器人研究所讲师,主要研究方向是人工智能和无人驾驶技术。


 


]]>

2018年11月05日 10:19
959
全球水危机的解决之道