首页 >> 哲学 >> 伦理学
人工智能伦理建设的目标、任务与路径:六个议题及其依据
2021年04月19日 10:33 来源:《哲学研究》 作者:陈小平 字号
2021年04月19日 10:33
来源:《哲学研究》 作者:陈小平

内容摘要:

关键词:

作者简介:

The Target,Tasks,and Implementation of Artificial Intelligence Ethics:Six Issues and the Rationale behind Them

 

  作者简介:陈小平,中国科学技术大学计算机学院。

  原发信息:《哲学研究》第20209期

  内容提要:人工智能伦理建设的必要性已形成全球共识,但建设目标、重点任务和实现路径仍存在较大分歧,概括为六个议题。本文首先介绍AI的两大类主要技术——强力法和训练法,在此基础上总结AI现有技术的三个特性,作为AI伦理的技术依据。同时,以全球公认的福祉原则作为AI伦理的根本依据。本文立足于这两个依据,阐述AI伦理建设应具有双重目标——同时回答应该和不应该让AI做什么,进而探讨另外五个重要议题:AI的安全底线,AI功能的评价原则,AI治理责任的落实路径,AI主体状况变迁的可能性,以及一种全新的创新模式——公义创新。

  关键词:人工智能/伦理/评价/治理/公义创新

 

  经过几年的广泛讨论,人工智能(Artificial Intelligence,简称AI)伦理建设的必要性已形成全球共识。但是,关于AI伦理的建设目标、重点任务和落地路径,仍存在较大的分歧和争论,也有些关键问题尚未引起足够的重视,文本将这些内容概括为六个议题。显然,建设目标的定位将决定重点任务和落地路径的选择,从而决定AI伦理建设的发展大局。关于AI伦理建设目标的主要分歧是:AI伦理应该是双重目标(即同时回答应该和不应该让AI做什么),还是单一目标(即主要回答不应该让AI做什么)?如果是单一目标,一些重大议题将被完全或部分地排除。引起分歧和争议的一个重要原因在于,对现阶段AI技术特性的认识存在巨大差异,从而导致对AI社会意义和伦理风险的截然不同甚至完全相反的判断。为此,有必要梳理七十年来AI研究的主要进展,澄清现阶段AI技术的主要特性,形成AI伦理的技术依据。同时,以全球公认的福祉原则作为AI伦理的根本依据。本文根据这两个依据讨论AI伦理的六个议题。

  一、人工智能的强力法

  AI经过三次浪潮取得了大量进展,各种技术路线层出不穷,受到研究者较多关注的有两大类技术——强力法和训练法。强力法又包含推理法和搜索法两种主要类型,推理法是在知识库上进行推理,搜索法是在状态空间中进行搜索。推理法通常由一个推理机和一个知识库组成,推理机是一个负责推理的计算机程序,往往由专业团队长期研发而成,而知识库则需要研发者针对不同应用自行开发。

  一般来说,推理机的工作方式是:针对输入的提问,根据知识库里的知识进行推理,给出问题的回答。下面用一个简化的例子加以说明。假设我们要用推理法回答“就餐”这个应用场景的有关问题。为此需要编写一个关于“就餐”的知识库,其中部分知识如表1所示。表1中的第一条知识 是一个逻辑公式,它的含义是:餐具可以盛食物;表中的第二条知识food(rice)也是一个逻辑公式,它的含义是:米饭是食物;表中的其他知识类似。

  表2列举了一些问题,比如第一个问题“hold(bowl,rice)?”问的是:碗能盛米饭吗?推理机利用知识库中的知识进行推理,可以给出此问题的回答yes。表2中的第三个问题稍微复杂一点,它问的是:碗能盛什么?回答一般不是唯一的,但推理机仍然能够根据知识库中的知识,找出所有正确的答案:碗能盛米饭、能盛汤……推理机还可以回答更复杂的问题。

  值得注意的是,一般情况下,由推理机得到的回答,并不是知识库中存贮的知识。例如表2中的三个回答都是推导出来的,在知识库(表1)中并没有直接保存“碗能盛米饭”“碗能盛汤”等答案。因此,知识库推理与数据库查询不同,不是提取事先保存的答案,而是推出知识库中没有保存的答案,可见知识库加推理机的组合能力之强大。知识库上的推理被认为是一种智能功能,是其他信息技术所不具备的。

  目前强力法受到一个条件的限制——封闭性。①封闭性在推理法上的具体表现是:要求存在一组固定、有限的知识,可以完全描述给定的应用场景。对于上面的“就餐”场景,如果存在着不可以盛汤的“破碗”(并且将“破碗”也当作“碗”),那么表1中的知识就不能完全描述这样的“就餐”场景,因为根据这些知识推出的某些回答(如“碗能盛汤”)在这个场景中是不正确的。

  上述“就餐”场景是特意设计的一个小例子,而实际应用中的场景都很大、很复杂(否则就不必应用AI技术了),有时不满足封闭性条件。比如一个就餐场景中,一开始没有破碗,根据知识库推出的回答都是正确的;可是一段时间之后出现了破碗,根据知识库推出的某些回答就不正确了。这种情况也是不满足封闭性条件的。

  关于推理法对于整个AI的重大意义,深度学习的三位领军学者Geoffrey Hinton、Yann LeCun和Yoshua Bengio(他们共同获得2018年度图灵奖)在深度学习的总结性论文中指出:深度学习的根本性局限在于缺乏复杂推理能力。(cf.LeCun et al)而推理法代表着人类关于复杂推理能力的最高研究成果,所以推理法的局限性也代表着整个AI现有技术的局限性,封闭性对推理法的限制也是对整个AI现有技术的限制。

  二、人工智能的训练法

  训练法要求首先收集一组原始数据,并对其中的每一条数据都进行人工标准,做成训练数据集。然后用训练数据集训练一个人工神经元网络,用训练好的网络回答问题。

  图1是一个人工神经网络的示意图。图中每一个圆圈代表一个“神经元”,每一个带箭头的线段代表神经元之间的一个“连接”。人工神经元网络就是由大量神经元和连接组成的网络。一个连接可理解为一条信息通道,并对通道中传递的信息进行加权运算;也就是说,一条连接首先从一个神经元接受输入数值,经过加权运算,再按照箭头的指向,向下一个神经元输出加权计算的结果。图1省略了所有连接上的权值。

  如图1所示,一个神经元可以有多个输入连接,从而同时接受多个输入值。一个神经元也可以有多个输出连接,从而同时向多个神经元传递输出值。每个神经元能够独立地计算一个简单函数f,即根据该神经元的所有输入值,计算得出函数f的值之后,作为输出值向所有输出通道同时发送,经过各条连接上的加权运算之后,传递给其他神经元。在图1中, 是整个人工神经元网络的输入连接,具体输入值来自网络外部; 是整个人工神经元网络的输出,具体的输出值就是网络的计算结果。

  图1 一个人工神经网络示意图

  图1只画出了四列神经元,其他列被省略了。每一列神经元称为一个“网络层”。如果一个人工神经网络具有很多层,比如几十层、几百层甚至更多层,就称为“深层网络”,深层网络上的机器学习称为“深度学习”。

  下面以著名的ImageNet图像分类比赛中的一个任务为例,说明训练法的工作过程。在比赛之前,组织者收集了一个大型图片库,包含1400多万张图片,并将其中一部分图片做了人工标注,这些带人工标注的图片作为训练数据集,参赛队可以用这些图片训练他们的神经网络。图片库中没有标注的图片作为测试集。在比赛中,要求每一个参赛的图像分类软件,针对测试集中的大量图片,自动识别这些图片中动物或物品的种类,按识别正确率的高低决定比赛名次。

  这个测试集中的图片被人工分为1000类,其中每一个类用0至999中的一个数字进行标注。一个类包含几十张到一百多张图片,这些图片中的动物或物品的种类相同,所以这些图片被标注为相同的数字。这1000个类包括7种鱼,第一种鱼的所有图片标注为0,第二种鱼的所有图片标注为1,……,第七种鱼的所有图片标注为6;还包括公鸡和母鸡,公鸡和母鸡的图片分别标注为7和8;还有26种鸟的图片分别标注为9至34等等;一直到最后一类——卫生纸图片,标注为999。原始图片和人工标注的对照见表3。采集好的原始图片经过人工标注,训练集就制作完毕,可以用于人工神经元网络的训练了。

  如果训练之后,一个人工神经元网络的正确识别率达到了预定的要求(比如95%以上),就认为训练成功,可以应用了。正确识别指的是:对输入的任何一张图片,能够指认输出图片中动物或物品所对应的数字。比如输入公鸡的图片,人工神经元网络输出数字7;输入卫生纸的图片,则输出数字999。从实际效果来看,如果一个人工神经元网络达到了上述要求,就可以认为,该神经网络“学会”了识别图片中的1000类动物或物品。

  训练法也受封闭性的限制,具体表现为:可以用一组固定、有限、带人工标注的代表性数据,完全描述给定的应用场景。(参见陈小平,2020年a,2020年b)所谓“代表性数据”,指的是能够代表所有其他数据的数据。例如,上面的图像分类比赛例子中,如果只用训练集中的图片训练神经网络,就可以训练出合格的网络,那么这个训练集就具有代表性,代表了图片库中所有1400多万张图片。反之,假如一个训练集不具有代表性,用它训练出的神经网络就不合格,比如正确识别率到不了预定的要求,不能实用。

作者简介

姓名:陈小平 工作单位:

转载请注明来源:中国社会科学网 (责编:李秀伟)
W020180116412817190956.jpg

回到频道首页
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们