内容摘要:
关键词:
作者简介:
Does "Big Data" Mean Strong Wisdom? Also Concerning Green Artificial Intelligence as a New Development Direction of Information Technology
作者简介:徐英瑾,复旦大学哲学学院教授。上海 200433;王培,美国天普大学计算机与信息科学系副教授。
内容提要:就目前情况而言,对于大数据技术运用的商业前景,溢美之词虽不绝于媒体,却罕有从信息技术哲学之高度做出对于该技术观念前提的批判性反思。实际上,大数据技术的运用必须以大数据的可获取性为现实条件,此可获取性只是当下历史机缘之恩赐而已,绝非人类社会运行之常态。而在这一前提缺失的情况下,大数据技术原有的利好面亦将迅速失效。基于此考量,我们倡导以所谓“绿色人工智能技术”作为大数据技术的替代者,以便通过对于信息处理平台自身“拟人性”的提高来降低其对于大数据的依赖,以期能最大限度地避免对公众隐私权的侵犯。而在此类新数据算法的设计过程中,德国心理学家吉仁泽提出的“节俭性理性”原则亦可成为相应的哲学指导。
关键词:大数据技术/绿色人工智能/节俭性理性/统计学
标题注释:本文系国家社科基金重大项目“基于信息技术哲学的当代认识论研究”(15ZDB020)的阶段性成果。
原发信息:《学术研究》第201610期
一、导论:大数据技术与人工智能的相互竞争
所谓“大数据”(big data),乃是指在利用常规软件工具的前提下无法在可承受的时间内捕捉、管理和处理的数据集合。而所谓“大数据技术”,自然就是指那些利用非常规的软件工具对上述数据集合进行捕捉、管理与处理的技术。按照《大数据时代——生活、工作与思维的大变革》一书的作者迈尔—舍恩伯格(Victor Mayer-Schnberger)与库克耶(Kenneth Cukier)的观点,与传统的统计学技术相比,“大数据技术”的特点便在于:研究者不对研究对象进行随机抽样以获取相对可控的样本空间,而是直接将全部研究对象都作为样本空间。在他们看来,之所以这样做是可能的,乃是因为计算机科学在硬件方面的突飞猛进式的进展,已为大数据的存储与计算提供了极大的便利;而之所以这样做同时又是必要的,则是因为数据科学家发现:在算法不变的情况下,数据量本身的增长就足以大大提高预测的准确度了。[1]①同时,互联网的广泛使用所导致的海量数据的出现,也使得“大数据分析机器”的运作所需要的“弹药”似永无枯竭之可能。然而,时下国内的媒体宣传,似乎更多地聚焦于大数据技术所可能带给人类社会的种种便利之上,却对其自身的局限性着墨不多。而在为数不多的对于大数据技术负面作用的讨论中,更多地被提到的,乃是对于相关技术的滥用所可能导致的伦理风险,如“数据贪婪症”对于个人隐私的威胁,以及商业决策层以及政府首脑对于“数字化独裁”的迷信所可能导致的决策失误,等等。[2]但是,却很少有人从信息技术哲学与认知科学哲学的角度,更为深入地检讨大数据技术自身在哲学思想前提与路径策略方面的得失。而对于上述理论盲点的覆盖,也正构成了本文写作的初衷。
“大数据技术”其实只是早已枝繁叶茂的“信息技术之树”在最近所抽出的一根新枝而已。从总体上来看,教科书意义上的“信息技术”可分为计算机技术、通讯技术与传感技术等数大研究方向,而其中最为兴盛的“计算机技术”则至少包含了两个与“大数据技术”最为密切相关的技术分支:“人工智能技术”与“互联网技术”。如果将“人工智能技术”比作汽车制造业,而将“互联网技术”比作筑路业的话,那么,所谓“大数据技术”的目标,便是“利用既有的路网去直接完成旅行任务”——而在此过程中,旅行者既不需要“买车”,甚至也不需要去“租车”!或说得更技术化一点,大数据技术试图通过回避高级认知架构与思维路径设计的方式,直接对“信息高速公路”上涌现的数据进行利用,由此完成原本的人工智能程序所试图完成的某些任务(如“模式识别”、“自然语言自动化处理”等)。从这个角度看,大数据技术的崛起,无疑为广义上的“信息技术哲学”提出了如下问题:上述这种跳开“坐车”环节而直接利用既有信息通路达成目的的技术思路,在多大程度上是可行的?又在多大程度上是有局限的?而其可行性与局限性背后的深层根据又是什么呢?







