首页 >> 哲学 >> 科学技术哲学
贾向桐:大数据的新经验主义进路及其问题
2018年06月28日 10:46 来源:《江西社会科学》 作者:贾向桐 字号

内容摘要:

关键词:

作者简介:

New Empiricism Approach to Big Data and Its Problems

 

  作者简介:贾向桐,南开大学哲学系教授,博士生导师。天津 300350

  原发信息:《江西社会科学》第201712期

  内容提要:大数据的新经验主义进路强调数据本身的自足性与独立价值,进而把科学研究的新范式界定为“数据-驱动”,以区别于传统科学研究的“理论-驱动”模型。在大数据主义的这一新经验主义解释中,“观察负载理论”观念受到质疑,经验数据重新成为认识论的决定性环节。随着大数据主义的深入发展,科学的认知形式由个体主义认知转向社会群体的分工与合作模式,而其相应认知范式也由对自然的因果规律研究转向对数据间的关联性探索。

  关键词:大数据经验主义/数据-驱动/认知个体主义/关联性

  标题注释:天津市哲学社科重点项目“当代科学哲学的自然主义进路研究”(TJZX17-001),南开大学亚洲研究中心项目“当代结构实在论发展的脉络、问题与意义”(AS1514)。

 

  大数据对当代科学哲学产生的影响莫过于其新经验主义进路的阐释。以数据密集型科学为基础,一些较激进的大数据主义者看到在新科学技术背景下再次发展经验主义认识论的可能性。例如,吉姆·格雷(Jim Gray)提出科学的“第四范式”(the fourth paradigm),强调在数据科学中理论、实验与模拟的统一性,而克里斯·安德森(Chris Anderson)则进一步发出“理论的终结”口号。虽然吉姆·格雷等人的表述各有不同,但其经验主义立场上还是基本一致的,他们都认为,“大数据实质上促使科学知识生产的经验主义模型成为可能”[1]。为方便起见,我们将这种在大数据推动之下产生的新的经验主义研究范式统称为“大数据的经验主义”(Big Data Empiricism)[1],鉴于新经验主义的重要性以及学界对此问题的研究现状,本文将从新经验主义的内涵、认知特征及其基本观念的转变等层面来分析大数据新经验主义进路的逻辑与问题。

  一、新经验主义的内涵:从“理论-驱动”到“数据-驱动”

  历史主义科学哲学之后,“观察负载理论”观念逐渐深入人心,传统经验论的观察中立说逐渐失去市场。在观察负载理论的支持者看来,科学认知活动并非完全客观中立的,科学家的认识总要以某种观念或假说为先导,作用于科学认识的过程和结果,科学认识不可避免会受到先行理论或观点的污染和影响。这就是说,科学家的认知活动总是以先在知识或理论为动力和先决条件。大数据新经验主义认为,这一理论是传统科学方法论得以成立的前提,并把这种认知范式称为“假说-驱动”(hypothesis-driven)或“理论-驱动”(theory-driven)式的科学。马佐奇(F.Mazzocchi)总结说:“这种科学方法包括表述用实验分析假说结果的假说-检验过程。这样一个过程已经应用了数个世纪,基本为西方社会所接受,它被认为是产生坚实知识的可靠方法。”[2]所以,在大数据的新经验主义对“理论-驱动”科学范式的理解中,演绎法居于认识论的中心地位,科学家们先要“建构假说和模型,然后用以数据为基础的实验和样本来检验它们”[1]。

  如此一来,处于经验数据和科学理论之间的传统科学方法,处理的便正是从经验到理论的演绎关系。为此,波普尔对科学方法论的演绎理解也成为大数据主义反思和批判的主要对象,他们还进一步援引波普尔的话来证明:“我们单独开始于纯观察,而没有任何理论本质,这种信念是荒谬的。”[3]即使是现代科学研究中最重要的“实验方法,在某种程度上,也是有意操纵自然的技术”,所以科学研究的模式是“用典型的科学问题和试探性假说来解决问题”。[3]因此,在新经验主义看来,这种传统科学认知范式是反归纳的:“波普尔告诉我们,收集观察和希望通过观察之间的相似性是完全没有意义的。”[3]因为休谟问题已经指出,从逻辑上讲,单纯有限的经验不可能上升到理论,因为经验与理论是不同质的,这只能说明科学理论并非是从经验数据归纳而来。再者,经验数据本身不但是可错的,而且又为理论所负载,所以事实上经验并不具有人们想象的那种客观性基础,这就意味着以归纳为基础的认知模式是没有意义的。故此,新经验主义认为传统方法论强调“演绎推理是科学中主导性的研究模式”,这就是科学哲学通常所说的“假说-演绎方法”:“在演绎路径中,假说是先验给定的,数据是积累的,对其分析决定着对假说的支持程度。”[4]

  但当代大数据的发展,对传统以“演绎”为中心的科学认知范式产生了重大冲击,甚至由此“大数据开启了经验主义的一个新时代”[1]。具体来说,这一新时代的出现和发展得益于“利用计算机从创制和储存在我们电子存储库中的数据里获取认识范式”的大数据技术的进展,这使得“巨量数据的积累和分析”成为可能。[5]海量数据由此已经不同于传统小数据的科学研究:数据因为本身的巨量存在,可以独立于理论而自己说话,并展示自身的真理性。正因为如此,安德森进一步断言:“数据的泛滥导致科学方法论失效了。”[6]这里所说的科学方法论,就是以假说和演绎为中心的传统科学认知模式。他们断言方法论失效,就意味着假说和演绎在科学研究中的地位弱化甚至消失,也就是说,科学研究无需假说和演绎作为人们认知的基础,“假说-驱动”的科学范式在大数据时代失去意义。这一点是新经验主义的核心观念,我们可以进一步将其简单概括为这样一种认知范式:“大数据可以涵盖整个领域,并提供所有问题的解决方案。”所以,我们的科学研究和对世界的认知“不需要任何先验理论、模型或假说”。[1]

  换言之,大数据技术的发展突破了以往的“理论-驱动”范式,使“面对大量数据的假说、模型、检验的科学方法变得毫无意义”。[6]由此,新经验主义认为,人们的认知范式由理论(假说)引导变为“数据-驱动”,这种以数据为驱动力的科学研究模式,在颠覆“观察负载理论”观念的基础上,通过大数据具有的“海量性”“多样性”和“高速度”等特征,重新肯定经验的根本意义和独立价值。我们可以把新经验主义认识论的意义概括为两个层面的内容。首先,大数据主义对数据会“自己说话”的断言是要重新肯定经验数据在认识论的基础性地位,“数据的意义超越于语境或特殊的知识范围”,这就意味着数据本身就具有“内在的意义和真理性”。[1]因此,经验数据自身是自足的,它是科学研究和认知的中心环节,用大数据主义的话说,就是数据本身(而非理论或假说)推动科学的发展,“新科学发现的途径将由我们正在积累的大量数据集合所推动”[5]。其次,大数据背景下的新经验主义重新肯定了以“归纳”为中心的经验主义方法论的意义,科学认知在“本质上是纯归纳的”[1]。这是“数据-驱动”科学在方法论方面的基本含义,为此,在大数据支持者看来:“这一路径的核心是使用归纳规则:‘归纳推理通常总是未完成的,推理的结果更可能的是改变已经做出的推理,有可能继续没有止境的推理,最佳归纳规则是进化的。’”[2]

作者简介

姓名:贾向桐 工作单位:

转载请注明来源:中国社会科学网 (责编:李秀伟)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们