财新传媒 财新传媒

阅读:0
听报道

撰文 | 周涛(电子科技大学教授)

 

01

随着大数据关联分析和深度学习等工具的流行,我们变得越来越少谈论因果。在大多数时候,我们将输入的数据一股脑儿“喂”进装着神经网络的黑匣子的一端,在黑匣子外面,我们只能听到神经网络的“咀嚼声”,然后就是从另一端落下来的预测结果。 

在少数更好的场景中,我们可以讨论两个或者多个变量之间的关联。至于因果,则是一件公认的危险玩意儿,我们一般缄口不谈,即便谈到了,也是晦涩审慎,在它身边堆满了“暗示”“可能”“潜在”等还没有上战场就已经举白旗的投降词汇。这是因为,我们缺乏一套在数学上可靠且行之有效地处理因果的方法和工具。 

那么,在人类认识世界的过程中,“因果”是一个稀罕物吗?恰恰相反,在绝大多数时间,因果是我们认识世界的手段和目的——我们坚信万事万物的存在、运动和转化都是有原因的,并且习惯用已知的因果关系推导未知的因果关系。 

且不说牛顿定律、量子力学、化学反应方程式、遗传定律等可以表述为因果的科学理论,就算是亚里士多德的“四因说”(形式因、质料因、动力因、目的因)和“力是维持物体运动的原因”、托勒密的地心说等已经被抛弃的学说,以及各种并不科学的竞合的宗教教义,都没有超出因果的框架。 

可以说,在很长一个阶段,人类的科学史甚至整个思想史,都是因果推出因果、因果战胜因果的历史。 

复杂系统进入科学视野,第一次从根本上挑战了传统的因果方法,因为第一性原理和还原论方法,显然无法刻画包含多个异质个体复杂相互作用且充满不确定性的生物系统和人类系统——牛顿力学可以让火箭上天,但却对上下班高峰期的交通拥堵无能为力。 

当我们试图将真实复杂系统简化成一个仿真模拟的系统时,我们所秉承的还是因果的方法(机制模型),但当系统复杂到无法仿真而只能通过分析观察数据窥探天机时,因果方法就力不从心了。

基于复杂系统的真实数据,采用暴力的关联分析方法(例如回归分析)和预测算法(例如深度学习),我们可以观察到数据之间的关联,还能得到“相当可信”的预测结果。这对于一些浅层次的应用而言,似乎已经足够了,尽管这些都不会增加对于系统运行机制的理解。 

 

02

这些暴力手段一度让我们迷失,各种各样的数据拟合方法和黑匣子预测机器成了学术界的新宠,以至于10年前英国学者迈尔-舍恩伯格在具有全球影响力的《大数据时代:生活、工作与思维的大变革》一书中呐喊“大数据时代需要放弃对于因果关系的渴望,而只需关注相关关系”。 

这种倾向性是非常危险的,我在上述一书的序中曾说,“认为相关重于因果,是某些有代表性的大数据分析手段里面内禀的实用主义的魅影,绝非大数据自身的诉求”“放弃对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势”。 

当然,相关性并不是因果性的敌人,实际上,发现相关性往往能够提示可能的因果关系。只不过,对于相关性的过度依赖和对因果性的忽视,有可能让我们的结论都建立在空中楼阁上。而没有了因果的支撑,即便看到了预测结果,也没有办法进行有效的干预。 

在重新审视因果的重要性和中心性的时候,图灵奖获得者、美国国家科学院院士朱迪亚·珀尔这本《因果论:模型、推理和推断》就显得特别重要。

在这本书中,珀尔明确指出因果不是一个统计概念——统计研究的是变量的静态性质,而因果关注的是变化带来的变化。以此为基础,珀尔明确了因果关系的数学含义,并且提出了包括do操作、反事实操作等一系列分析因果关系的方法和工具。 

更为重要的是,珀尔指出,“所有的知识都来自数据本身”这种研究范式存在极大的局限性,要获得可靠的因果关系,还需要数据之外的信息和知识,例如常识和领域知识。 

表面上看,珀尔的方法往后退了一大步,但正因为不再坚持从观察数据中得到一切,我们所得到的恰恰是更加可信和可靠的。 

全书深入浅出,基本不需要特殊深入的基础知识,就能理解因果分析最精细微妙的前沿——当然,这里面最美的东西,依然是通过公式表达的。这本书还包括了很多有趣的例子,以及历史上有关因果性和相关性的若干悖论和趣题。

阅读本书无异于一场美妙的旅行,既能看到万古河山的雄奇,又能品味江南园林的精致。

 

本文经授权转载自微信公众号“中国科学报”,编辑:赵路。

 

话题:



0

推荐

返朴

返朴

2662篇文章 1天前更新

溯源守拙·问学求新。返朴,致力好科普。

文章