数学是一种隐喻-返朴的财新博客-财新网

本文为数学家Yuri Ivanovich Manin在1990年国际数学家大会一个小组会上的发言。他将数学视为一种比喻, 他强调：对数学知识的诠释是具有高度创造性的行为。在某种程度上, 数学是一部关于自然和人类的小说。你不可能准确地说出数学教给我们的是什么, 正如你无法准确地说出《战争与和平》教会了我们什么一样。数学教学本身往往被对这种教学的重新思考所吞噬。

撰文 | Yuri Ivanovich Manin

翻译 | 袁向东

校对 | 冯绪宁

导言

1902, H. Poincaré首次出版他的著作《科学的假设》(La Science et l'hypotése), 它成了一本畅销书。该书的第一章涉及数学推理的性质。Poincaré讨论的是人们熟知的哲学争论问题：数学知识能够化归为某些基本的 (“综合的”) 真理的同义重复的长链, 或是它还含有其它的东西? 他论证说, 数学的创造力归因于对初始假设及定义的自由选择, 其后, 通过对推演出来的结论和可观测世界的比较, 对这些定义和假设加以约束。

比起 Poincaré 时代的人, 我们似乎对精细的哲学思考已兴趣大减, 这倒不是科学本身变得不那么大众化之故。象 S. Weinberg 的《最早的三分钟》(The first Three minutes) 和 S. W. Hawking 的《时间简史》 (a Brief history of time) 就受到极大的欢迎, 各处的报纸都给予好的评论。问题在于人们的普遍兴趣的基调已经变了。对新的物理理论的自悖性 (paradoxality), 人们不再表现得那么激动, 而更多地是从实用主义的角度去理解和认知 (对观赏艺术的认知与此极为相象：最初展出印象派画家的作品是一种精神上的革命, 但战后先锋派掀起的毎一次新潮都立即带上了学院派的家族特色)。

在这种氛围中, 过去那种有关数学基础危机和无穷的本质的激烈讨论, 看来几乎目前的情势无关, 似乎肯定是不合时宜的。听众对有关数学教育或是新一代计算机的事有着更强烈的兴趣。

因此, 我决定在本小组的会上提交一篇不加虚饰的文章, 在其中我把我们这门科学看作是一类特殊职业人员关于自然语言的一种通用语, 并视其所起的作用为一种特殊的说话方式 (a special case of speech) 。这也意味着我会谈及中学与大学的数学训练问题。

比喻主义(Metaphors)

比喻 (“metaphor”) 这个词在这里是作为非专用词来使用的, 下述引语——引自 P. Carse 的书《有限与无限的游戏》——最能表达它的含义：

比喻是像与不像的结合, 使得任何一物决不可能变成其它东西。

“从根本上说, 全部语言具有比喻的特征, 因为不管它用来表示什么, 它仍旧只是语言, 绝对跟它所表示的东西不相等。”

“自然 (nature) 的不可言表性正是语言的可能性之所在。”

”将数学视为一种比喻, 我想要强调的是：对数学知识的诠释是具有高度创造性的行为。在某种程度上, 数学是一部关于自然和人类的小说。你不可能准确地说出数学教给我们的是什么, 正如你无法准确地说出《战争与和平》教会了我们什么一样。数学教学本身往往被对这种教学的重新思考所吞噬。

这种看法似乎跟历史悠久的用于科技计算的应用数学的传统不符。

事实上, 我只想让数学基于技术的一面和基于人的本性的一面恢复到某种平衡的状态。

两个例子

让我通过讨论两个互不相关的对象：Kolmogorov 复杂度 (complexity) 和 K. Arrow 的“独裁者定理”(“Dictator Theorem”), 来试着说明数学这种比喻的潜在威力。

(1)自然数的 Kolmogorov 复杂度是指能生成的最短程序的长度, 或者说的最短代码的长度。读者可以想象一种整数编码的方法, 它是部分递归函数(partial recursive function), 其值为整数。Kolmogorov 定理说, 在所有这类函数中, 总存在一些在下述意义下最经济的函数：若是使得的的最小值, 那么, 常数, 其中的常数仅依赖于而不依赖于 .

由于能够由二进制记号重新构作, 生成的最短程序的长度不超过 . 这个函数, 或毋宁说是由一个有界加数 (a bounded summand) 所限定的所有这种函数的类, 是 Kolmogorov 复杂度。

首先, 常数。这很符合历史上成功使用的位置记数系统, 后者为我们提供了数的对数长度 (logarithmic length) 的生成程序。然而, 总能找到大的整数, 其 Kolmogorov 复杂度比起它们的记号的长度小得多, 例如常数。一般地, 当我们使用大数时, 似乎只是在用那些其 Kolmogorov 复杂度相对小的数。甚至的那些十进小数——它们也许是数学家算出的定义明确的最长的数了, 但它们在 Kolmogorov 意义下是简单的, 因为常数。一般而论, 小的 Kolmogorov 复杂度=高的组织程度。

另一方面, 几乎所有的整数具有接近于的复杂度。例如, 若对于一个最理想的有 , 那么等价于 . 这样的整数具有许多令人注目的性质, 我们通常把这种性质跟“随机性”联系在一起。

其次, Kolmogorov 复杂度很容易对并非是数的离散对象——诸如俄文或英文的文本——加以定义。因此, 我们可以给《战争与和平》的复杂度以相当明确的度量; 它的不确定性 (indeterminacy) 跟最优编码方法的选择有关; 如果你选择到一个为数并不多的比较好的编码, 那么不确定性似乎很小。

问题：《战争与和平》是具有高度组织的对象还是一个几乎是随机组合的对象?

第三, Kolmogorov 复杂度是非可计算的函数更准确地说, 若是最优的(optimal), 那么就不存在跟的差为的递归函数 . 你只能用可计算函数来界定复杂度。

我觉得在讨论人类知识的性质时, Kolmogorov 复杂度是一个必须牢记在心的概念。

只要我们的知识的内容由符号来表示 (词语、数、字、…), 我们得以保存和处理的信息量就受到物理条件的限制。我们总要依赖各种信息压缩的方法, Kolmogorov 复杂度对这种压缩的效率加上了一些绝对的限制。当我们说起, 比如由运动方程表示的物理定律时, 我们是指一个物理系统的行为的精确描述可以通过将这些定律转换成计算机程序而实现。但是, 我们能够发现和利用的定律的复杂度是清楚地被界定的。我们能肯定不存在具有任意高的复杂度的定律支配着只是“初等的”系统吗?

讨论到这儿, 已经完全不是数学了。在座的都是数学家, 我必须就此止步。不过, 这也是一切比喻的命运。

(2) Arrow 的独裁者定理大约是在 1950 年发现的。从数学上讲, 它是一条组合学的陈述, 描述某种以二元关系取值的函数。直观上看, 它是有关社会的选择 (Social Choice) 问题的形式化的讨论, 假定立法者要制定一条法律, 用以使投票者的个人意愿服从集体的决定。如果问题是从两个供选择对象中择一, 标准的办法是得票多的当选, 然而, 通常的候选者都超过两个 (试想一下资金分配问题), 于是就要求投票人根据他们的好恶将候选者排序。那么, 能够从任何一组表述个人嗜好的数据中提取出集体决定的算法该是什么样的呢? Arrow 考虑了一些自然而符合民主的公理 (例如, 对于和 , 若每个人都更喜欢而不是 , 则社会将选择而不是 ) 。然而, 他发现, 当选择对象多于两个时, 问题得以解决的唯一办法是任命一位成员 (“独裁者”), 并让他的个人嗜好成为社会的嗜好。 (实际上, 这是后来发现的 Arrow 定理的各种改写版本中的一种。它也只适用于有限社会(finite society)的情形; 对无限的情形, 可通过高精度过滤器(ultrafilter, 不妨称之为“统治阶级制度”)来做出社会决定。)

在某种程度上, 这条定理以例子阐明了 J-J. 卢梭的社会契约的思想的要旨。

理想化的民主选择

这一概念所内含的基本矛盾, 可用下述有三名投票人和三个选择对象的事例加以说明. 故事说有三位游侠骑士来到一个叉路口, 那里有一块碑石, 上面铭刻着预言路人将要遭难的碑文：

向左走的人将失去他的剑; 向右走的人将失去他的马; 朝前走的人将失去他的头。

”骑士们于是下马商量对策。这个故事的俄罗斯版本中, 这些骑士都是有名姓和个性的：最年轻而充满激情的叫阿辽沙·波波维奇, 岁数最大又最聪明的是多布雷尼亚·尼基季奇, 年龄居中的是位慢性子的农夫, 名叫伊利亚·穆罗梅茨。阿辽沙认为他的剑比马更重要, 他的马又比他的头更有价值; 多布雷尼亚认为他的头最重要, 其次是他的剑, 再其次是他的马; 而伊利亚看重他的马甚于他的头, 他的头又甚于他的剑。

读者会注意到, 他们每一位的偏爱物的次序组成的是同一个循环 (只是起点不同), 结果是：你可以在任意两个选择对象间根据多数意见作出选择, 但这些决定合起来看是矛盾的。民主程序不可能为我们提供一张规定好选择次序的表。骑士们无可奈何只好把决定权交给多布雷尼亚。

Arrow 的定理有没有告诉我们一些以前不知道的事情呢? 是的, 只要我们打算认真严肃地讨论这条定理, 也就是说, 要仔细地看看它的组合证明, 简要地想象一下各种假设可能在现实生活中出现的情况以及在其中的基本逻辑步骤, 并依靠严格的数学推理的逻辑来完善我们的不严密的想象。例如, 我们能更好地理解政策制订中的某些骗局和意想不到的危险, 整个社会很容易 (甚至是全心全意地) 陷入其中 (诸如不加质疑地接受在位的统治集团提出的供选择的对象的表, 尽管编制这类表可能是作出社会抉择的中心课题)。

至此, 我们进入了这次讨论的主题：数学推理跟自然语言的论述到底区别何在, 为何帕斯卡“秩序” (Pascalian “ ordre”) 统治着我们专业化的符号活动, 是否它真的因“深奥而无用”了呢?

语言和数学

大约 30 年前, 数学与人类相互作用、相互影响的一个十分有趣的时期开始了：人们首次严肃认真地尝试了自动翻译问题, 最初的努力, 让人痛心地失败了, 至少对许多乐观派人士是如此, 他们原以为在这一领域不存在基本的障碍, 所要做的只是去克服处理极大量信息所带来的技术性困难。换言之, 他们想当然地认为, 翻译在原则上是靠并不十分复杂的算法进行的, 该算法只需弄得很清晰并补足写成为一种计算机程序即可。

这一想法是数学比喻的一个很好的例子 (实际上, 它是用于脑科学研究的一般的“计算机比喻” (computer metaphor)的实例)。

这个比喻已证明了对理论语言学特别富有成效, 因为它迫使语言学家开始以前所未有的清晰性和完整性来描述人类语言中的词汇、语意, 词法和句法. 通过这种程序, 人们发现了某些全新的概念和工具。

然而, 自动翻译已取得 (和正在取得) 的成功是很不够的. 业已清楚, 写成文字的人类语言, 对任何用于翻译甚或是演绎的算法操作而言, 乃是最坏的输入数据。 (我在这里“然而”一番, 是因为人类语言作为诸如统计研究的素材并无任何特别之处) 。

上述事实可被认为是人类语言的普遍性质, 并值得加以关注你必须首先舍弃 (尽管出于十分朴素的考虑) 一种惯常的说法：由于人类语言的 含义世界 太广大又太松散, 至不可能出现一种组织得很好的用于描述它的元语言(译注: 即用于进行语言分析的语言)。问题的关键在于, 即使我们把这个世界严格地限制在小整数量的算术这种子集内, 我们仍面临着同样的困难, 事实上, 这一困难正是必须将整个算术符号体系具体化, 将计算的基本规则具体化, 进而将符号代数具体化的决定性理由. 甚至人类语言的基本算术词汇从根本上讲是古式的：原始社会中的有限自然数序列“壹、贰、叁、无限多”, 在指数尺度上被重新导出, 成了我们的“千、百万、十亿, 无穷数 (zillion)”。相对小的数 (像 1989) 的表示实际上是它的十进制名字而不是这些数本身。

Viète 的代数优于 Diophantus 的半词语代数, 其理由并非是它能表示新的含义, 而在于它对算法操作具有无可比拟的极高的灵敏度 (susceptibility)(我们中学代数中的“恒等变换”)

科学语言 (the language of science) 的特征是文本 (text) 和它的生产者/使用者之间在直观性和情感纽带方面的破裂, 但它从新的计算的自动化中得到补偿。在它们适用的 (虽是受限制的) 领域中, 科学语言已证明比使用日常语言叙述的传统, 即柏拉图和亚里士多德式的文化, 有着无法比拟的更高的效率。那么, 为什么我们的科学论文还要写成词语和公式的无组织的混合物呢? 部分原因是我们还需要那些情感纽带, 部分原因则是某些含义 (像人类价值) 用人的日常语言能给予最好的解释。但是, 即使作为科学语言的一种媒体, 人的语言也有着某些固有的优点：借助空间和定性方面的想象, 它能帮助我们理解各种“结构稳定”的性质 ('structurally stable' properties) , 诸如自由参数的数目 (维数), 极度状态的存在性, 以及对称性等。直率地讲, 它使得我们有可能使用对科学的比喻。

比喻和证明

我想, 我在这里宣扬的观点跟中学和研究生课程有关。

本世纪前半叶的普通数学教育具有应用的倾向。它教给学生处理日常生活问题和向学院水平的工程与科学计算平稳过渡所需的最低限度的基本知识和技能。但是, 我们越来越清楚地感到, 这种课程设置由于专业数学家的活动而中断了。众所周知, 在美国出现了新数学 (New math), 在其他国家也有类似的数学教育大纲. 这些大纲规定在中学讲授从数学专业训练中借用来的各种概念和原理：集合论, 公理化的证明方式以及强调严格定义的教学方法。

新数学 曾被广泛地接受, 但是它的传播也伴随着抗议的声响; 到 70 年代和 80 年代, 这种抗议已汇成一部大合唱。评论家们不同意新数学拥护者的基本要旨。且不论基于认知科学和学习心理学的反对意见, 我只来回忆那些涉及证明在数学中的作用的总的估价意见。

众所周知的 N Bourbaki 的论述代表了一种观点：“自希腊时代以来, 所谓数学, 亦即证明。” 依照这种理解, 严格的证明成为新数学教学大纲中的原则问题, 理由是这样的：

a)证明帮助我们理解数学事实;

b)严格证明是现代专业数学中最本质的要素;

c)数学具有得到普遍承认的严格性标准。

这些观点受到了广泛的批评, 诸如 Gila Hanna 在其书《数学教育中的严格证明》(OISE Press, Ontario, 1983) 中所做的那样。特别地, Gila Hanna 指出：数学家们远非是全体一致地接受这种严格标准的 (参照逻辑主义者、形式主义者和直觉主义者之间的争论); 从事研究的数学家经常违背该书中指出的所有规则。

按照我的看法, 这种批判有点文不对题。

问题的要害在于由于强调证明而造成的各种基本价值观处于不平衡状态。证明本身是“真理”概念的衍生物. 而除了真理, 还有其他价值观念, 其中包括“活力” (activities), “美”和“理解”, 这些在中学教学及其后的教学中都是本质的要素. 忽略这些价值观的教员 (或大学教授) 会失败得很惨. 不幸, 这也不是人们的普遍认识。对围绕 René Thom 的突变理论的争论所作的社会学分析表明, 引起这场争论和批判的正是价值取向从 形式真理 转向理解所致。当然, 突变理论是一种成熟的数学比喻, 而且也只应该这样来评价它。

从教育学的角度看, 证明只是各种类型的数学内容中的一种。还有许多不同类型的数学内容：计算, 附有解释的纲要, 计算机程序, 算法语言的描述, 还有常被忽视的关于形式定义和直观概念间联系的讨论。每一类型都有其自身的规则, 特别地有其严格性的规则, 它们之所以尚未被整理出来只是因为它们还没有受到特别的注意。

教师的关键任务是在他或她的课程所限定的范围内, 展现和论证数学活动及其基本价值取向的多样性。当然, 各类的内容要按等级加以组织。目标可以是从获得初等的算术和逻辑推导能力到编制程序的能力, 从最简单的日常生活问题到现代科学思维的各种原理。在由这些目标织成的谱系中, 强调“严格证明”的各种基准, 这就有把握占领周边的阵地了。

说过这些, 我必须强调我的论证绝不是想贬斥严格的数学推理这种观念。这种观念是数学中的一条基本原则, 从这个意义上讲, Bourbaki 肯定是对的。由于没有外部的客观的研究对象, 工作的基础又是基于有限的热爱数学者圈内的意见一致, 所以若没有严格的规则加以持久不懈的控制, 数学便无法发展。在严格意义上的数学的可应用性 (像在阿波罗登月计划中数学的不可或缺性) 缘于我们控制具有令人吃惊的长度的符号演算的能力。

严格推理这一观念的存在, 比起事实上很难达到严格推理显得更为本质。数学的自由 (G. Cantor) 只能在 严酷的必然 (iron necessity) 的限度内发展。现代计算机的硬件就是这种必然的体现。

比喻帮助人类在这神化的纯净空气中呼吸。

本文来自数学译林。原题：Mathematics as Metaphor. 译自：《Selected Papers of Yu. Ⅰ. Manin》, World Seientific, Vol. 199, pp. 557-564. 该文作者在 1990 年国际数学家大会一个小组会上的发言, 由作者本人将此文收入他的选集——译注

本文经授权转载自微信公众号“数学文化”，载于《数学译林》，“数学大院”经授权编辑整理发布。

话题：