财新传媒
位置:博客 > 返朴 > 奥运奖牌榜应该怎么排?这是个学术问题

奥运奖牌榜应该怎么排?这是个学术问题

撰文 | 倪忆
 
东京奥运会上,广大吃瓜群众讨论的一个热门话题自然是奥运奖牌榜。在大多数版本的奥运奖牌榜里,各个代表队的排序是先按金牌个数排,金牌个数相同的情况下再按银牌个数排,银牌个数相同的情况下再按铜牌个数排。
八月七日上午的新浪奖牌榜
 
然而,不少美国媒体采用的排序方式是按照奖牌总数排,奖牌总数相同的情况下,再按金牌个数排。
同一时间的NBC奖牌榜
 
这两种排序方式应该说都有一定道理。前一种排序方式强调了金牌的重要性,而后一种排序方式更看重整体实力。对每种排序方式,都可以用某种极端情况来说明其不足之处。在前一种排序方式中,1金0银0铜的A代表队会排在0金10银10铜的B代表队之前,难道A的体育实力就强于B?在后一种排序方式中,0金0银6铜的C代表队会排在5金0银0铜的D代表队之前,这合理吗?
雅虎新闻里,两种排序都可以选择,却在柱状图上作了手脚,网友吐槽后才加以修改。见《雅虎奥运奖牌榜的秘密》。
 
也有人提出,可以用积分制来排名。比如金牌算3分,银牌算2分,铜牌算1分。但这样排名的合理性更成问题,有太多的人为因素。凭什么要这样算分,而不是金牌10分,银牌8分,铜牌6分?
 
排序方式的争议来源于高维数据本身的复杂性。每个代表队的奖牌数据包含了金银铜三种奖牌的数量,是由三个整数构成的三数组,可以看作是三维空间里的点。如果要把这些点排序,相当于要把它们排在一维直线上。在这一“降维”过程中,难免会丢失信息。
 
在生活中,我们经常会遇上各种排序问题,甚至为之吵得不可开交。光是在体育界,就有梅罗、科詹、费纳德等诸多争议。这些排序的困难在于,不存在一个单一的公认标准。
天龙三兄弟的武功排名是武侠迷中经久不衰的话题
 
比如说大学排名,涉及到大学的方方面面:学术成果、生源质量、教学水平、国际声誉、科研经费…… 各类排行榜的做法就是把涉及到的项目一一量化,再按照一定权重对每个项目赋予积分,再把它们加起来。最后排的就是总积分。且不说那些定量数据是否能真实反映大学在相关方面的水准,单是权重就有很多操作的空间,把权重稍微改变一下就会让排名变动很大。学界内部对这些排行榜有许多吐槽,却架不住学生、家长、校友们对排行榜的看重。
相对而言,大学的单项排名更容易,比如说挖掘机技术哪家强
 
再比如说对学者的排名。俗话说得好,文无第一,武无第二。学术研究跟体育竞赛不同,很难有一个客观的标准。伍鸿熙先生在《黎曼几何初步》序言中,曾用戏谑的口吻写道:“若真是能把一门严肃的学问当作一种体育比赛,以后可以玩的花样不可想象。比方说,人民日报第一页可能有如下标题:'Poincare与高斯在拓扑场上激战,Poincare大胜,五比零。'又或:'群论决赛,Abel苦战Galois,不幸以二比三败北'等等。” 然而,现实中的招聘、提职、评奖、申请经费又迫使人不得不作排名,于是连带产生了论文数、引用次数、影响因子、h-指数等一系列颇为无厘头的指标。
 
虽说排序在很多情况下是困难甚至无意义的,但数学家们其实非常热衷于排序。按照布尔巴基学派的观点,纯粹数学是研究抽象结构的理论。在数学里有三种基本结构:代数结构,拓扑结构,序结构。其中序结构就是在一个集合的元素中规定一个顺序。华罗庚先生在《高等数学引论》开头写道:“数起源于‘数’,一个一个地数,因而出现了
 
1,2,3,4,5,…,
 
这叫做自然数。” 可以说,数学的诞生就伴随着排序。
 
最常见的序结构就是实数的大小顺序。更进一步,利用字典排序法,可以比较任意两个有限实数组的大小。就像奥运金牌榜的排序一样,首先比较第一个数字的大小,在第一个数字相同的情况下再比较第二个数字的大小,依此类推。在这一规则下,(2,0,2,1) 就比 (2,1,2) 小。
 
把大小顺序加以推广,可以得到一种被称为“偏序”的序结构。简单来说,一个集合上的一个偏序就是某种规则,让我们可以对集合中的某些元素两两比较。之所以称为“偏序”,是因为我们并不一定总可以对任何两个元素进行比较。举个日常生活中的例子。对于身上所穿的衣物,可以定义一个顺序,就是正常穿衣应该采取的先后次序。在这个顺序里,内裤总是先于外裤,衬衣总是先于外套。但是外裤和衬衣之间就没有办法这样比较。既可以外裤先于衬衣,也可以衬衣先于外裤。如果任何两个元素都可以比较,那么这个偏序就被称作一个“全序”。
 
偏序的一个重要特征是传递性。比如说,如果这个顺序是一个大小关系,那么a<b并且b<c就能推出a<c。体育比赛中的胜负关系就不具有传递性。举个例子,中国足球队战胜了韩国队,韩国队则胜了德国队,并不表示中国队就可以战胜德国队。
中国足球队真的在正赛中战胜过韩国队哟
 
对于偏序,我们还要求它有禁对称性,也就是说,对于两个不同的元素a,b,不能既有a<b又有b<a。还拿体育比赛作例子,在双循环的赛事中,有可能中国队在一场比赛中战胜了韩国队,而韩国队在另一场比赛中战胜了中国队,——这同样不符合偏序的要求。
 
在数学里,除了常见的大小顺序,还有很多别的有意义的偏序。例如两个自然数之间的整除关系就是自然数集上的一个偏序。它满足传递性:如果a整除b而b整除c,那么一定有a整除c。它还满足禁对称性:对于不同的自然数a和b,不可能既有a整除b又有b整除a。整除关系所定义的顺序不是全序,比如2和3之间就没有整除关系。
 
一个序结构甚至不必是发生在两个元素之间的二元关系。还是拿体育来说事,假设你刚刚打开电梯,哦不,应该是打开电视机,看见转播长跑比赛,一群运动员正在环形跑道上奔跑,那么你能判断谁领先吗?显然不能。甚至在场上的运动员们自己都未必能判断。一个著名的例子是2004年雅典奥运会的女子万米长跑比赛。中国运动员邢慧娜率先冲过终点,但在她后面的三名埃塞俄比亚选手以为邢慧娜被自己套圈了,在冲刺阶段没能采取有效行动阻挡邢慧娜超越她们。
邢慧娜在冲刺阶段超越对手,亚军则面带微笑,以为自己即将夺冠
 
所以对于环形跑道上奔跑的运动员来说,根据他们的瞬间位置来说谁在谁前面是没有意义的。然而,如果我们同时考虑三名运动员A,B,C的位置,那么我们可以谈论ABC的位置是顺时针还是逆时针。(这里假定他们之间没有并列。)这就定义了一个序结构,称为“循环序”。因为我们必须要三名运动员才能谈顺时针或是逆时针,所以循环序里的关系是一个三元关系。循环序有一个有趣的特征:如果ABC是顺时针,那么BCA和CAB都是顺时针。
 
形形色色的序结构在数学里发挥着重要的作用。在很多数学问题里,如果能找到一个合理的序结构,就能极大地推动问题的解决。这方面近年来最著名的例子是俄国数学家佩雷尔曼对于庞加莱猜想的证明。大家知道,佩雷尔曼发表在预印本网站上的三篇论文非常晦涩难懂。然而,佩雷尔曼第一篇论文的开头就干净利落地定义了一个“熵”并证明了相应的熵增原理。用序结构的语言来说,他发现了一个新的偏序结构。这本身就是一个非常重大的突破。专家们之所以对佩雷尔曼的工作抱有极大的信心,主要原因就是这一发现。
佩雷尔曼在证明庞加莱猜想后退出了数学界
 
序结构如此重要,以致于数学家们热衷于排序。然而,对序结构的深刻理解也让数学家们对于排序的态度更加超然。毕竟,排序可以是偏序,而不一定是全序。即便是全序,也可以有许多不同的排序。用日常语言来说,不是任何两样事物之间都能比较,即便能比较也不是只有一种固定的比较方式。
 
读者:虽说如此,我还是想知道北大清华哪所学校才是南波万。还有,谁是世界上最好的数学家?陈省身在二十世纪数学家里能排多少名……
 
本文经授权转载自微信公众号“普林小虎队”。



推荐 1