人口普查是全面掌握人口状况的重要手段,不过人口普查对计算机行业发展的重要性似乎鲜为人知。
美国科学史专家大卫·罗伯茨(David Lindsay Roberts)在其专著《数字共和国:历史上美国人数学的意外故事》(Republic of Numbers: Unexpected Stories of Mathematical Americans through History)中讲述了这段历史故事,其中包括1896年12月3日,第一家自动化数据处理公司——制表机公司的成立。
编译 | 希区客
人口增长迫使工作方式改变
若只为统计人口数量,人口普查工作相当简单——各州上报总人口数即可。但美国的人口普查绝非简版。我们可以将故事追溯至1787年制宪会议中的“五分之三妥协”:美国南方与北方达成的协议,将奴隶的实际人口乘以五分之三,以作为税收分配与美国众议院成员分配的代表性用途。1790年的第一次人口普查也根据年龄和性别进行了区分。在随后的几十年里,包括职业状况、婚姻状况、教育状况、出生地等个人信息都成为普查时所要填写的内容。随着国家发展,每次人口普查都需要投入比上一次更大的努力,不仅收集数据,还要将其汇编成可用的形式。1880年人口普查的数据处理工作直到1888年方才完成。当时的它已经成为一种无聊到让人麻木且容易出错的文书工作。鉴于人口还将继续快速增长,那些有着足够想象力的专业人士预见到,若不改变程序,1890年人口普查数据的处理任务将十分可怕。
霍勒瑞斯的杰作
约翰·比林斯(John Shaw Billings)是一名被指派协助人口普查办公室编制健康统计数据的医生,曾近距离观察任务组处理1880年的原始数据时所做的海量制表工作。他向另一位协助人口普查的机械工程师赫尔曼·霍勒瑞斯(Herman Hollerith)表达了自己的担忧。1884年9月23日,美国专利局记录了24岁的霍勒瑞斯提交的一份题为“编制统计数据的艺术” (Art of Compiling Statistics)的意见书。
上图选自“编制统计数据的艺术”在此之后,霍勒瑞斯不断改进设计构思,并于1889年敲定最终方案,用于简化1890年人口普查的数据处理。霍勒瑞斯的杰作是穿孔制表机,主要由穿孔卡和读卡器组成。穿孔卡用薄纸板制成,使用者可用手或机器对其打孔。卡片被输入到一个连接着计数装置的读卡器中,读卡器用针刺探卡片,只在有孔处,针才会穿过卡片以发生电连接,进而令对应的计数器前进一个刻度以实现计数。举例说明,如果一张“白人男性农民”的卡片通过读卡器,那么“白人”、“男性”、“农民”这三个类别里的每一个的计数器都会前进一个刻度。
被打了孔的穿孔卡霍勒瑞斯出品的穿孔制表机效率惊人,以至于国会拨款所依据的各州人口数据在1890年11月下旬之前得到了认证。
1902年,工作人员正使用霍勒瑞斯设计的电动制表机
1950年人口普查时,工作人员正使用穿孔制表机
从穿孔制表机到现代计算机
在人口普查领域大获成功后,霍勒瑞斯开始销售自己的作品。文章开头提到的制表机公司便是霍勒瑞斯创立的。而在他退休后,托马斯·沃森(Thomas Watson)成为掌舵人并于1924年将公司改名为国际商业机器公司,也就是IBM。此后IBM不断完善卡片技术,发明了一种80列穿孔卡片,能更高效地完成巨量数据的记录和制表。到20世纪30年代,许多企业都使用穿孔卡技术记录并保存程序,例如工资单和库存。一些需要应对大量数据的科学家,尤其是天文学家,也发现了这些卡片的好用——IBM的80列穿孔卡成为了行业标准。当然他们并未满足,又开发出了在此后数十年间被广泛使用的键控打孔机(Key Punch)。“打卡”作业成为二战后蓬勃发展的计算机行业里的一个分支,而IBM一度成为世界第三大公司。卡片处理为速度更快、空间效率更高的纯电子计算机提供了框架。
一张蓝色IBM穿孔卡人们可能不熟悉20世纪50年代和60年代的计算机跟房间一般大,其数据和指令的主要加载方式是在键控打孔机上创建一副卡片,然后将该它们输入读卡器。在20世纪80年代以前,这一直是许多计算机的默认程序。
正如计算机先驱格蕾丝·霍珀(Grace Murray Hopper)对早期职业生涯的回忆:“在那些日子里,每个人都在使用穿孔卡,而且他们认为自己会永远使用穿孔卡。”
霍珀团队创建了第一台可商用的通用计算机,同时也是穿孔读卡式的庞然大物——通用自动计算机(UNIVAC)。1951年,第一台UNIVAC交付给了美国人口普查局。
资料来源
Howthe US census led to the first data processing company 125 years ago –and kick-started America’s computing industry
本文经授权转载自微信公众号“世界科学”。
0
推荐