
今日各大城市广布摄影机,可监控老百姓的行踪,而早期管控人民,主要靠人口普查。
最早的人口普查需要人工进行,旷日废时,成本甚高。全世界第一位统计工程师荷勒里斯(Herman Hollerith)于1886年制造人口普查机器,成立了制表机器公司(Tabulating Machine Company;TMC),能快速进行人口普查。荷勒里斯志得意满,将机器租给美国人口普查局时,在价格上予取予求。最后人口普查局受不了,决定将1910年的人口普查交由另一家公司承包。
此项重挫导致TMC于1911年改组,和另外两家公司合并,成立计算制表记录公司(Computer Tabulating Recording Company;CTR)以求生存。1924年CTR的总经理华生(Thomas J. Watson)再将公司改名为国际商用机器公司(International Business Machine Corporation),也就是今日我们所熟悉的IBM。
追本溯源,查卡的纺织花梭机激发荷勒里斯使用打洞卡片来记录數據 (这套机械编制技巧应用繁多,后来也被改良,用于纸卷钢琴音乐盒) ,撑起IBM的一片天。IBM为了纪念查卡花梭缩机的贡献,在1994年将其操作系統命名为OS/2 Warp (warp即是纺织布上的经线)。荷勒里斯去世后则被尊称为信息处理之父(Father of Information Processing)。
荷勒里斯珍爱三件事物:他的德国血统、他的隐私,以及他的猫咪。由于他爱德国,被牵连到纳粹屠杀犹太人的纠纷。荷勒里斯于1910年将他的人口普查机器Hollerith Tabulator的专利特许给德国一家公司迪霍玛格 (Dehomag)。希特勒(Adolf Hitler)使用荷勒里斯的机器进行人口普查,相当具有前瞻性,将大数据发挥淋漓尽致,几乎可称为大数据之父。
纳粹德国在1933年的人口普查要求国民申报他们的宗教信仰,确认国民是否信奉犹太教。在1939年的人口普查又要求国民填报种族出身,将具有犹太人血统的国民识别出来。每次普查后,由荷勒里斯的机器整理归档,所有犹太裔的數據一览无遗,成为日后纳粹屠杀犹太人的依据。
二次大战后纳粹大屠杀调查人员布拉克(Edwin Black)为此狠狠数落荷勒里斯一番。我读布拉克的著作,啧啧称奇,当中叙述纳粹人口普查的严谨,可媲美今日的大数据科学。犹太人受害团体据此指控IBM的科技发明助长了纳粹的暴行,而荷勒里斯卷入他去世后发生的事,算是无妄之灾。布拉克是著名的记者作家及人道主义者,获奖无数,因此他对希特勒大数据的指控,特别有力!