今日各大城市广布摄影机,可监控老百姓的行踪,而早期管控人民,主要靠人口普查。
最早的人口普查需要人工进行,旷日废时,成本甚高。全世界第一位统计工程师荷勒里斯(Herman Hollerith)于1886年制造人口普查机器,成立了制表机器公司(Tabulating Machine Company;TMC),能快速进行人口普查。荷勒里斯志得意满,将机器租给美国人口普查局时,在价格上予取予求。最后人口普查局受不了,决定将1910年的人口普查交由另一家公司承包。
此项重挫导致TMC于1911年改组,和另外两家公司合并,成立计算制表记录公司(Computer Tabulating Recording Company;CTR)以求生存。1924年CTR的总经理华生(Thomas J. Watson)再将公司改名为国际商用机器公司(International Business Machine Corporation),也就是今日我们所熟悉的IBM。
追本溯源,查卡的纺织花梭机激发荷勒里斯使用打洞卡片来记录数据 (这套机械编制技巧应用繁多,后来也被改良,用于纸卷钢琴音乐盒) ,撑起IBM的一片天。IBM为了纪念查卡花梭缩机的贡献,在1994年将其操作系统命名为OS/2 Warp (warp即是纺织布上的经线)。荷勒里斯去世后则被尊称为信息处理之父(Father of Information Processing)。
荷勒里斯珍爱三件事物:他的德国血统、他的隐私,以及他的猫咪。由于他爱德国,被牵连到纳粹屠杀犹太人的纠纷。荷勒里斯于1910年将他的人口普查机器Hollerith Tabulator的专利特许给德国一家公司迪霍玛格 (Dehomag)。希特勒(Adolf Hitler)使用荷勒里斯的机器进行人口普查,相当具有前瞻性,将大数据发挥淋漓尽致,几乎可称为大数据之父。
纳粹德国在1933年的人口普查要求国民申报他们的宗教信仰,确认国民是否信奉犹太教。在1939年的人口普查又要求国民填报种族出身,将具有犹太人血统的国民识别出来。每次普查后,由荷勒里斯的机器整理归档,所有犹太裔的数据一览无遗,成为日后纳粹屠杀犹太人的依据。
二次大战后纳粹大屠杀调查人员布拉克(Edwin Black)为此狠狠数落荷勒里斯一番。我读布拉克的着作,啧啧称奇,当中叙述纳粹人口普查的严谨,可媲美今日的大数据科学。犹太人受害团体据此指控IBM的科技发明助长了纳粹的暴行,而荷勒里斯卷入他去世后发生的事,算是无妄之灾。布拉克是着名的记者作家及人道主义者,获奖无数,因此他对希特勒大数据的指控,特别有力!
现为国立阳明交通大学资工系终身讲座教授暨华邦电子讲座,曾任科技部次长,为ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究兴趣为物联网、移动计算及系统模拟,发展出一套物联网系统IoTtalk,广泛应用于智能农业、智能教育、智能校园等领域/场域。兴趣多元,喜好艺术、绘画、写作,遨游于科技与人文间自得其乐,着有<闪文集>、<大桥骤雨>。