试错法,是哲学家卡尔·波普推崇的科学研究方法。而西尔弗发现,一个成功的NBA球赛赌徒也是如此:大胆预测,不断犯错,不断尝试。只要获得新信息,就应该更新自己的预测。
这是一种更加进取的思维方式,又何尝不是一种崭新的生活呢?
黄锫坚
文|纳特·西尔弗
1440年,约翰内斯·古腾堡发明了印刷机,这项发明使普通能方便地了解信息,由此产生的思想带来了前所未有的结果和影响。印刷机的发明点燃了1775年的工业之火。这一发明促成了一些历史事件,这些事件了欧洲启蒙运动,也加速了美利坚合众国的建立。
印刷机问世的第一个世纪里,书籍的生产规模呈指数型增长,数量增长了近30倍。人类知识旋即进入快速积累期。
信息的增长速度远远超过了人们处理信息和分辨信息的速度。共享信息的不断增长反而加速了民族和教的孤立进程。
印刷机的早期使用者中,最狂热的要数那些的人了。马丁·德的《九十五条论纲》被古腾堡的印刷机复印了30多万次。德的所导致的,很快使欧洲陷入了战争。单单一个三十年战争,人口就减少了1/3。这堪称人类历史上最的时代。
但就是在这样一个充满战乱的时代,印刷机却悄然推动着科学与文学的进步。
大数据的承诺和陷阱
到了时下,最流行的要数大数据了。根据IBM的估计数据,现在我们每天生成的数据高达250兆亿个字节,超过过去两年里生成的数据总量的90%。
信息的指数型增长有时被人们视为万灵药,就好比20世纪70年代出现的计算机一样。《连线》的前主编克里斯·安德森曾经在2008年的一篇文章中说:数量庞大的数据会使人们不再需要理论,甚至不再需要科学的方法。
我认为其内容是积极乐观的,却被严重曲解了。虽然那些数字不能为自己,但我们却可以作为数字的发言人,赋予它们意义。我们可能会以对自己有利的方式对这些数据进行分析和解释,而这些方式很可能与这些数据(所代表)的客观现实不相吻合。数据驱动预测机制可能会成功,也可能会失败。一旦我们否认数据处理过程中存在着主观因素,失败的概率就会增加。
在4年时间里,我对十多个行业和领域中的数据驱动预测机制进行了调查,我也曾与十几个领域中的100多位专家交流过,读过数百篇期刊文章和论文,为了实地调查,我跑遍了从拉斯韦加斯到哥本哈根的许多地方,却发现大数据时代的预测活动发展得并不顺利。
新千年给美国人带来的是噩梦般的开始。我们没有预测到9·11事件,而这一的出现并非因为我们的信息匮乏。正如60年前的珍珠港事件一样,其实所有的信号都在那里,只是我们没能将它们联系起来。因为对恐怖可能会有的举动不够了解,所以我们对那些数据视而不见,不知道将至。