大数据时代读书笔记

Reading time ~9 minutes

上个月懒得没事儿翻了一下微信读书,刚好有三本免费书可以领,于是就打开了这本维克托-迈 尔-舍恩伯格的《大数据时代》。作者是耶鲁大学等名校的客座教授。微信评分8.7。读完整本 花了好几个早晨加一个晚上,一共7个多小时。

全书的前面一大半的部分都是在讲大数据可以发挥怎样的作用。引用了很多各种各样的典故,感 觉作者应该很推崇的google,facebook和amazon的。不少正面的例子都是来自这三个公司, 其中比较有创意的一个例子是google用人们的搜索词条来预测流感发生的可能性,和另外一个 startup用数据来分析飞机票的价格,准确率都达到了90+%(90+的准确率只是字面上看起来比 较高而已,即使是99.9的准确率,也说明1000人里有一人会不准,在我大天朝这么大的人口基 数下,这个数字会更大)。这里对我最大的启示是对现有认知体系的质疑。一个人从小到大总会 从周围环境中吸取,学习到这样或者那样的”经验”, 然而这些经验背后的因果关系,一般大家 不会主动去想。这样的”经验”在大部分情况下是适用的,也让我们可以生活的更轻松,当然这只 是针对每个人的个例,然而当看问题的视野从个例发散到整体之后,依赖这些”经验”做出的推理 就不再准确。即使是个人”经验”在不加思考的直接使用的时候也会遇到不适用的情况。古代人对 这种无法理解的现象会虚构出来一个神明之类的东西来解释。现代人有了更多理性思考之后,会 想办法探求事物的本质。但是无论如何,仅仅依靠个人的”经验”来推理,在大数据时代是说不通 的。而是要让数据说话,这正是作者在前面大半篇幅强调的,我们关心的不再是因果性,而是相 关性。作者用了大量的篇幅,举出了各种各样的例子来说明大数据会如何影响我们的生活,以及 强调这个观点,未免有点拖沓,很多典故如果对科技行业比较了解的话,应该是早有耳闻的。

然而后半篇关于大数据对于隐私的影响,还是很有启发性的。尤其是通过大数据预测出来一个人 的犯罪可能性后,人们是有可能提前对其制裁的。这就引发了一个逻辑矛盾。一个人为了一件从 未发生的事情负担上了责任。作者对于这种情况的观点是我们不应该对其进行制裁,直到犯罪行 为真正的发生了。这种立场的缺点是,一旦犯罪行为发生了,就会造成真正的影响,就会有受害 者,而受害者无辜的承担了犯罪行为的后果。这就是那个经典的例子,一群小孩在两条铁轨附近 玩儿,一条停用了,一条还在使用。只有一个小孩儿在停用的铁轨上玩儿,其他的都在使用中的铁 轨上。这时火车来了,你站在铁轨切换器旁边,让火车停下已经不可能,但是可以让火车转向停 用的铁轨。这样就可以救下大部分小孩。这里明明是在使用中的铁轨上的小孩做错了事情。通过 对犯罪行为的预判来制裁还未发生的犯罪,就像是让火车撞向使用中铁轨上的小孩儿,而让火车 转向到未使用中的铁轨,则像是任由犯罪行为发生,导致受害者承受犯罪行为。每个人有自己的 原则,所以这里不讨论对错。作者这里忽略掉了一种可能性,大数据既然可以对一个人的行为做 出预测,也相应的也能培养一个人的行为,就好像现在很多新闻应用会只推荐你想看的内容给你, 这样你的思想反而被限定在了一定的范围之内,这个应用就会或多或少的影响到你的认知。如果 大数据应用可以通过不断的培养一个人的行为,总结出一种模型,在一个人的成长过程中,不断 的在适当的时间点给出恰当的feed,这个人最终就会成长成为一个犯罪动机极低的人,因此我 们也就不用考虑上面那个铁轨-孩子的问题了。当然这种模型出现之前我们还是要面对这个问题 的。也许,这种模型永远也不会出现。。。就算出现了,这种模型下成长起来的人,还是最初的 “人”吗?

转回正题,总的来说,这本书的前半部分适合拿来长长见识如果你对科技行业不熟悉。后半部分 对大数据带来问题的担忧以及分析比较有启发性。

(福特老总居然当过美国财政部长, 福特老总的名言:让我去问顾客需要什么,他会说,给我 一匹更快的马。这跟乔帮主有异曲同工之妙。顾客不知道自己真正想要什么。)

comments powered by Disqus

覆巢之下(1)

## AWS与全球最大的同性交友网站### 什么是云? 熟悉科技行业的人,往往都不可避免的了解过**AWS(Amazon Web Service)**,AKA,亚马逊云服务。对于没有技术背景的人,也许比较难以理解这个所谓的玄而又玄的“云服务”到底是怎么个玩意儿?接下来我会...… Continue reading

尚未锦衣,何以还乡

Published on December 15, 2019

AI未来读后感

Published on August 09, 2019