您现在的位置:主页 > 经济 >

读书 | 吴军:保护隐私是靠大数据长期挣钱的必要条件

来源: 互联网 发布时间:2018-11-25 点击:

编者按:大数据技术的广泛应用,在给人们的生产生活带来极大便捷的同时,不免与公众的隐私保护产生剧烈冲突。就移动互联网时代的APP而言,今年的8月29日,中国消费者协会最新发布的《APP个人信息泄露情况调查报告》显示,APP已经成为消费者个人信息泄露的重灾区,超过85%的受访者遇到过个人信息泄露情况

在今年3月份召开的中国发展高层论坛上,百度创始人李彦宏在谈到大数据与隐私保护时就公开宣称:中国人相对开放,对隐私问题没有(外国人)那么敏感。如果用隐私来交换便捷性或者是效率的话,很多情况下,他们(中国人)是愿意这么做的

但事实真的如此吗?李彦宏的“隐私换便利”论调无疑招致了舆论的强烈反弹。今天在读吴军博士的新作《智能时代》时,恰好看到了他对于大数据应用及隐私保护的观点。作为供职于谷歌、长期浸淫于业界的吴军博士,显然是大数据应用的鼓吹者,但他对于隐私保护的思考同样振聋发聩。

保护隐私:靠大数据长期挣钱的必要条件

文/吴军

由于大数据具有多维度和全面的特点,它可以从很多看似支离破碎的信息中完全复原一个人或者一个组织的全貌,并且了解到这个人生活的细节或者组织内部的各种信息。这样就会引发大家对隐私权的担忧。比如在塔吉特公司预测孕期那个案例中,实际上那个怀孕的未成年少女的隐私已经被泄露。好在塔吉特作为年销售额超过700亿美元的百年老店,没有必要冒着毁坏百年信用的危险泄露那个人的隐私。

为什么要保护隐私,对这个问题的回答恐怕是仁者见仁,智者见智,但通常大家有一点看法是一致的,那就是赤裸裸地生活在众人的目光下不舒服。我们每一个人都不是完人,都或多或少有些并非十分光彩的一面,那一面如果被熟人知道了,对生活会有很坏的影响,比如艳照门的那几位主角,受到的负面影响是一生的。

在过去的历次技术革命中,都没有过多涉及个人隐私的问题,因为那时技术的发展和个人隐私关系不大。但遗憾的是,在大数据时代,技术的发展和保护隐私开始产生矛盾。比如我们前面在介绍各种智能交通管理工具时展示出了它的好处,但是另一方面,如果某家提供这种服务的公司无限制、无节制地收集用户数据,实际上每个人的行踪都可能暴露在大众面前,这是非常危险的。很多公司现在已经具有了这样的能力,只是大家不知道或者不注意而已。

2013年,一位特斯拉汽车的主人抱怨他的电动车在充满电之后,跑的距离没有像特斯拉公司声称的那样远。特斯拉马上回应道,车主人所走的路线并不是他向媒体讲的那条路,而是一条绕远的路。这件事情曝光之后大家的注意力马上从电池的续航能力转移到了个人隐私方面。根据位于硅谷的圣塔克拉拉大学的法律学教授葛兰西(Dorothy Glancy)介绍,不只是特斯拉一家公司在获取汽车车主的数据。96%的新车都有类似于特斯拉这种追踪车主行踪的功能,而且获取的数据比我们想象的多很多,比如是否系了安全带。更关键的是,绝大部分车主并不知情,而且无法关闭这些监控的功能。

或许我们已经习惯了出门在外被这种摄像头监视,对于私家汽车里面安装上述数据采集装置也只好听之任之。我们天真地以为,至少在家里关起门来外面是不可能知道家里发生的事情的,但是情况并非如此。像nest这样的智能家居可以知道家里每个人的活动,甚至知道什么人来访。如果一个家庭妻子出差了,丈夫带另一位女士来家里过夜,这件事在今后恐怕是瞒不住的。当然,从好的方面想,通过获取这些细节的数据,至少有助于反腐败,能够发现私底下的官商勾结、权钱交易,帮助查处贪腐获取证据。但是这样一来,我们也毫无隐私可言了。

大家通常会夸大大数据带来的便利之处而忽视它对个人隐私带来的危害,因为大众对于隐私的重要性普遍不够重视。当然可能会有一些读者挑战我的这个说法,认为大众,特别是欧美国家的人,还是很重视保护个人隐私的。但实际上,欧美国家的人常常也只是把保护隐私挂在嘴边而已

为了证实这一点,凯文·凯利和我分别在硅谷地区对社交网络的用户做过这样一个调查,看看他们到底是在乎自己的隐私还是更多地希望获得便利性。我们的调查方法基本上相同,都是通过一份精心设计的调查问卷对各种文化背景的男女老少进行抽查。调查问卷包括三部分内容。首先我们列举了很多社交网络产品和移动互联网产品,让被调查者说明他们都用了哪一些。对这些产品,我们当然清楚使用者会暴露多少隐私,但是被调查者未必清楚。其次,我们列举了一些需要牺牲隐私换取便利的服务,看看被调查者有多少原因使用那些服务。最后,我们给被调查者一个可以拉动的游标,让他们在保护隐私和方便性之间做一个选择,比如最左边是彻底保护隐私,但是也彻底失去移动互联网和社交网络带来的方便性,最右边是彻底放弃隐私,但是得到当下各种技术和产品带来的全部便利性。

绝大部分被调查者在最后一项调查中会选择把游标拉到50%的位置(图5.18),或许他们认为这样便保持了在隐私方面和便利性之间的平衡。但是,根据前两项的统计结果我们发现,用户在行动上的选择是放弃隐私以换取便利性,或者说把游标拉到了非常右边的位置,如图5.18所示。

图5.18 用户在心理上和行动上对保护隐私认识的差异

当然,在这里我要说明的是我们调查的人群仅限于硅谷地区,加上调查的人数有限,因此我们的结果难免有所偏差,但是被调查者如此一致地选择便利性而不是保护自己的隐私,应该足以说明大家对隐私问题的忽视

我们也对各种APP和社交网络产品在保护隐私和提供方便两方面做了评估,有意思的是,它们和用户在行动上的选择非常一致,即将便利性推到极点而不顾及大家的隐私。这或许是巧合,但也可能是社交网络和移动互联网APP的提供者在不断地测试用户对暴露隐私的承受底线,只要用户不抱怨,它们就做得越来越过分。比如,一款手电APP要求访问移动互联网的所有联系人的信息时,它要访问的信息和它提供的功能是完全无关的。当然,这些刺探个人隐私的公司能够得逞的原因,是用户自己将自己的隐私交给了那些毫不相干的公司(或者个人)。

大众在大数据时代对自己的隐私如此不在意,可能有三个原因首先是不清楚大数据按照目前这个方式发展,最终会严重侵犯个人隐私,因为在过去的技术革命中这不是问题。其次是抱着侥幸的心理,认为那么多用户数据,怎么可能数据的拥有者和操作者正好能挖掘到我的隐私,这是因为他们对大数据所带来的机器智能不了解,事实上这不需要人工去做人肉搜索,计算机可以自动完成挖掘任务,而且做得非常智能。最后,很多人会觉得,我既不做什么坏事,也不担心行踪被暴露,也不是什么名人怕大家知道什么秘密,那些拥有我的数据的公司即便知道我的隐私,也损害不了我的利益。这种想法实际上是大错特错,因为用户的利益在隐私暴露之后很容易就被损害。我们不妨看看如下几个例子。

人们在中国某大型电子商务网站上发现,某些人总是买到假货,而另外一些人以同样价格却买到真货。这并不是因为前者比后者的运气差,而是商家掌握了太多的个人数据,或者说我们的隐私。当商家知道前者是买了假货也不会吭声的软柿子,后者是睚眦必报的刺头的时候,欺软怕硬的行为一定能够给他们带来最多的利益。在利用大数据方面,个人用户相比商家永远是弱势群体,一旦他们的秘密被商家知道,他们的利益就难免受到损害

美国很多航空公司在利用个人隐私大发其财。当航空公司发现某个机票的询票者最近必须旅行,而且在过去对票价不是很敏感时,它给出的报价就会比给其他人的高很多。尤其当两个城市间仅此一家航空公司有直飞的航班时,价格上的差异就更明显。这些航空公司甚至出钱聘请了美国一些著名的大学帮助研究这样利用用户隐私赚钱的方法。据一所世界名校里承接这些项目的团队介绍,利用对用户行为的分析,可以让航空公司提高10%左右的销售额。虽然10%的提高听起来不算太多,但是对净利润率只有0.2%的航空业来说,这是几十倍的利润的提高。而对于乘客来说,由于只是部分乘客受到伤害,整体上10%票价的提高意味着他们的额外支出要远比10%多,实际上多付出的票价可以高达50%。

我们必须清楚地认识到,保护好隐私对大数据长远的发展非常重要。人们不可能看到自己的隐私最终完全受到侵犯,而依然任由大数据继续发展下去,因此,隐私的问题不处理好,将对大数据的长期发展不利。今天,在医疗卫生这样敏感的行业,担忧隐私受到侵犯已经成为这个行业大数据和机器智能发展的障碍。关于大数据和隐私在未来社会中可能产生的矛盾,我们在下一章还会详细论述,在这里我们探讨是否有可能在技术上做到既能够利用大数据带来的便利,又能保护好个人隐私。

为什么必须在技术上保护隐私,而不仅仅是在法律层面靠处罚来解决侵犯隐私的行为呢?虽然在法律层面保护隐私是必需的,但是光靠法律是解决不了问题的。首先,很多侵犯隐私的行为是个人行为,比如偷窥,很难发现和查处。其次,法律的制定永远落后于案件的发生,尤其是在大陆法系的国家。因此,除了法律手段外,我们还必须有相应的技术手段维护个人的隐私,但是这又谈何容易。

需要指出的是,保护隐私并非简简单单地屏蔽掉一些个人信息那么简单。在过去这种方法是有效的,因为各种维度的数据联系不到一起。但是在大数据时代,由于大数据多维度和全面性的特点,简单屏蔽掉的很多信息是可以从其他维度利用相关性恢复的。因此,保护隐私需要新的技术。

一类保护隐私的技术是从收集信息的一开始就对数据进行一些预处理,预处理后的数据保留了原来的特性,使得数据科学家和数据工程师能够处理数据,却“读不懂”数据的内容。这样至少能防止个人窃取和泄露隐私,但是并不能限制那些拥有非常多数据的大公司了解每一个人的隐私。

另一类保护隐私的技术是所谓的双向监视。这是一个很新颖的保护隐私的想法,简单地讲就是当使用者看计算机时,计算机也在盯着使用者看。大部分人喜欢偷窥别人隐私的一个原因是,这种行为是没有任何成本的。但是,如果有人在刺探别人隐私时,他的行为本身暴露了,那么他就会多少约束自己的行为。这就好比一个偷窥者悄悄推开门缝往里面窥视,发现里面有双眼睛正在看着他,那么他的反应可能是马上把门关上。

图5.19 双向监控,当偷窥者通过计算机和网络刺探别人隐私时,被窥视者也在看着他

凯文·凯利对各种保护隐私的技术做了评估,他和研究人员发现,如果给窥视者一个选择,输入自己的真实信息然后才可以窥视他人,那么绝大多数人会选择直接离开。正如制约权力最好的办法是使用权利,解决一种技术带来的漏洞最好的办法是采用另一种技术,那么保护隐私最好的办法或许是让侵犯隐私的人必须以自己的隐私来做交换

总结上述两种技术的特点,我们可以看出,为了在使用大数据的同时尽可能地保护隐私,数据从采集到使用都需要是双向知情的,也就是说不再是数据的所有者暴露在大庭广众之下,数据的采集者和使用者(偷窥者也是一种特殊的数据使用者)也是同样被监督的,或许这样是最有效地保护隐私的方式。

保护隐私对个人的好处不言而喻,对商家其实也有好处。这不仅在于它们能够“合法地挣钱”,而且还能让好的商家长期挣钱。为了理解这一点,我们不妨看看美国银行发展的历史。

在很长的时间里,美国的银行业可以用“胡作非为”来形容,挪用储户存款进行非法经营的情况时有发生。当偷钱的银行工作人员在非法经营中挣到钱后,他们把利润装进自己的口袋,相反,当他们亏了钱之后,他们是不会从自己口袋里掏出钱还给储户的,而是让银行破产,因此在1933年罗斯福新政之前,美国银行破产是家常便饭。1933年之后,美国一方面杜绝银行进入股市等高风险的资本市场(法律监管),并且提供了一个技术手段来保护储户利益,即FDIC(联邦存款保险公司)的再保险;另一方面通过竞争让那些胡作非为的银行纷纷倒闭,这才让储户能放心地把钱放在银行里。类似地,如果两家公司同样挣钱,一家有能力保护用户隐私,另一家总是侵犯用户隐私,可以想象,后者会逐渐丧失用户。

吴军(美国约翰霍普金斯大学计算机科学博士,著有《数学之美》《浪潮之巅》《文明之光》《大学之路》《硅谷之谜》《智能时代》)



这篇有关于 读书 | 吴军:保护隐私是靠大数据长期挣钱的必要条件 的文章,就为您介绍到这里,希望它对您有帮助。如果您喜欢这篇文章,请分享给您的好友。

    相关阅读