曝露合唱团,隐私曝露在网络上,搜索引擎知道多少?

隐私曝露在网络上,搜索引擎知道多少? - 电脑安全 - 电脑教程网

隐私曝露在网络上,搜索引擎知道多少?

日期:2007-01-27   荐:
当你在Google、百度的搜索框中输入要搜索的内容后,搜索引擎一边在为你执行搜索任务,同时也把关于你的信息保存起来。搜索引擎保存 了哪些信息?涉及到自己的隐私了吗?

如果有人告诉你,你的很多个人隐私,如令人尴尬的医疗记录、你还在思念你高中时的女朋友……这些事实都保存在一个巨大的数据库中,不知你会做何感想?事实上,这样的数据库确实存在——只要你曾经在某个搜索引擎中搜索过这些私密的内容,在这个数据库中都会有记录。

不管是Google、Yahoo还是微软的Live Search,在你使用它们进行搜索的时候,除了在数据库中记录下完成查询的日期和时间外,还会把你计算机的IP地址、你计算机上的Cookie的惟一编号(除非你删除了它)记录在其中。因而,搜索引擎可以知道某次搜索请求是不是某个计算机发出的,即使在连接改变以后,搜索引擎仍然还可以做到。

微软的Live Search还会记录搜索的具体类型(如,是图片、互联网搜索还是本地搜索),而Google除此之外,还会保留发出请求的计算机的浏览器类型和所使用的语言。如果点击了Google搜索结果页面中的链接,这个链接和这次点击的计算机的IP地址会一并记录下来。

Google最近宣布,它准备把那些18个月以前的搜索记录中的IP地址和与搜索请求相关的Cookie记录删除掉,让搜索日志成为匿名的纪录,但微软和雅虎还没有公布相关的措施,AOL则表示它只会保留一个月以内的搜索记录。

因此,如果有人让一个搜索引擎公司提供曾搜索过某一个内容的计算机IP地址和Cookie值,或者相反,指定一个IP地址或者Cookie值,让搜索引擎公司提供使用这个IP地址或者Cookie值的用户曾经进行的所有查询,搜索引擎公司是完全可以做得到的。

要不要担心?

有人说,不要太担心,因为这些服务器的日志还没有把查询的条目与个人信息联系起来,如姓名或者e-mail地址。但是,如果你在这个搜索引擎网站有一个账户或者在这个网站进行过其他注册的话,如申请e-mail信箱、加入社交网络、日历服务或者提供购物清单等服务的话,是完全可以把查询内容与个人联系起来的,致力于保护个人在网络空间的自由和隐私的电子边界基金(Electronic Frontier Foundation)董事会主席Brad Templeton如是说。比如,对于微软和雅虎搜索引擎来说,搜集的个人信息就非常多,因为在注册申请账户的时候,这些公司要求人们输入了很多个人信息,如你的职业、职位、婚姻状况以及家庭中的子女数等。

微软公关部经理Whitney Burk说,“还没有一种系统的方法能把搜索有关的数据与个人身份信息对照和关联起来。”Google也表示,在Google这两类信息是分开存贮的。但是,Templeton说,“搜索引擎会把这两方面的信息关联起来,这使人们很容易想到,也很难让人不这么想。”

Templeton强调说,搜索引擎系统究竟是如何设计的他并不是非常了解,但是,就一个典型的搜索引擎而言,如果某人有一定的访问权限和掌握了相关的知识,就有很多方法可以把搜索内容与个人身份信息关联起来。考虑到搜索内容可能会泄露一些个人信息,比医疗处方、宗教信仰、政治偏好等,这并不是我们中的很多人愿意看到的局面。

专注于搜索引擎新闻的博客——搜索引擎地带主编Danny Sullivan说,即使你从未提交过任何个人信息,仅仅是IP地址就已经足以定位到某台电脑,这只需要通过DNS反查到互联网接入服务提供商(ISP)和城市的IP地址就可以做到。如果找到ISP就可以找到谁申请了这个账号,据此就可以找到搜索引擎日志中某个时间的某个搜索请求是谁发出的。

去年AOL公布50万匿名用户的3个月以前的搜索日志时,纽约时报曾经报道说,即使不用IP地址也一样可以查到用户的身份,因为这些信息很可能就藏在用户的查询信息中,如小镇居民搜索居住地附近的房地产。

保证消费者信息的安全

如果你开始对此有些担心,这一点儿也不奇怪。实际上,在这个世界上有很多用户、消费者权益保护组织、政府有关政策的制定部门以及隐私保护组织越来越担心,搜索引擎公司会保存多少个人信息以及它们会如何使用这些信息。最近几个月来,Google、雅虎等搜索引擎公司似乎没有能减少人们对此的担忧。

有几个消费者权益保护组织已经向美国联邦贸易委员会起诉Google购并DoubleClick一事。这些组织声称,Google由于能了解消费者在互联网上搜索的内容以及他们访问的网站,从而能够给Google带来极大的竞争优势。Google发布“Web History”这个功能时——该功能能把个人搜索的内容和曾访问的网页和他们的账户信息联系起来,一些评论人士(如资深的博客Anil Dash)认为,这会带来很不好的后果。

Dash在他的博客中说,“考虑到Web History功能,特别是Google最近的购并和公开发表的言论,种种迹象表明,Google的行为已经值得我们普通用户警惕了。”

另一件事让在线搜索有关的数据这个问题再一次凸显:2006年年初,美国司法部要求Google、微软、雅虎和AOL随机抽取一周之内搜索记录,但不要求提供搜索人的具体信息。

美国司法部希望利用这个信息内容来为它的《儿童在线保护法》做辩护,该法案的目的是保护儿童不受色情内容侵害。但是,该法案受到美国公民自由联盟的反对,称其违反美国宪法第一修正案中关于言论自由权的规定。当时,微软、雅虎和AOL都按照要求提交了搜索记录,但是,Google拒绝了这一要求。Google开创了一个先例,“即使政府部门做事情也得符合相关的法律,”搜索引擎地带的执行主编Chris Sherman说。

美国有一些部门正在设法保护在线数据。美国国会议员Edward Markey在2006年年初曾提交了一项倡议,要求互联网网站的所有拥有者,而不仅仅是搜索引擎公司,销毁所有包含消费者信息的历史数据。

抛开政府不说,还有一些情况可能导致个人数据被泄露,Templeton说,比如通过内部员工。“每个人都知道,大型数据库的机密数据被泄露最终都可以归结为公司内部员工的腐败行为,他们通过出售这些数据从中渔利。”他说。

问题的实质

上述讨论引发了一个问题:为什么提供搜索服务的公司要保留这些数据?Google提出三个理由:第一,有助于改善它的服务;第二,防止有人研究并利用这些数据之间的关系来进行一些欺诈行为;第三,法律规定必须保存这些数据。Google说,通过这些数据它能知道有多少用户对第一次的搜索结果满意,有多少用户还需要进行第二次或者更多次的搜索,通过这些数据Google还能知道某个广告被点击了多少次,据此可以决定广告主需要付多少费。

资深人士Sullivan在博客中对这个问题说得非常直接,“在个性化方面Google是一个大师,”他写道,“对Google而言,密切接近用户被看成是领先竞争对手的关键所在,而且2007年已经被Google定义为凸显自己的竞争优势之年。”

Sullivan解释说,Google认为对用户越了解,它越能给用户带来更好的用户体验,当然也会让广告更有针对性。“更何况,Google认为在提供更好的搜索结果之后的下一个发展方向就是个性化。”

不过,Templeton提出质疑,提供搜索服务的公司真的有必要像它们现在做的这样保存这么多的数据或者像现在这样保存这么长的时间吗?“我们一致认为Google保存了太多的用户信息,”他说。但也有一些人,如Sullivan,赞成像Google这样限制保存搜索日志的记录时间,而Templeton则认为还是全面销毁更彻底。

“在过去这样的事情已经发生了多次,人们以为已经让那些数据变成匿名或者把数据删除了,但有人又找到办法恢复了这些数据,”他说,“因此在数据的销毁过程中,必须做得更彻底,必须把IP地址和搜索之间的任何联系彻底切断。”

而且,Google的办法可能没有涉及备份数据。另外,18个月的时间窗口也没有解决通过Web History功能保存的数据。Sullivan说,这些信息并不会随着时间的流逝而被删除或者进行匿名处理。

“如果你想彻底删除这些数据,”他说,“Google会告诉你需要一个个单独处理。”从积极的一面来看,Web History让使用者准确知道关于自己有哪些数据被保存下来了,用户可以自己决定在何时删除这些历史数据。雅虎所提供的MyWeb功能也同样如此,如果该功能打开的话,用户所有的搜索都会被保存下来。

随着用户越来越关注自己的隐私,提供搜索引擎服务的公司表示,它们正在采取措施增加用户的匿名化处理。Google说,在它的非搜索引擎产品中已经内置了隐私保护措施,包括Google Talk的“off the record”功能以及Google Desktop的“暂停(pause)”和“搜索锁定(lock search)”控制。Google还表示,在它的网站上将为用户提供更容易理解的隐私保护办法。

微软则表示,它正在积极与全世界数据保护专家们探讨:哪些用户信息应该收集、这些信息应该用于什么目的、以及通知用户和承诺的具体办法。“在具体策略上,还没有一个统一的意见,” Burk说,“但是,我们会继续就这些问题与隐私保护者和专家们积极磋商。”

Sherman认为,这些个人信息,最后还是应该由每个用户自己决定是否相信提供搜索引擎服务的公司。“每个人必须自己来决定两者之间的平衡,即搜索结果必须改善到何种程度我们才会感觉方便和允许自己的个人信息与进行的搜索关联到什么程度?”他认为,这个问题已经超出了Google的范畴,实际上就是要采取强制措施保证用户数据的安全。“如果你到Google公司,你是很难接近它的数据中心的,Google有几个安全级别,只有很少几个人能进入这些区域看到那些非常机密的用户身份信息。”

但对Templeton而言,这还不够。“即使在人们想做好自己工作的时候,也可能发生一些事情让数据泄露出去,”他说,“如果这些数据被保存在一个容易访问到的地方,这些数据还是容易泄露出去的。”

而且,Sherman指出,并不仅仅搜索引擎会保存个人信息。“ISP比任何搜索引擎公司都知道得更多,不仅知道使用者搜索了什么,而且知道使用者访问了哪个网站、访问了哪些内容。” Sullivan也在博客中说,“Google可能正在设法把它的记录匿名化,而那些ISP却什么也不准备做。”
标签: