【案例】 谷歌深度报告:被遗忘权确立以来的三年 | DataLaws 原文标题:Three years of the Right to be Forgotten 原文作者:Theo Bertram, Elie Bursztein, Stephanie Caro, Hubert Chao, RutledgeChin Feman, Peter Fleischer, Albin Gustafsson, Jess Hemerly, Chris Hibbert,Luca Invernizzi, Lanah Kammourieh Donnelly, Jason Ketover, Jay Laefer, PaulNicholas, Yuan Niu, Harjinder Obhi, David Price,Andrew Strait, Kurt Thomas, andAl Verney(所有作者均隶属于谷歌) 原文来源:CCS2019 翻译人:朴杨鹤然,武汉大学国家网络空间安全学院研究生 版权所有,未经授权,请勿转载!
摘要:“被遗忘权”是一项隐私权,可以使欧洲居民将从他们名字有关的搜索结果中删除某些URL。为了阐明该法案对信息访问的影响,我们对过去三年半中要求从Google搜索中擦除的240万个URL进行了回顾性研究。我们分析产生最多请求的国家和匿名方;新闻,政府,社交媒体和目录网站是最常被擦除的目标;以及域外请求的泛滥。我们的结果极大地提高了被遗忘权使用的公开程度,并揭示了解决互联网上发生的多方隐私冲突时权衡个人隐私与公众利益的复杂性。
1、简介 “被遗忘权”(RTBF)是欧洲一项具有里程碑意义的法规,管理着从搜索结果中删除信息的工作。它确立了隐私权,个人可以请求Google,Bing和Yahoo之类的搜索引擎从互联网上删除包含以下内容的URL,这些URL包含“不准确,不适当,不相关或过多”的信息,这些信息包含请求者的名字。至关重要的是,该裁决要求搜索引擎运营商确定个人的隐私权是否超过公众获取合法信息的权利。 RTBF于2014年5月生效后,该法规的广泛适用性引发了关于搜索引擎运营商如何权衡并最终解决擦除请求的重大问题。此外,虽然Google和Bing都公开报告了RTBF请求的数量,但仍需要越来越多的公共数据,要求说明搜索引擎擦除的信息类型以及寻求RTBF擦除的实体,例如80位学者发表的一封信便表明了这一点。任何这种公开都需要取得平衡,同时也要尊重所涉个人的隐私。
我们分析的主要结果如下:
RTBF擦除请求有两个主要意图:33%的请求URL与包含个人信息的社交媒体和目录服务相关,而20%的URL与新闻媒体和政府网站相关,大多数情况下记录了请求者的法律历史。其余47%的请求URL覆盖了互联网上的各种内容。
不同地区对隐私的态度,当地法律和媒体规范会影响要求擦除的URL:法国和德国的个人经常要求从社交媒体和目录页面中删去自己的信息,而来自意大利和英国的请求者更有可能以新闻网站为目标。
请求具有本地化倾向:将国家/地区顶级域名(例如,peoplecheck.de)的URL删除的请求,约超过77%来自同一国家的请求者;被要求擦除的前25个新闻媒体中,都至少收到了来自同一国家/地区的请求者的86%的请求URL。
只有43%的网址符合擦除标准:按国家/地区列出的擦除率在23%至52%之间,和3–100%(根据URL引用的个人信息类别(例如,政治平台,个人信息))。
少数国家和个体占请求的大多数:法国,德国和英国产生了51%的URL擦除请求。同样,1,000个请求者(占提交RTBF请求的个人的0.25%)请求了所有URL的15%。这些经常提出要求的人很多来自于是律师事务所和声誉管理服务。
请求主要来自私人个体:85%的请求URL来自私人,而未成年人构成请求者的5%。在过去的两年中,名人等非政府公众人物要求删除41,213个网址,而政客和政府官员则要求删除33,937个网址。
2、被遗忘权 在深入分析之前,我们简要介绍了RTBF及其与其他隐私控制的比较。我们还将讨论Google如何做出擦除判决,Google如何执行擦除程序以及最近在其他国家认可RTBF的擦除的过程。
2.1 起源 2014年5月,欧盟法院确立了RTBF。如果个人的隐私权超过了公众对这些结果的兴趣,它使欧洲居民可以要求搜索引擎从搜索结果中删除包含个人姓名的URL。被擦除的信息必须“不准确,不充分,不相关或不再相关,或与这些目的相关但已经过时。”该裁决要求搜索引擎运营商进行此平衡测试并进行决断。 裁定后,Google成立了一个由学术界学者,媒体制作人,数据保护机构,民间成员和技术专家组成的顾问委员会,以制定特别针对有挑战性擦除要求的决策标准。谷歌还增加了一份公开报告,披露了被擦除的请求和域名数量。由于无法公开请求者的身份,因此此过程的公开度非常具有挑战性。这导致了数据保护机构为处理擦除请求而提出了一套建议的最佳实践。同时,研究人员还研究了围绕RTBF的去匿名化风险。
与其他隐私技术(如社交网络中的访问控制策略或匿名服务)相比,RTBF在解决多方隐私冲突方面具有独特的优势。根据RTBF,可以通过搜索引擎(例如刑事定罪或照片)限制访问合法发布的、真实的个人信息。对民间和后代来说,较旧的信息比较新的信息更可能受到限制,这也许是一个重要的问题。
2.2 决策过程
位于欧盟国家以及冰岛,列支敦士登,挪威和瑞士的个人都有资格提交RTBF请求,并且可以通过Google的在线擦除表格进行提交。作为此表单的一部分,请求者必须通过提交文件来验证其身份(无需政府签发的ID),并提供他们要RTBF的URL列表,以及以及指向这些网址的搜索查询和关于URL与请求者的关系的简短评论。请求者还要选择与请求相关的国家,通常是其居住国。
Google将每个请求分配给至少一个或多个审阅者以进行手动审阅。决策过程中没有自动化。从广义上讲,审阅者考虑了四个衡量公共利益与个人隐私的标准:
1.请求的有效性,包括可操作性(例如,请求中指定了要擦除的确切网址),以及请求者与EU / EEA国家/地区的联系。
2.请求者的身份,既可以防止欺骗,也可以防止其他滥用请求,也可以评估请求者是未成年人,政客,专业人士还是公众人物。例如,如果请求者是公众人物,则与私人个人相比,对内容的公众兴趣可能会更被考虑进去。
3.URL引用的内容。例如,与请求者的业务相关的信息可能会吸引潜在客户。同样与暴力犯罪有关的内容可能会引起公众的兴趣。考虑的其他方面包括内容的敏感,私有性质以及请求者同意公开信息的程度。
4.信息来源,可以是政府站点或新闻站点,也可以是博客或论坛。在政府页面的情况下,对URL的访问可能反映了政府决定就特定公共利益问题通知社会的决定。
在评估这些标准中的每一个时,审查员可以向请求者寻求更多的详细信息。在适用的情况下,审查人员还将考虑到数据保护当局的建议。最终,决定从Google搜索中删除URL或拒绝该请求。
2.3 请求的公开程度
在结果页面上会出现以下情况的包含请求者名称的擦除查询: (1)Google在欧洲的国家/地区搜索服务; (2)在所有国家/地区搜索服务(包括google.com)上,用于从与请求者所在国家/地区匹配的地理位置进行的查询。 然而在2015年,法国数据隐私监管机构CNIL通知Google已擦除的URL不仅在欧洲范围,还要扩展到在全球范围。Google对该决定提出上诉,此事正在欧盟法院的审议中。
2.4 其他国家的类似法规 尽管本研究仅关注欧洲RTBF,但为完整起见,我们注意到其他国家也采用了类似的法规。2015年7月,俄罗斯通过了一项法律,允许公民从俄罗斯搜索引擎中删除“违反了俄罗斯法律,或者信息虚假或已经过时”的链接。土耳其于2016年10月建立了自己的类似RTBF的法律。由于我们后续发现发现不同国家的隐私态度存在很大差异,因此我们的结果不太可能推广到其他RTBF法律。
3、数据集 我们的数据集包含2014年5月30日(Google首次实施擦除机制时)至2017年12月31日向Google搜索提交的所有欧洲RTBF请求。我们在表1中提供了此数据的高级摘要。每条记录均包括两部分:(1)与要求擦除URL有关的基本信息;(2)审查者在得出结论的过程中添加的其他注释,在此进行说明。
表1
3.1 基本请求数据 每个请求都由请求者的个人姓名,电子邮件地址,居住国家/地区,请求日期以及要求擦除的URL组成,我们从这里开始将其称为请求URL。在我们的数据集涵盖的三年零七个月的时间里,Google共处理了399,779个请求者提交的2,367,380个请求URL。此外,每个请求都包含每个URL的判决(即已擦除,或被拒绝),以及审查员得出这一结论的日期。
3.2 说明 从2016年1月22日开始,Google审阅者将用附加的分类数据手动注释每个请求的URL,以提高RTBF请求的公开程度。 网站类别:第一个注释包含一个通用类别,该类别获取与社交媒体、目录服务、新闻和政府页面相关的常见擦除请求,如表2所示。这些类别并非详尽无遗。此外,它们可以跟踪类别内的相关趋势以及国家之间的不同利益。
表2
从2016年开始,总共有55.1%的被请求URL属于这些类别之一。审查者将其他44.9%标记为其他。大量其他URL直接源于互联网上固有的内容多样性。此类站点的示例包括诸如archive.is的档案站点,诸如indymedia.org之类的博客,以及有关Wikipedia.org的文章或讨论。
页面内容:在审阅URL以确定其是否符合擦除标准的过程中,审阅者会将页面上找到的信息归类为高级描述,该描述捕获取擦除的意图,如表3所示。这些类别中的大多数与不同程度的潜在私人信息有关。有两种类别-自行创建和未找到名字-与如何编写信息或内容是否匿名或不按名称引用请求者有关。总体而言,审阅者确定了所请求URL的78.6%的内容类别。剩余的21.4%未属于这些类别之一,被标记为其他。
表3
请求实体:最终注释识别个人的特殊类别。这这些类别反映了信息在多大程度上可能被认为具有更多或更少的公共利益或请求者资格的程度。我们在表4中提供了类别细分。总体而言,审阅者将100%的请求者标记为属于这些类别之一。
表4
3.3 道德问题和可复制性
我们的分析广泛扩展了Google公开报告中当前提供的信息。按照公开报告的相同标准,在我们的分析过程中,我们永远不会讨论可能会使请求者区匿名的细节或引起人们注意的特定URL内容。对隐私的强调与可复制的科学标准产生了根本矛盾。我们无法直接显示URL和我们的注释之间的示例映射,也无法显示所请求的确切URL以及判决擦除的理由。我们预先意识到了这些限制,但是尽管如此,提高欧洲居民如何使用RTBF及如何影响互联网信息访问的公开度至关重要。
4、擦除请求
首先,我们研究了公众随着时间将RTBF用作隐私工具方式的变化。我们研究了提出最多请求的前几个国家,提出大量申请的请求者对总体请求和擦除的影响,以及提出请求的公司和政府官员的数量。
4.1 请求时限
为了了解RTBF请求的频率是否在增加,我们在图1中计算每个月请求的URL数量。在2014年5月开始实施RTBF后的头两个月,请求者试图删除大约282000个URL。从2015开始,RTBF请求平均每月下降约45000个URL。按年度细分,第一年执行的URL请求率为39.7%,第二年为24.9%,第三年为22.0%,最后七个月为13.4%。我们注意到,这个指标包括所有请求,甚至是那些审查人员最终拒绝的请求。总的来说,只有43.3%的请求网址符合擦除标准。
图1
作为另一种使用的度量,我们检查新请求者的出现数量,如图2所示。在最初的峰值之后,自2015年1月1日以来,新请求者的数量平均每月下降约7200。按年度细分,在第一年执行期间,43.5%的先前未提出过的申请人提出申请,第二年23.8%,第三年21.9%,其余10.8%的申请人在过去七个月提出申请。这表明,尽管新的欧洲居民继续寻求在rtbf下寻求擦除,但新请求者的总量却逐年下降。
图2
4.2 按国家分类的请求和擦除
如表5所示,我们发现少数几个国家/地区严重影响了请求的数量。来自法国,德国和英国的请求者加在一起产生了请求URL的50.6%。这些是RTBF涵盖的一些人口最多的国家,但按人均请求量而言,它们也是数量最多的国家,如图3所示。来自联合国2015年的人口估计,法国的每千名请求者就使Google收到了大约7.5个请求的URL。如果我们根据国际电信联盟2015年互联网普及率估算值将人口限制在估算的互联网用户数之内,那么法国每千名互联网用户就请求8.9个URL。相比之下,来自德国和英国的请求者产生的申请量大约是该数目的一半,每千名使用互联网的居民分别有5.7和5.1个请求的URL。这些发现表明,RTBF的使用因国家而异,来自爱沙尼亚申请者提出的人均请求最多,而希腊申请者的请求最少(不包括请求数量少于1,000的国家)。正如我们将在第5节中探讨的那样,多个因素可能有助于解释这一点,包括地区新闻和政府报道中的私人信息以及社交媒体方面的渗透。
表5
图3
我们在图4中详细列出了每个国家的擦除决定结果。捷克共和国个人请求的网址擦除率为51.7%,保加利亚个人请求的网址擦除率为23.4%。在数量最大的国家中,法国和德国的擦除率相似,分别为48.6%和47.8%,而英国的擦除率较低,为39.7%。正如我们在第5节中所展示的,这种擦除率范围来自一些国家的请求者,这些国家更频繁地将目标锁定在具有公共利益价值的新闻或政府网站上,最终导致拒绝擦除。
图4
4.3 大量请求的申请者
由于每个人有不同的隐私期望和数字足迹,我们检查每个请求者请求URL的数量。我们发现有少数请求者大量使用RTBF来删除URL,如图5所示。前千名请求者(占所有请求者的0.25%)产生了14.6%的请求和20.8%的擦除。这些机构主要包括律师事务所和声誉管理机构,以及一些在网上有大量业务的请求者。在该类别的实体中,17.1%居住在德国,16.0%居住在法国,15.1%居住在英国。最多数量的请求者试图删除5768个网址。在剩下的数据中,35.1%的请求者只想删除一个URL,75.2%的请求者只想删除五个或更少的URL。这些结果表明,尽管成千上万的欧洲人依赖RTBF删除少量URL,但仍有成千上万的实体使用RTBF更改搜索结果中显示的关于他们或他们的客户的数百个URL。
图5
4.4 请求实体
由于RTBF明确地将公共利益作为判断删除的平衡标准之一,所以理解请求删除URL的实体的类别也很重要。从2016年开始,谷歌开始将请求者分类为粗略的组(在第3节中讨论)。根据表6中的类别,我们提供了自2016年1月以来所有请求的URL的细分。大多数请求URL-84.5%来自个人。未成年人占所有请求网址的5.4%,这是一个特殊群体,擦除率几乎是个人的两倍。政府官员和政界人士生成了3.3%的请求网址,并且擦除率低于个人。政府官员的擦除率凸显了谷歌在使用RTBF时所达到的公共利益平衡的一个方面。我们注意到,公司实体从未在RTBF下将内容擦除。
表6
4.5 处理时间
每月有成千上万的RTBF请求被提交,我们检查google审查每个请求并做出裁决所需的时间,其中一个请求可能包含多个URL。在谷歌开始在RTBF下擦除URL后的头两个月,从请求者首次提交请求时起,平均需要85天才能做出决定。这种延迟是由于审查人员为构成不准确、不充分、不相关或过多信息的内容建立了案例。2017年1月1日之后,URL的处理时间中值为4天。
审查请求对于发现欺诈和错误的提交至关重要。在一个案例中,一个人在过去五年内因两起不同的家庭暴力案件被定罪,他向谷歌发出了一份擦除请求,重点为第一次定罪是根据当地法律“失效”的,请求人没有透露他的第二次定罪没有同样失效,并错误地将所有被要求擦除的网页归于第一次定罪。审阅者在审阅过程中发现这件事,请求最终被拒绝。在另一个案例中审查人员首先将一名商人提交的150个网址从名单中删除,该商人因利益欺诈而被定罪,此前他们提供了证明其无罪的文件。当同一个人后来要求将与制造法庭文件无罪释放定罪相关的网址擦除时,审查人员对发送给谷歌的无罪释放文件进行了评估认定是伪造的,并恢复了以前所有被擦除的网址。
但是更典型地,由于请求者方面的错误而导致请求被拒绝。常见错误包括对网址的请求不在Google的目录搜索中以及无效或不完整的网址(例如,请求facebook.com而不是特定的个人资料页面)。对于2016年之后审阅者开始注释申请的请求,由于请求者的错误拒绝了24.5%.
5、目标内容
总体而言,请求者已试图在互联网上取消与395,907个不同主机名相关的URL。这些请求获得了一系列潜在的个人信息:一些请求者试图控制通过社交网络和目录服务公开的数字足迹,而其他请求者则请求擦除与新闻来源和政府报告相关URL。我们将根据目标主机名、请求页面上显示的内容类别、以及最终是否有更好的机制让公众诉诸于控制受欢迎请求的站点上的个人信息,来探索这些多样化的应用程序。
5.1 经常作为目标的网站
我们列出了表7中2014年5月至2017年12月要求擦除的前20个主机名的细分,我们依靠主机名而不是二级域来区分同一域上托管的多种服务(例如wordpress.com))。列出的网站中大约有一半是社交网络和论坛,最受欢迎的网站包括Facebook,YouTube,Google +,Google网上论坛和Twitter。实际上,由于许多未在前20名中反映出来的运营ccTLD(例如,facebook.fr,face book.de),对这些网站的要求可能会更高。另一半包括目录站点,这些目录站点聚合了其他站点(例如118712和Profile Engine)的联系方式和个人内容。排名前20位的网站合起来占所请求URL的11.2%。根据网站的不同,擦除率差异很大,范围在12.1%至91.4%之间。
表7
为了提供剩余主机名的内容,我们评估了图6中顺序的下一个最受欢迎的主机名所覆盖的请求的累积比例。我们发现20.9%的请求URL只针对100个主机名,40.8%的请求针对前1000个主机名。相比之下,60.3%的主机名只收到一个请求,89.6%的主机名最多收到5个请求。我们的研究结果表明,欧洲居民对隐私的关注集中在互联网上数亿主机名中的一小部分。 图6
5.2 网站种类
为了更全面地了解请求所针对的网站类别,我们审评从2016年1月起两年内为每个请求的URL分配标签(在第3节中进行了讨论)。这些标签涵盖四个不同的类别:社交媒体内容,新闻来源,目录和信息收集、以及政府页面。显示名称,地址和其他个人信息的目录占所请求URL的18.8%。社交媒体占请求的URL的13.9%。这两个类别的擦除率总计超过51%。新闻媒体,在请求的前20个主机名中完全不存在,占请求的URL的17.5%;反映了互联网上独立媒体的数量。政府页面的擦除频率要少得多,仅占请求URL的2.5%。考虑到新闻和政府记录的公共利益性质,擦除率低于平均水平,分别为32.2%和19.5%。其余47.3%的URL不在明确定义的类别内。
我们在图7中提供了按站点类别列出的请求URL的每月细分。我们发现,针对新闻相关内容的请求从14.7%稳步增长至19.1%,而社交媒体的请求从15.5%下降至12.5%,而上个月再次爆发的请求主要集中在Instagram上。这些趋势可能反映了请求者随着时间的推移而调整他们关注的隐私问题。对于社交媒体,实体可能正在寻找其他机制来主动控制其社交媒体足迹(或者不太关心)。相反,新闻或目录服务仍在请求者的控制之外。
图7
另一方面,我们发现不同国家的个人请求的网站类别有很大的差异,如表9所示。仅关注请求量排名前五的国家,我们发现来自意大利和英国的请求者更有可能在请求中针对新闻媒体(分别占请求URL的32.5%和25.2%)。这与不同的新闻做法有关:意大利和英国的新闻来源更倾向于在涉及犯罪的文章中披露个人的身份。相比之下,德国和法国的新闻来源倾向于在报道犯罪的文章中匿名。与其他国家相比,法国和德国的请求者最关心的是通过社交媒体和目录服务公开的信息。最后,在西班牙,10.6%的请求url指向政府记录。这可能源于西班牙的法律,该法律要求政府公布“edictos”和“indultos”。前者是向失踪人员通报直接影响他们的政府决定的公开通知;后者是免除个人刑事判决或减刑的政府决定。这些变化揭示了RTBF的使用因国家而异,说明了“一刀切”隐私政策的挑战。
表9
5.2.1 新闻媒体 我们更深入地研究了每一类别,在表10中列出了2016年1月至2017年12月期间擦除申请所针对的前十大新闻机构和小报。我们还包括在整个数据集期间对同一域的所有历史请求的计数。这些机构为欧盟一些人口最多的国家提供新闻报道,包括英国、意大利和法国。2016年1月至2017年12月期间的擦除率在18.1%至40.5%之间。
表10
为了说明google对新闻媒体文章进行的各个方面平衡测试,我们提供了三个请求及其结果的示例。在一个案例中,在一家大公司担任重要职务的请求者试图将一篇关于因欺诈未遂而被判长期监禁的文章擦除。由于罪行的严重性和内容的专业相关性,谷歌拒绝了这一请求。在另一项要求中,某人试图将他们在遭受强盗袭击后幸存下来的采访擦除。尽管这篇文章是自编的,但考虑到请求者接受了采访,google擦除了URL因为内容很敏感。最后,一名请求者试图将一篇关于他们因家庭暴力被判无罪的新闻文章擦除,理由是没有向法官提交证实受害者受伤的医疗报告。考虑到请求者被无罪释放,谷歌将文章擦除。
我们注意到,RTBF只是目前用于删除新闻报道的一种技术机制。网站还可以在robots.txt中添加一个disallow指令,指示爬虫程序忽略任何列出的URL。对于某家受欢迎的意大利新闻网站,在RTBF要求擦除的URL中大约有20%出现在他们的disallow指令中,其中包括谷歌出于公众利益最终拒绝擦除的URL。我们无法明确说明是什么法律机制或内部决定导致新闻网站为这些URL添加禁止指令,但最终结果是,无论搜索查询或搜索请求的来源如何,新闻文章现在都从所有搜索结果中删除。这种站点级控制是否应该在实施RTBF方面发挥作用仍然是一个讨论的领域。
5.2.2 社交媒体社区
我们在表11中列出了过去两年中被要求擦除的十大最受欢迎的社交媒体网站。facebook、twitter、google+、instagram和youtube是被擦除请求最多的目标。2016年1月至2017年12月前十大网站的擦除率在33.2%至90.8%之间。 表11
所有这些社交网络都提供隐私控制,以限制对自编内容的访问,以及取缔违反网站服务条款的滥用内容(如色情报复)的机制。这些工具可能更适合那些只想控制其社交媒体足迹的个人,但由于非对称隐私控制(如照片标记、提及)而泄露的信息除外。此外,这些隐私控制还扩展到针对个人在各自网站上形成的搜索查询,而RTBF仅涵盖搜索引擎提供商。
每当存在这种隐私控制相关时,谷歌就会引导请求者使用它们。例如,在一个请求中,一个人试图删除他们的facebook个人资料。谷歌指出,Facebook有程序限制所有搜索引擎(而不仅仅是谷歌)的相关内容可见性,并建议请求者使用这些控件。在另一种情况下,某人请求从已发布自发布图像的页面上取消URL并将其重新发布。由于没有社交媒体隐私控制可干预,谷歌将此网址擦除。
5.2.3 目录网站
目录服务通过社交媒体渠道和业务列表(如黄页)公开提供索引和聚合信息,如姓名、地址、电话号码等。我们在表12中提供了最受欢迎的请求站点的分类。最受欢迎的网站,118712.fr,是一个在法国寻找专业人士和个人的发现服务。2016年1月至2017年12月期间,所有这些网站的擦除率在14.2-96.1%之间。目录汇总个人信息的擦除率高于专业信息。
表12
请求的示例包括试图取消列出指向显示其地址和电话号码的目录页面的几个URL的请求者。Google删除了所有网址。在另一种情况下,请求者试图将列出该请求者在各种公司中的职务的网址从搜索列表中删除。Google拒绝了此请求,因为该URL包含与职业相关的信息,这些信息既不准确也未过期
我们注意到大多数目录站点也提供了自己的搜索功能。成功的RTBF请求会在Google搜索上为个人擦除目录页,但如果没有直接在这些网站上采取其他RTBF措施,则公众仍然可以通过任何一种流行的目录服务执行直接搜索。搜索索引之间的差异可能导致可能的隐私风险,例如识别请求者。
5.2.4 政府记录
我们在表13中提供了过去两年中要求擦除的十大政府及与政府相关的网站的细分。受欢迎的主机包括发布政府公告的boe.es和提供作为英国政府经营的企业名录服务的companyhouse.gov.uk。2016年1月至2017年12月的擦除率在1.3%至65.2%之间。
表13
如5.2节开头所述,其中许多请求与西班牙政府发布的“ edictos”和“ indultos”有关。在一种这样的情况下,请求者试图从西班牙政府页面上删除3个URL,其中包含一个通知,该通知将请求者召集到市政厅处理与税收债务有关的事项。Google擦除了所有网址。在另一个请求中,一个人试图擦除从2015年起的政府页面,该页面描述了请求者如何在管理公司的同时受到破产命令和限制的约束而被判入狱。Google拒绝了该擦除请求,因为该信息是由政府实体发布的,并且与该内容具有重大的专业相关性。
5.2.5杂项
我们在表14中提供了属于杂项类别的顶级主机名的细目。成人网站、博客和论坛占前10名网站的8个。2016年1月至2017年12月期间,所有网页的擦除率在0.3-65.0%之间。我们注意到,通过goo.gl缩短的网址不在谷歌的搜索索引中,导致显示的擦除率很低。相反,google要求请求者提供完整的URL。同样,成人网站的低擦除率源于一种偏差,即少数请求者产生了绝大多数请求,而这些请求的内容与他们作为成人表演者的职业生涯有关。
表14
此类请求的示例包括请求者试图将多个URL从成人网站上删除到显示个人先前职业的裸体图像的网站。考虑到内容的敏感性质,以及由于个人转行从事成人行业以外的职业而缺乏专业相关性,谷歌将所有网址擦除。在另一个案例中,一位著名的前政治家要求删除一个指向维基百科页面的URL,该页面详细说明了请求者声称的定罪无效。谷歌拒绝了这一请求,原因是请求者的公共角色和公众对URL中引用的定罪的重大兴趣。
5.3 网页上的信息
作为欧洲居民如何在运用RTBF的最后衡量标准,我们研究了2016年1月至2017年12月期间每个请求者与URL上请求的信息之间的关系。为了进行分析,我们排除了所有错误的URL(在第4.5节中讨论)。我们使用前面概述的类别(见第3节)提供表15中URL引用的内容的一般摘要。最常要求的内容与专业信息有关,但很少达到擦除标准(16.7%)。这些请求中的许多涉及与请求者当前职业直接相关或相关的信息,因此在谷歌搜索中建立索引符合公众利益。个人信息(如家庭住址、联系方式)仅占请求的6.9%,而更敏感的个人信息(如医疗信息、性取向)仅占请求的2.4%。这两个类别的擦除率都超过90%,任何潜在的公共利益通常都会被内容的敏感性质所抵消。同样,当一个URL出现在搜索结果中,但在内容中没有提到请求者时,由于没有竞争性的公共利益,其擦除率为100%。相比之下,针对请求者的政治平台的请求中只有2.8%符合擦除标准。
表15
我们发现,可能出现私人信息的地方在很大程度上取决于RTBF擦除请求所涉及的网站类别,如表16所示。对于新闻,请求针对的文章的涵盖犯罪或专业不当行为。相反,寻求从社交媒体内容中删除的个人最常将目标指向自己撰写的帖子。这些结果再次突出显示了使用RTBF的两类个人:试图从社交媒体和目录网站上删除个人信息的个人,以及针对新闻网站和政府网站分别报告犯罪相关或专业相关信息的个人。
表16
6、治外法权请求
作为最后的衡量标准,我们研究了根据RTBF要求擦除的信息与该信息的受众之间的关系。特别是,我们将探讨请求是否跨越了请求者的国界甚至大陆边界。然而,以一种普遍的方式将地理边界映射到互联网站点或受众是极其困难的。我们考虑两个代理指标:对新闻媒体和总部位于请求者所在国家以外的其他页面的请求,以及从国家代码顶级域(cctld)不同于请求者所在国家的网站中删除内容的请求。
6.1 区域和国际新闻
对于2016年1月至2017年12月间收到擦除请求的前25个新闻主机名,我们计算了来自与媒体总部所在国家/地区相同的实体发出的请求中所占的比例。如表17所示,我们发现所有25个顶级新闻主机名都收到了来自本地个人的超过86%的请求。总部位于爱尔兰的爱尔兰独立组织收到了来自英国个人(可能在北爱尔兰)的URL擦除请求的10.3%。这种集中程度表明,大多数请求者都在当地将其擦除。
表17
如表18所示,虽然发生了欧洲人对非欧洲媒体的请求,但与欧洲媒体相比(表10中显示),他们的请求频率降低了一个数量级。最受欢迎的目标包括彭博社,《金融时报》和《纽约每日新闻》。这反映了我们先前的发现,即对新闻媒体的大多数请求都来自本地请求。
表18
6.2 目录、社交媒体和政府
我们重复相同的本地分析,这一次是针对从2016年1月至2017年12月分类为目录,社交媒体和政府页面的前10个主机名。我们在表19中显示结果。对于目录服务和政府页面,有一个明确本地请求的分类。对前10个目录服务中的7个的请求中,超过92.5%来自本地请求者。前10个政府页面中所有请求的82.5%也是如此。只有社交媒体和具有全球用户群的单个目录页面收到了来自多个欧洲国家的擦除请求。这些结果再次说明了大多数请求的本地性质。
表19
6.3 国家代码域
作为域外请求的一种替代方法,我们检查了请求者的语言环境(例如,法国)与请求擦除的URL的ccTLD(例如,nuwber.fr为.fr)之间的关系。我们将此与非欧盟ccTLD和非ccTLD的请求(例如.com)进行了比较。我们注意到这些ccTLD仅与发布者的网站有关,与任何特定于国家/地区的搜索门户无关。 我们在表20中按请求量列出了前5个国家/地区的结果。我们发现31.6–51.3%的请求针对注册到ccTLD的主机,其中77.2–88.2%在请求者的系统语言体系内。与我们对新闻媒体的分析一样,我们的结果突出了大多数RTBF请求的本地性质(不包括没有明确语言环境的URL)。
表20
7、结论
在本文中,我们对RTBF如何影响Google搜索信息的访问方式进行了深入分析。我们的分析涵盖了欧洲居民在过去三年零七个月内要求删除的近240万个URL。我们确定了RTBF请求的两个主要类别:删除在社交媒体和目录网站上找到的个人信息;并从新闻媒体和政府网页中删除法律历史记录和专业信息。我们的结果表明,这些请求背后的意图具有细微差别,部分原因是地区隐私关注,当地媒体规范和政府做法的变化。尽管大多数网址是个人要求的(85%),但我们发现政客和政府官员要求擦除33,937个网址,而非政府公众人物则要求擦除另外41,213个网址。总体而言,RTBF可以导致某些人的搜索结果重塑,只有1,000个实体(大约400,000个欧洲人中的0.25%)要求从346,000个网址中擦除。 附录: 表21
表22
来源:微信公众号:数据法盟 作者:翻译:朴杨鹤然
|