研究论文

公共访问

阳光：具有统计置信度的尺度细粒度目标检测

作者:

马蒂亚斯勒屈耶,

莱利斯帕恩,

亚尼斯狡猾的,

奥古斯丁尚特罗,

罗克萨纳吉安巴苏、和

丹尼尔许作者信息和声明

CCS’15：第22届ACM SIGSAC计算机和通信安全会议记录

2015年10月

页554-566

https://doi.org/10.1145/2810103.2813614

出版:2015年10月12日出版历史

PDF格式电子阅读器

摘要

我们推出了Sunlight，这是一个系统，它可以大规模检测网络上目标现象的原因，例如个性化广告、推荐或内容，并且具有可靠的统计置信度。随着无数服务收集、分析、使用和交换用户的个人信息，今天的网络变得越来越复杂和难以理解。没有人知道谁拥有什么数据，他们使用数据的目的是什么，以及这些使用如何影响用户。现有的少数研究揭示了一些有问题的影响，例如歧视性定价和广告，但这些研究要么规模太小，无法概括，要么缺乏对结果信心的正式评估，使其难以信任或解释。Sunlight为个人数据测量带来了一种原则性和可扩展的方法，它采用了统计学中成熟的方法来解决目标检测的具体问题。我们的方法将不同的操作正式分为四个关键阶段：可扩展假设生成、可解释假设形成、统计显著性测试和多重测试校正。每个阶段都有来自统计的多个机制的实例化，每个机制都做出不同的假设和权衡。阳光提供模块化设计，允许探索这一广阔的设计空间。我们探索了这个空间的一部分，从分析和实验两方面彻底评估了权衡。我们的探索揭示了可伸缩性和信心之间的微妙矛盾。Sunlight的默认功能实现了平衡，提供了第一个能够以精细的粒度、大规模和可靠的统计理由对目标进行诊断的系统。

我们通过在网上进行两项针对目标的测量研究来展示我们的系统，这两项研究都是同类研究中规模最大的。我们的研究——关于Gmail和网络上的广告定位——揭示了统计上合理的证据，与谷歌关于敏感和禁止话题缺乏目标定位的两项声明相矛盾。

工具书类

[1]

AdBlockPlus.small（AdBlockPlus.small）https://adblockplus.org/, 2015.

[2]

Barford，P.、Canadi，I.、Krushevskaja，D.、Ma，Q.和Muthukrishnan，S.Adscape:收集和分析在线展示广告WWW（2014年4月）。

数字图书馆

[3]

Benjamini，Y.和Yekutieli，D.依赖性下多重测试中错误发现率的控制。《统计年鉴》（2001），1165-1188。

[4]

Bickel，P.J.、Ritov，Y.和Tsybakov，A.B.同时分析套索和dantzig选择器。安。统计师。37, 4 (08 2009), 1705--1732.

[5]

Bodik，P.、Goldszmidt，M.、Fox，A.、Woodard，D.B.和Andersen，H.数据中心指纹识别：性能危机的自动分类。在欧洲计算机系统会议（2010年）上。

数字图书馆

[6]

Book，T.和Wallach，D.S.移动广告目标的实证研究。arXiv.org（2015）。

[7]

Brandeis，L.《宣传能做什么》，《哈珀周刊》（1913年12月）。

[8]

Datta，A.、Tschantz，M.C.和Datta（A.）。广告隐私设置的自动化实验。在《隐私增强技术论文集》（2015）中。

[9]

Donoho，D.L.压缩传感。IEEE信息理论汇刊52，4（2006），1289--1306。

数字图书馆

[10]

Dudoit，S.和van der Laan，M.，基因组学应用的多种测试程序。施普林格，2008年。

[11]

Feldman，V.最佳硬度结果，以最大限度地与单项式一致。SIAM计算机杂志39，2（2009），606-645。

数字图书馆

[12]

谷歌。AdSense策略.smallhttps://support.google.com/adsense/answer/3016459？hl=en, 2015.

[13]

谷歌。AdWords策略.smallhttps://support.google.com/adwordspolicy/answer/6008942？hl=en, 2015.

[14]

Gretton，A.、Bousquet，O.、Smola，A.和Schölkopf，B.使用Hilbert-Schmidt规范测量统计相关性。算法学习理论（2005）。

数字图书馆

[15]

Hannak，A.、Sapiezynski，P.、Kakhki，A.M.、Krishnamurthy，B.、Lazer，D.、Mislove，A.和Wilson，C.测量网络搜索的个性化。WWW（2013年5月）。

数字图书馆

[16]

Hannak，A.、Soeller，G.、Lazer，D.、Mislove，A.和Wilson，C.测量电子商务网站上的价格歧视和指导。IMC（2014年11月）。

数字图书馆

[17]

Holm，S.一种简单的顺序拒绝多重测试程序。《斯堪的纳维亚统计杂志》6，2（1979），65-70。

[18]

Lécuyer，M.、Ducoffe，G.、Lan，F.、Papancea，A.、Petsios，T.、Spahn，R.、Chaintreau，A.和Geambasu，R.XRay：用差异相关性增强网络的透明度。第23届USENIX安全研讨会（USENIX-Security 14）（2014年）。

数字图书馆

[19]

Liu，B.、Sheth，A.、Weinsberg，U.、Chandrashekar，J.和Govindan，R.AdReveal：提高在线定向广告的透明度。在HotNets-XII（2013年11月）中。

数字图书馆

[20]

Mikians，J.、Gyarmati，L.、Erramilli，V.和Laoutaris，N.在互联网上检测价格和搜索歧视。在HotNets XI：第11届ACM网络热点研讨会论文集（2012年10月）中，ACM请求权限。

数字图书馆

[21]

Mikians，J.、Gyarmati，L.、Erramilli，V.和Laoutaris，N.《电子商务中价格歧视的群体辅助搜索：初步结果》。arXiv.org（2013年7月）。

数字图书馆

[22]

Nath，S.MAdScope：《移动应用程序内目标广告的特征》，《ACM Mobisys学报》（2015年）。

数字图书馆

[23]

Ng，A.Y.特征选择，l1与l2正则化，以及旋转不变性。《第二十届机器学习国际会议论文集》（2004年）。

数字图书馆

[24]

Rubin，D.B.在随机和非随机研究中评估治疗的因果效应。《教育心理学杂志》66（1974），688-701。

[25]

小硒http://www.seleniumhq.org/, 2015.

[26]

Tibshirani，R.通过Lasso回归收缩和选择。《皇家统计学会杂志》，B辑58（1994），267-288。

[27]

Vissers，T.、Nikiforakis，N.、Bielova，N.和Joosen，W.哭泣的狼？论网上机票的价格歧视。隐私增强技术的热门话题（2014年6月），1-12。

[28]

Wu，T.T.，Chen，Y.F.，Hastie，T.，Sobel，E.，and Lange，K.通过套索惩罚逻辑回归进行全基因组关联分析。生物信息学25，6（2009），714--721。

数字图书馆

[29]

Xing，X.，Meng，W.，Doozan，D.，Feamster，N.，Lee，W.和Snoeren，A.C.用Bobble公开不一致的Web搜索结果。《PAM’14：被动和主动测量会议论文集》（2014）。

数字图书馆

引用人

Gkiouzepi E公司安德烈欧A果加OLoiseau P公司(2023)合作广告透明度：承诺与限制2023年IEEE安全与隐私研讨会（SP）10.1109/SP46215.2023.10179448(2639-2657)在线发布日期：2023年5月
https://doi.org/10.109/SP46215.2023.10179448
哦C卡尼奇C麦考伊D皮尔斯·P阴H斯塔夫鲁ACremers C公司施娥(2022)Cartology：通过广告网络身份纠缠拦截目标广告2022年ACM SIGSAC计算机与通信安全会议记录10.1145/3548606.3560641(2401-2414)在线发布日期：2022年11月7日
https://dl.acm.org/doi/10.1145/3548606.3560641
卡塞尔D林斯（Lin S）布拉吉纳A王伟张A鲍尔L肖H贾勒利伯特T(2021)OmniCrawl：使用真实桌面和移动浏览器对Web跟踪进行综合测量隐私增强技术会议记录10.2478/操作-2022-00122022:1(227-252)在线发布日期：2021年11月20日
https://doi.org/10.2478/popets-2022-0012
显示更多引用者

索引术语

阳光：具有统计置信度的细粒度目标检测
1. 安全和隐私
  1. 安全和隐私的人类和社会方面
2. 社交和专业话题
  1. 计算/技术政策
  2. 专业主题
    1. 计算机专业
      1. 道德规范

建议

我总觉得有人在看着我：衡量在线行为广告
CoNEXT’15：第11届ACM新兴网络实验和技术会议记录

在线行为有针对性的广告（OBA）作为一种提高在线广告有效性的方法，其重要性日益凸显。OBA根据用户的在线活动将标签或标签与用户关联，然后使用这些标签。。。
阅读更多信息
你应该使用应用程序吗比较应用程序和基于Web的在线服务的隐私含义
IMC’16：2016年互联网测量会议记录

许多流行的免费在线服务通过Web浏览器以及iOS和Android上的应用程序提供跨平台界面。为了使这些服务盈利，许多其他服务还包括跟踪和广告图书馆，这些图书馆通过。。。
阅读更多信息
我的广告选择：为在线广告带来透明度和控制

在过去的几年里，网络广告的侵入性和日益增长的侵入性引起了人们对用户隐私和网络可用性的严重担忧。作为对这些担忧的回应，我们目睹了无数广告的出现。。。
阅读更多信息

评论

信息和贡献者

问询处

发布于

封面图片ACM会议

CCS’15：第22届ACM SIGSAC计算机和通信安全会议记录

2015年10月

1750页

国际标准图书编号：9781450338325

内政部：10.1145/2810103

总主席：
Indrajit射线
美国科罗拉多州立大学
,
课程主席：
李宁辉
美国普渡大学
,
克里斯托弗·克鲁格尔
美国加州大学圣巴巴拉分校

版权所有©2015 ACM。

如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

赞助商

SIGSAC:ACM安全、审计和控制特别利益集团

出版商

计算机协会

美国纽约州纽约市

出版历史

出版：2015年10月12日

权限

请求对此文章的权限。

检查更新

作者标记

限定符

研究文章

资金来源

会议

CCS’15

主办单位：

SIGSAC公司

CCS’15：第22届ACM计算机和通信安全会议

2015年10月12-16日

科罗拉多州，丹佛，美国

接受率

CCS’15论文接受率660份提交文件中的128份，19%；

6999份提交文件的总体接受率为1261，18%

即将召开的会议

CCS’24

主办单位：
sigsac公司

ACM SIGSAC计算机和通信安全会议

2024年10月14日至18日

盐湖城，美国犹他州，美国

贡献者

其他指标

查看文章指标

文献计量学和引文

文献计量学

文章指标

27
引文总数
查看引文
793
总下载次数

下载次数（过去12个月）90
下载次数（最近6周）7

其他指标

查看作者指标

引文

引用人

Gkiouzepi E公司安德烈乌A戈加OLoiseau P公司(2023)合作广告透明度：承诺与限制2023年IEEE安全与隐私研讨会（SP）10.1109/SP46215.2023.10179448(2639-2657)在线发布日期：2023年5月
https://doi.org/10.109/SP46215.2023.10179448
哦C卡尼奇C麦考伊D皮尔斯·P阴H斯塔夫鲁ACremers C公司施娥(2022)Cartology：通过广告网络身份纠缠拦截目标广告2022年ACM SIGSAC计算机和通信安全会议记录10.1145/3548606.3560641(2401-2414)在线发布日期：2022年11月7日
https://dl.acm.org/doi/10.1145/3548606.3560641
卡塞尔D林斯（Lin S）布拉吉纳A王伟张A鲍尔L肖H贾勒利伯特T(2021)OmniCrawl：使用真实桌面和移动浏览器对Web跟踪进行综合测量隐私增强技术会议记录10.2478/人-2022-00122022:1(227-252)在线发布日期：2021年11月20日
https://doi.org/10.2478/popets-2022-0012
曾娥魏MGregersen T公司科诺T罗斯纳F莱文·D误会A阿曼·JLuckie M（幸运M）(2021)投票、点击诱饵和纪念性的2美元钞票第21届ACM互联网测量会议记录10.1145/3487552.3487850(507-525)在线发布日期：2021年11月2日
https://dl.acm.org/doi/10.1145/3487552.3487850
曾娥Kohno T公司罗斯纳F北村Y奎格利A伊斯比斯特KIgarashi T公司比约恩·P德鲁克S(2021)什么是“坏”广告？用户对有问题的在线广告的认知2021年CHI计算机系统人为因素会议记录10.1145/3411764.3445459(1-24)在线发布日期：2021年5月6日
https://dl.acm.org/doi/10.1145/3411764.345459
阿加瓦尔·PJoglekar S公司帕帕佐普洛斯P萨斯特里N库尔特利斯N(2020)别跟踪我，兄弟！超党派网站用户统计数据的差异跟踪2020年网络会议记录10.1145/3366423.3380221(1479-1490)在线发布日期：2020年4月20日
https://dl.acm.org/doi/10.1145/3366423.3380221
汉森J魏M韦斯S库格勒M斯特拉希列维茨L你的B伯恩浩普特R米勒FVerweij D公司安德烈斯·J麦格雷内尔J科克伯恩A阿韦利诺一世戈盖A比约恩P赵S萨姆森B科西尔尼克R(2020)断章取义数据实现超个性化广告2020年CHI计算机系统人为因素会议记录10.1145/3313831.3376415(1-13)在线发布日期：2020年4月21日
https://dl.acm.org/doi/10.1145/3313831.3376415
埃德森L劳inger T麦考伊D(2020)脸书广告库的安全性分析2020年IEEE安全与隐私研讨会（SP）10.1109/SP40000.2020.00084(661-678)在线发布日期：2020年5月
https://doi.org/10.109/SP40000.2020.00084
巴赫RKern C（Kern C）阿玛亚A基什F克鲁特F赫克特J海涅曼J(2019)利用数字跟踪数据预测投票行为社会科学计算机评论10.1177/089443931988289639:5(862-883)在线发布日期：2019年10月22日
https://doi.org/10.1177/0894439319882896
阿里·MSapiezynski P公司博根M科罗洛瓦A误会A瑞克A(2019)通过优化进行区分ACM人机交互会议录10.1145/3359301三：CSCW公司(1-30)在线发布日期：2019年11月7日
https://dl.acm.org/doi/10.1145/3359301
显示更多引用者

视图选项

查看选项

PDF格式

以PDF文件查看或下载。

电子阅读器

使用联机查看电子阅读器.

电子阅读器

获取访问权限

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

媒体

数字

其他

桌子