跳到主要内容
10.1145/2810103.2813614acm会议文章/章节视图摘要出版物页面中央控制系统会议记录会议集合
研究论文
公共访问

阳光:具有统计置信度的尺度细粒度目标检测

出版:2015年10月12日 出版历史
  • 获取引文提醒
  • 摘要

    我们推出了Sunlight,这是一个系统,它可以大规模检测网络上目标现象的原因,例如个性化广告、推荐或内容,并且具有可靠的统计置信度。随着无数服务收集、分析、使用和交换用户的个人信息,今天的网络变得越来越复杂和难以理解。没有人知道谁拥有什么数据,他们使用数据的目的是什么,以及这些使用如何影响用户。现有的少数研究揭示了一些有问题的影响,例如歧视性定价和广告,但这些研究要么规模太小,无法概括,要么缺乏对结果信心的正式评估,使其难以信任或解释。Sunlight为个人数据测量带来了一种原则性和可扩展的方法,它采用了统计学中成熟的方法来解决目标检测的具体问题。我们的方法将不同的操作正式分为四个关键阶段:可扩展假设生成、可解释假设形成、统计显著性测试和多重测试校正。每个阶段都有来自统计的多个机制的实例化,每个机制都做出不同的假设和权衡。阳光提供模块化设计,允许探索这一广阔的设计空间。我们探索了这个空间的一部分,从分析和实验两方面彻底评估了权衡。我们的探索揭示了可伸缩性和信心之间的微妙矛盾。Sunlight的默认功能实现了平衡,提供了第一个能够以精细的粒度、大规模和可靠的统计理由对目标进行诊断的系统。
    我们通过在网上进行两项针对目标的测量研究来展示我们的系统,这两项研究都是同类研究中规模最大的。我们的研究——关于Gmail和网络上的广告定位——揭示了统计上合理的证据,与谷歌关于敏感和禁止话题缺乏目标定位的两项声明相矛盾。

    工具书类

    [1]
    AdBlockPlus.small(AdBlockPlus.small)https://adblockplus.org/, 2015.
    [2]
    Barford,P.、Canadi,I.、Krushevskaja,D.、Ma,Q.和Muthukrishnan,S.Adscape:收集和分析在线展示广告WWW(2014年4月)。
    [3]
    Benjamini,Y.和Yekutieli,D.依赖性下多重测试中错误发现率的控制。《统计年鉴》(2001),1165-1188。
    [4]
    Bickel,P.J.、Ritov,Y.和Tsybakov,A.B.同时分析套索和dantzig选择器。安。统计师。37, 4 (08 2009), 1705--1732.
    [5]
    Bodik,P.、Goldszmidt,M.、Fox,A.、Woodard,D.B.和Andersen,H.数据中心指纹识别:性能危机的自动分类。在欧洲计算机系统会议(2010年)上。
    [6]
    Book,T.和Wallach,D.S.移动广告目标的实证研究。arXiv.org(2015)。
    [7]
    Brandeis,L.《宣传能做什么》,《哈珀周刊》(1913年12月)。
    [8]
    Datta,A.、Tschantz,M.C.和Datta(A.)。广告隐私设置的自动化实验。在《隐私增强技术论文集》(2015)中。
    [9]
    Donoho,D.L.压缩传感。IEEE信息理论汇刊52,4(2006),1289--1306。
    [10]
    Dudoit,S.和van der Laan,M.,基因组学应用的多种测试程序。施普林格,2008年。
    [11]
    Feldman,V.最佳硬度结果,以最大限度地与单项式一致。SIAM计算机杂志39,2(2009),606-645。
    [12]
    谷歌。AdSense策略.smallhttps://support.google.com/adsense/answer/3016459?hl=en, 2015.
    [13]
    谷歌。AdWords策略.smallhttps://support.google.com/adwordspolicy/answer/6008942?hl=en, 2015.
    [14]
    Gretton,A.、Bousquet,O.、Smola,A.和Schölkopf,B.使用Hilbert-Schmidt规范测量统计相关性。算法学习理论(2005)。
    [15]
    Hannak,A.、Sapiezynski,P.、Kakhki,A.M.、Krishnamurthy,B.、Lazer,D.、Mislove,A.和Wilson,C.测量网络搜索的个性化。WWW(2013年5月)。
    [16]
    Hannak,A.、Soeller,G.、Lazer,D.、Mislove,A.和Wilson,C.测量电子商务网站上的价格歧视和指导。IMC(2014年11月)。
    [17]
    Holm,S.一种简单的顺序拒绝多重测试程序。《斯堪的纳维亚统计杂志》6,2(1979),65-70。
    [18]
    Lécuyer,M.、Ducoffe,G.、Lan,F.、Papancea,A.、Petsios,T.、Spahn,R.、Chaintreau,A.和Geambasu,R.XRay:用差异相关性增强网络的透明度。第23届USENIX安全研讨会(USENIX-Security 14)(2014年)。
    [19]
    Liu,B.、Sheth,A.、Weinsberg,U.、Chandrashekar,J.和Govindan,R.AdReveal:提高在线定向广告的透明度。在HotNets-XII(2013年11月)中。
    [20]
    Mikians,J.、Gyarmati,L.、Erramilli,V.和Laoutaris,N.在互联网上检测价格和搜索歧视。在HotNets XI:第11届ACM网络热点研讨会论文集(2012年10月)中,ACM请求权限。
    [21]
    Mikians,J.、Gyarmati,L.、Erramilli,V.和Laoutaris,N.《电子商务中价格歧视的群体辅助搜索:初步结果》。arXiv.org(2013年7月)。
    [22]
    Nath,S.MAdScope:《移动应用程序内目标广告的特征》,《ACM Mobisys学报》(2015年)。
    [23]
    Ng,A.Y.特征选择,l1与l2正则化,以及旋转不变性。《第二十届机器学习国际会议论文集》(2004年)。
    [24]
    Rubin,D.B.在随机和非随机研究中评估治疗的因果效应。《教育心理学杂志》66(1974),688-701。
    [25]
    小硒http://www.seleniumhq.org/, 2015.
    [26]
    Tibshirani,R.通过Lasso回归收缩和选择。《皇家统计学会杂志》,B辑58(1994),267-288。
    [27]
    Vissers,T.、Nikiforakis,N.、Bielova,N.和Joosen,W.哭泣的狼?论网上机票的价格歧视。隐私增强技术的热门话题(2014年6月),1-12。
    [28]
    Wu,T.T.,Chen,Y.F.,Hastie,T.,Sobel,E.,and Lange,K.通过套索惩罚逻辑回归进行全基因组关联分析。生物信息学25,6(2009),714--721。
    [29]
    Xing,X.,Meng,W.,Doozan,D.,Feamster,N.,Lee,W.和Snoeren,A.C.用Bobble公开不一致的Web搜索结果。《PAM’14:被动和主动测量会议论文集》(2014)。

    引用人

    查看全部
    • (2023)合作广告透明度:承诺与限制2023年IEEE安全与隐私研讨会(SP)10.1109/SP46215.2023.10179448(2639-2657)在线发布日期:2023年5月
    • (2022)Cartology:通过广告网络身份纠缠拦截目标广告2022年ACM SIGSAC计算机与通信安全会议记录10.1145/3548606.3560641(2401-2414)在线发布日期:2022年11月7日
    • (2021)OmniCrawl:使用真实桌面和移动浏览器对Web跟踪进行综合测量隐私增强技术会议记录10.2478/操作-2022-00122022:1(227-252)在线发布日期:2021年11月20日
    • 显示更多引用者

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    CCS’15:第22届ACM SIGSAC计算机和通信安全会议记录
    2015年10月
    1750页
    国际标准图书编号:9781450338325
    内政部:10.1145/2810103
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2015年10月12日

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 测量
    2. 隐私
    3. web透明度

    限定符

    • 研究文章

    资金来源

    会议

    CCS’15
    主办单位:
    CCS’15:第22届ACM计算机和通信安全会议
    2015年10月12-16日
    科罗拉多州,丹佛,美国

    接受率

    CCS’15论文接受率660份提交文件中的128份,19%;
    6999份提交文件的总体接受率为1261,18%

    即将召开的会议

    CCS’24
    ACM SIGSAC计算机和通信安全会议
    2024年10月14日至18日
    盐湖城,美国犹他州,美国

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)90
    • 下载次数(最近6周)7

    其他指标

    引文

    引用人

    查看全部
    • (2023)合作广告透明度:承诺与限制2023年IEEE安全与隐私研讨会(SP)10.1109/SP46215.2023.10179448(2639-2657)在线发布日期:2023年5月
    • (2022)Cartology:通过广告网络身份纠缠拦截目标广告2022年ACM SIGSAC计算机和通信安全会议记录10.1145/3548606.3560641(2401-2414)在线发布日期:2022年11月7日
    • (2021)OmniCrawl:使用真实桌面和移动浏览器对Web跟踪进行综合测量隐私增强技术会议记录10.2478/人-2022-00122022:1(227-252)在线发布日期:2021年11月20日
    • (2021)投票、点击诱饵和纪念性的2美元钞票第21届ACM互联网测量会议记录10.1145/3487552.3487850(507-525)在线发布日期:2021年11月2日
    • (2021)什么是“坏”广告?用户对有问题的在线广告的认知2021年CHI计算机系统人为因素会议记录10.1145/3411764.3445459(1-24)在线发布日期:2021年5月6日
    • (2020)别跟踪我,兄弟!超党派网站用户统计数据的差异跟踪2020年网络会议记录10.1145/3366423.3380221(1479-1490)在线发布日期:2020年4月20日
    • (2020)断章取义数据实现超个性化广告2020年CHI计算机系统人为因素会议记录10.1145/3313831.3376415(1-13)在线发布日期:2020年4月21日
    • (2020)脸书广告库的安全性分析2020年IEEE安全与隐私研讨会(SP)10.1109/SP40000.2020.00084(661-678)在线发布日期:2020年5月
    • (2019)利用数字跟踪数据预测投票行为社会科学计算机评论10.1177/089443931988289639:5(862-883)在线发布日期:2019年10月22日
    • (2019)通过优化进行区分ACM人机交互会议录10.1145/3359301:CSCW公司(1-30)在线发布日期:2019年11月7日
    • 显示更多引用者

    视图选项

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    获取访问权限

    登录选项

    完全访问权限

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享