研究文章

利用机器学习改进不需要的资源过滤

作者:

天启书博伽瓦图拉,

克里斯托弗邓恩,

克里斯卡尼奇,

米纳西古普塔，以及

布瑞恩齐巴特作者信息和声明

AISec’14：2014年人工智能与安全研讨会会议记录

2014年11月

页95-102

https://doi.org/10.1145/2666652.2666662

出版:2014年11月7日出版历史

获取访问权限

摘要

广告同时为大多数免费网络内容提供了经济支持，也是终端用户最大的烦恼之一。此外，现代广告生态系统充斥着侵犯用户隐私的跟踪方法。用户的一个自然反应是安装广告拦截器，阻止广告商跟踪用户或显示广告。传统的广告拦截剂软件依赖手工制作的筛选表达式来生成与网页中包含的资源匹配的大型、笨重的正则表达式。这个过程需要大量的人力开销，并且容易产生劣质过滤器。我们提出了一种替代方法，该方法利用机器学习来引导一个高级分类器，以便在较少人工干预的情况下进行广告拦截。我们表明，我们的分类器可以同时保持与手工制作的过滤器类似的准确性，同时还可以阻止新广告，否则需要以额外的手工制作的过滤规则的形式进行进一步的人工干预。

工具书类

[1]

简易统计：2011年8月。https://easylist.adblockplus.org/blog/2011/09/01/easylist-statistics:-2011年8月。

[2]

十大最佳广告拦截器和隐私扩展。http://www.tomsguide.com/us/pictures-story/565-7-best-adblockers-privacy-extensions.html, 2013.

[3]

断开连接：在线隐私和安全。https://disconnect.me（断开连接）/, 2014.

[4]

简易开发。https://easylist.adblockplus.org/en/development网站, 2014.

[5]

轻松多变的变更日志。https://hg.adblockplus.org/easylist网站/2014年5月。

[6]

Adblock Plus社区。轻松列表。https://easylist.adblockplus.org, 2014.

[7]

亚历克赛。Alexa顶级网站。http://www.alexa.com/topsites网站, 2013.

[8]

Aydimer，O.、Ozturk，M.和Kayikcioglu，T.五种分类算法在从脑电信号提取的低维特征向量中的性能评估。第34届国际电信和信号处理会议（TSP）（2011年）。

[9]

Beil，A.2010年第一季度基于网络的恶意软件数据和趋势。http://blog.dasient.com/2010/05/q110-web-based-malware-data-and-trends.html, 2012.

[10]

电子前沿基金会。隐私獾。https://www.eff.org/privacybadger网站, 2014.

[11]

Fawcett，T.岩石分析简介。《模式识别快报》（2006）。

数字图书馆

[12]

Garera，S.、Provos，N.、Chew，M.和Rubin，A.D.钓鱼攻击检测和测量框架。在WORM'07年ACM关于经常性错误代码研讨会的会议记录（2007年）中。

数字图书馆

[13]

Gonzalez，N.destructoid的一半读者屏蔽了我们的广告。现在怎么办？http://www.destructoid.com/self-of-destructiod-s-readers-block-our-ads-now-what-247904.html, 2013.

[14]

M.Adblock，Gundlach。https://getadblock.com/, 2014.

[15]

Hurps，M.广告拦截器：广告咀嚼器。http://www.admuncher.com/, 2012.

[16]

Joachims，T.Svm-光支持向量机。http://svmlight.joachims.org, 2008.

[17]

Kohonen，T.自我组织图。IEEE会议记录（1990）。

[18]

Krammer，V.对侵入性网络广告的有效防御。《隐私、安全与信任》，2008年。2008年太平洋标准时间。第六届年会（2008年）。

数字图书馆

[19]

Krishnamurthy，B.和Wills，C.E.猫和老鼠：网络访问中的内容交付权衡。WWW'06第15届万维网国际会议论文集（2006）。

数字图书馆

[20]

Kushmerick，N.学习删除互联网广告。第三届自治机构年会会议记录（1999年）。

数字图书馆

[21]

Ma，J.、Saul，L.K.、Savage，S.和Voelker，G.M.《超越黑名单：学习从可疑URL中检测恶意网站》。第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集（2009年）。

数字图书馆

[22]

McDonald，M.广告块项目。http://adblock.mozdev.org/, 2002.

[23]

Nethercote，N.Adblock plus对萤火虫内存使用的影响。https://blog.mozilla.org/nnethercote/2014/05/14/adblock-pluss-effect-on-firefoxs-memory-usage/, 2014.

[24]

Nock，R.和Esfandiari，B.网页的在线自适应过滤。2005年10月3日至7日，在葡萄牙波尔图举行的第九届欧洲数据库知识发现原则与实践会议上。会议记录（2005年）。

数字图书馆

[25]

Orr，C.R.、Chauhan，A.、Gupta，M.、Frisz，C.J.和Dunn，C.W.通过静态程序分析识别javascript加载广告的方法。《2012年ACM电子社会隐私研讨会论文集》（2012年）。

数字图书馆

[26]

Palant，W.Adblock Plus公司。https://adblockplus.org网站, 2014.

[27]

Pedregosa，F.、Varoqueux，G.、Gramfort，A.、Michel，V.、Thirion，B.、Grisel，O.、Blondel，M.、Prettenhofer，P.、Weiss，R.、Dubourg，V.等。Scikit-learn：机器学习在蟒蛇中的应用。机器学习研究杂志12（2011），2825-2830。

数字图书馆

[28]

J.M.西尼尼（Signanini）和B.Ghostery麦克德莫特（McDermott）。网址：https://www.ghostery.com/en/, 2014.

引用人

Lee K公司Lim C公司金B金·T金·H蔡美儿TNgo C公司Ka-Wei Lee R公司库马尔R劳·H(2024)AdFlush：一种用于有效预防广告和Web跟踪器的现实世界可部署机器学习解决方案2024年ACM网络会议记录10.1145/3589334.3645698(1902-1913)在线发布日期：2024年5月13日
https://dl.acm.org/doi/10.1145/3589334.3645698
威蒂格M凯斯多安·D(2024)在网络层检测Web跟踪ICT系统安全和隐私保护10.1007/978-3-031-56326-3_10(131-148)在线发布日期：2024年4月24日
https://doi.org/10.1007/978-3-031-56326-3_10
勒·HElmalaki S公司马尔科普鲁A沙菲克Z卡拉德里诺J特隆科索C(2023)自动FR第32届USENIX安全研讨会会议记录10.5555/3620237.3620659(7535-7552)在线发布日期：2023年8月9日
https://dl.acm.org/doi/10.5555/3620237.3620659
显示更多引用者

索引术语

利用机器学习改进不需要的资源筛选

建议

网络终端用户的信息保护：隐私问题和措施

在当今世界，每个人都需要连接到互联网。然而，随着技术的发展，网络骗子也随着技术的进步而进步。为了保护私人信息，最终用户必须确保他们的数据得到保护。有很多方法。。。
阅读更多信息
独家报道：（同步的）Cookie Monster如何破坏我的加密VPN会话
EuroSec’18：第11届欧洲系统安全研讨会会议记录

近年来，在斯诺登事件曝光后，网络上出现了一场由组织、决策者和个人发起的旨在增强用户隐私意识的重大运动。因此，越来越多的发行商支持TLS。。。
阅读更多信息
综述：关于增强隐私的网络通信解决方案和主要免费工具的调查

最近，用户在网上冲浪时对隐私的关注有所增加。如今，许多用户都意识到，当他们访问网站时，这些网站可以跟踪他们，并在他们访问的元素、广告……上创建配置文件。。。
阅读更多信息

评论

信息和贡献者

问询处

发布于

封面图片ACM会议

AISec’14：2014年人工智能与安全研讨会会议记录

2014年11月

134页

国际标准图书编号：9781450331531

内政部：10.1145/2666652

总主席：
盖尔·琼安
美国亚利桑那州立大学
,
课程主席：
克里斯托斯·迪米特拉卡基斯
瑞典查尔默斯理工大学
,
艾卡捷琳尼·米特罗科萨
瑞典查尔默斯理工大学
,
本杰明·I.P.鲁宾斯坦
澳大利亚墨尔本大学

版权所有©2014 ACM。

如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

赞助商

SIGSAC:ACM安全、审计和控制特别利益小组

出版商

计算机协会

美国纽约州纽约市

出版历史

出版：2014年11月7日

权限

请求对此文章的权限。

检查更新

作者标记

限定符

研究文章

资金来源

计算机和网络系统处

会议

CCS’14

赞助商：

SIGSAC公司

CCS’14:2014 ACM SIGSAC计算机和通信安全会议

2014年11月7日

美国亚利桑那州斯科茨代尔

接受率

AISec’14论文接受率24份提交文件中的12份，50%；

231份提交文件中的总体接受率为94份，占41%

即将召开的会议

CCS’24

赞助商：
sigsac公司

ACM SIGSAC计算机和通信安全会议

2024年10月14日至18日

盐湖城，美国犹他州，美国

贡献者

其他指标

查看文章指标

文献计量学和引文

文献计量学

文章指标

27
引文总数
查看引文
378
总下载次数

下载量（最近12个月）17
下载次数（最近6周）2

其他指标

查看作者指标

引文

引用人

Lee K公司Lim C公司金B金·T金·H蔡TNgo C公司Ka-Wei Lee R公司库马尔R劳·H(2024)AdFlush：一种用于有效预防广告和Web跟踪器的现实世界可部署机器学习解决方案2024年ACM网络会议记录10.1145/3589334.3645698(1902-1913)在线发布日期：2024年5月13日
https://dl.acm.org/doi/10.1145/3589334.3645698
威蒂格M凯斯多安·D(2024)在网络层检测Web跟踪ICT系统安全和隐私保护10.1007/978-3-031-56326-3_10(131-148)在线发布日期：2024年4月24日
https://doi.org/10.1007/978-3-031-56326-3_10
勒·HElmalaki S公司马尔科普鲁A沙菲克Z卡兰德里诺J特龙科索C(2023)自动FR第32届USENIX安全研讨会会议记录10.5555/3620237.3620659(7535-7552)在线发布日期：2023年8月9日
https://dl.acm.org/doi/10.5555/3620237.3620659
科丹达兰S桑卡拉MJayarathna S公司阿肖克五世(2023)为盲人屏幕阅读器用户检测虚假的深色网络广告成像杂志10.3390/jimaging91102399:11(239)在线发布日期：2023年11月6日
https://doi.org/10.3390/jimaging9110239
加塞米沙里夫MPolakis J公司孟W延森CCremers C公司基尔达·E(2023)字里行间阅读：使用字节码分类检测跟踪JavaScript2023年ACM SIGSAC计算机和通信安全会议记录10.1145/3576915.3616637(3475-3489)在线发布日期：2023年11月15日
https://dl.acm.org/doi/10.1145/3576915.3616637
杨Z裴W陈M岳C(2022)WTAGRAPH：使用图神经网络的网络跟踪和广告检测2022年IEEE安全与隐私研讨会（SP）10.1109/SP46214.2022.9833670(1540-1557)在线发布日期：2022年5月
https://doi.org/10.109/SP46214.2022.9833670
M年S秒G T公司(2022)广告服务检测——使用机器学习技术的比较研究2022年第13届国际计算通信与网络技术会议（ICCCNT）10.1109/ICCNT54827.2022.9984339(1-7)在线发布日期：2022年10月3日
https://doi.org/10.109/ICCCNT54827.2022.9984339
朱S王Z陈X李斯（Li S）男K伊克巴尔U钱ZChan K（Chan K）克里希纳穆提S沙菲克Z郝Y李G张Z邹X(2021)用可操作的对手示例规避基于ML的Adblocker第37届计算机安全应用年会会议记录10.1145/3485832.3488008(541-553)在线发布日期：2021年12月6日
https://dl.acm.org/doi/10.1145/3485832.34880080
史密斯M斯奈德P利夫希茨B斯特凡·D金·Y金·J维格纳G施娥(2021)SugarCoat：通过编程生成隐私保护的、与Web兼容的资源替换来阻止内容2021年ACM SIGSAC计算机与通信安全会议记录10.1145/3460120.3484578(2844-2857)在线发布日期：2021年11月12日
https://dl.acm.org/doi/10.1145/3460120.3484578
卡加兰AAkhondzadeh M公司Heidarpour M公司Manshaei M公司萨拉马提亚K内贾德·萨蒂尔(2021)Wide-AdGraph：使用宽依赖链图检测广告跟踪器2021年第13届ACM网络科学会议记录10.1145/3447535.3462549(253-261)在线发布日期：2021年6月21日
https://dl.acm.org/doi/10.1145/3447535.3462549
显示更多引用者

视图选项

获取访问权限

登录选项

请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

完全访问权限

获取此出版物

查看选项

PDF格式

以PDF文件查看或下载。

电子阅读器

使用联机查看电子阅读器.

电子阅读器

媒体

数字

其他

桌子