跳到主要内容
10.1145/2666652.2666662acm会议文章/章节视图摘要出版物页面中央结算系统会议记录会议集合
研究文章

利用机器学习改进不需要的资源过滤

出版:2014年11月7日 出版历史
  • 获取引文提醒
  • 摘要

    广告同时为大多数免费网络内容提供了经济支持,也是终端用户最大的烦恼之一。此外,现代广告生态系统充斥着侵犯用户隐私的跟踪方法。用户的一个自然反应是安装广告拦截器,阻止广告商跟踪用户或显示广告。传统的广告拦截剂软件依赖手工制作的筛选表达式来生成与网页中包含的资源匹配的大型、笨重的正则表达式。这个过程需要大量的人力开销,并且容易产生劣质过滤器。我们提出了一种替代方法,该方法利用机器学习来引导一个高级分类器,以便在较少人工干预的情况下进行广告拦截。我们表明,我们的分类器可以同时保持与手工制作的过滤器类似的准确性,同时还可以阻止新广告,否则需要以额外的手工制作的过滤规则的形式进行进一步的人工干预。

    工具书类

    [1]
    简易统计:2011年8月。https://easylist.adblockplus.org/blog/2011/09/01/easylist-statistics:-2011年8月。
    [2]
    十大最佳广告拦截器和隐私扩展。http://www.tomsguide.com/us/pictures-story/565-7-best-adblockers-privacy-extensions.html, 2013.
    [3]
    断开连接:在线隐私和安全。https://disconnect.me(断开连接)/, 2014.
    [4]
    简易开发。https://easylist.adblockplus.org/en/development网站, 2014.
    [5]
    轻松多变的变更日志。https://hg.adblockplus.org/easylist网站/2014年5月。
    [6]
    Adblock Plus社区。轻松列表。https://easylist.adblockplus.org, 2014.
    [7]
    亚历克赛。Alexa顶级网站。http://www.alexa.com/topsites网站, 2013.
    [8]
    Aydimer,O.、Ozturk,M.和Kayikcioglu,T.五种分类算法在从脑电信号提取的低维特征向量中的性能评估。第34届国际电信和信号处理会议(TSP)(2011年)。
    [9]
    Beil,A.2010年第一季度基于网络的恶意软件数据和趋势。http://blog.dasient.com/2010/05/q110-web-based-malware-data-and-trends.html, 2012.
    [10]
    电子前沿基金会。隐私獾。https://www.eff.org/privacybadger网站, 2014.
    [11]
    Fawcett,T.岩石分析简介。《模式识别快报》(2006)。
    [12]
    Garera,S.、Provos,N.、Chew,M.和Rubin,A.D.钓鱼攻击检测和测量框架。在WORM'07年ACM关于经常性错误代码研讨会的会议记录(2007年)中。
    [13]
    Gonzalez,N.destructoid的一半读者屏蔽了我们的广告。现在怎么办?http://www.destructoid.com/self-of-destructiod-s-readers-block-our-ads-now-what-247904.html, 2013.
    [14]
    M.Adblock,Gundlach。https://getadblock.com/, 2014.
    [15]
    Hurps,M.广告拦截器:广告咀嚼器。http://www.admuncher.com/, 2012.
    [16]
    Joachims,T.Svm-光支持向量机。http://svmlight.joachims.org, 2008.
    [17]
    Kohonen,T.自我组织图。IEEE会议记录(1990)。
    [18]
    Krammer,V.对侵入性网络广告的有效防御。《隐私、安全与信任》,2008年。2008年太平洋标准时间。第六届年会(2008年)。
    [19]
    Krishnamurthy,B.和Wills,C.E.猫和老鼠:网络访问中的内容交付权衡。WWW'06第15届万维网国际会议论文集(2006)。
    [20]
    Kushmerick,N.学习删除互联网广告。第三届自治机构年会会议记录(1999年)。
    [21]
    Ma,J.、Saul,L.K.、Savage,S.和Voelker,G.M.《超越黑名单:学习从可疑URL中检测恶意网站》。第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2009年)。
    [22]
    McDonald,M.广告块项目。http://adblock.mozdev.org/, 2002.
    [23]
    Nethercote,N.Adblock plus对萤火虫内存使用的影响。https://blog.mozilla.org/nnethercote/2014/05/14/adblock-pluss-effect-on-firefoxs-memory-usage/, 2014.
    [24]
    Nock,R.和Esfandiari,B.网页的在线自适应过滤。2005年10月3日至7日,在葡萄牙波尔图举行的第九届欧洲数据库知识发现原则与实践会议上。会议记录(2005年)。
    [25]
    Orr,C.R.、Chauhan,A.、Gupta,M.、Frisz,C.J.和Dunn,C.W.通过静态程序分析识别javascript加载广告的方法。《2012年ACM电子社会隐私研讨会论文集》(2012年)。
    [26]
    Palant,W.Adblock Plus公司。https://adblockplus.org网站, 2014.
    [27]
    Pedregosa,F.、Varoqueux,G.、Gramfort,A.、Michel,V.、Thirion,B.、Grisel,O.、Blondel,M.、Prettenhofer,P.、Weiss,R.、Dubourg,V.等。Scikit-learn:机器学习在蟒蛇中的应用。机器学习研究杂志12(2011),2825-2830。
    [28]
    J.M.西尼尼(Signanini)和B.Ghostery麦克德莫特(McDermott)。网址:https://www.ghostery.com/en/, 2014.

    引用人

    查看全部
    • (2024)AdFlush:一种用于有效预防广告和Web跟踪器的现实世界可部署机器学习解决方案2024年ACM网络会议记录10.1145/3589334.3645698(1902-1913)在线发布日期:2024年5月13日
    • (2024)在网络层检测Web跟踪ICT系统安全和隐私保护10.1007/978-3-031-56326-3_10(131-148)在线发布日期:2024年4月24日
    • (2023)自动FR第32届USENIX安全研讨会会议记录10.5555/3620237.3620659(7535-7552)在线发布日期:2023年8月9日
    • 显示更多引用者

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    AISec’14:2014年人工智能与安全研讨会会议记录
    2014年11月
    134页
    国际标准图书编号:9781450331531
    内政部:10.1145/2666652
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2014年11月7日

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 机器学习
    2. 网络隐私
    3. web安全

    限定符

    • 研究文章

    资金来源

    会议

    CCS’14
    赞助商:
    CCS’14:2014 ACM SIGSAC计算机和通信安全会议
    2014年11月7日
    美国亚利桑那州斯科茨代尔

    接受率

    AISec’14论文接受率24份提交文件中的12份,50%;
    231份提交文件中的总体接受率为94份,占41%

    即将召开的会议

    CCS’24
    ACM SIGSAC计算机和通信安全会议
    2024年10月14日至18日
    盐湖城,美国犹他州,美国

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载量(最近12个月)17
    • 下载次数(最近6周)2

    其他指标

    引文

    引用人

    查看全部
    • (2024)AdFlush:一种用于有效预防广告和Web跟踪器的现实世界可部署机器学习解决方案2024年ACM网络会议记录10.1145/3589334.3645698(1902-1913)在线发布日期:2024年5月13日
    • (2024)在网络层检测Web跟踪ICT系统安全和隐私保护10.1007/978-3-031-56326-3_10(131-148)在线发布日期:2024年4月24日
    • (2023)自动FR第32届USENIX安全研讨会会议记录10.5555/3620237.3620659(7535-7552)在线发布日期:2023年8月9日
    • (2023)为盲人屏幕阅读器用户检测虚假的深色网络广告成像杂志10.3390/jimaging91102399:11(239)在线发布日期:2023年11月6日
    • (2023)字里行间阅读:使用字节码分类检测跟踪JavaScript2023年ACM SIGSAC计算机和通信安全会议记录10.1145/3576915.3616637(3475-3489)在线发布日期:2023年11月15日
    • (2022)WTAGRAPH:使用图神经网络的网络跟踪和广告检测2022年IEEE安全与隐私研讨会(SP)10.1109/SP46214.2022.9833670(1540-1557)在线发布日期:2022年5月
    • (2022)广告服务检测——使用机器学习技术的比较研究2022年第13届国际计算通信与网络技术会议(ICCCNT)10.1109/ICCNT54827.2022.9984339(1-7)在线发布日期:2022年10月3日
    • (2021)用可操作的对手示例规避基于ML的Adblocker第37届计算机安全应用年会会议记录10.1145/3485832.3488008(541-553)在线发布日期:2021年12月6日
    • (2021)SugarCoat:通过编程生成隐私保护的、与Web兼容的资源替换来阻止内容2021年ACM SIGSAC计算机与通信安全会议记录10.1145/3460120.3484578(2844-2857)在线发布日期:2021年11月12日
    • (2021)Wide-AdGraph:使用宽依赖链图检测广告跟踪器2021年第13届ACM网络科学会议记录10.1145/3447535.3462549(253-261)在线发布日期:2021年6月21日
    • 显示更多引用者

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享