跳到主要内容
10.1145/3404835.3462845acm会议文章/章节视图摘要出版物页面红外线会议记录会议集合
研究论文
开放式访问

羽毛群的档案在一起?云存储中用户感知文件相似性的度量和建模

出版:2021年7月11日出版历史

摘要

先前的工作表明,用户通过相似性的透镜来概念化数字文件个人收藏的组织。然而,目前尚不清楚在实际文件集合中,相似的文件实际上在多大程度上彼此相邻(例如,在同一目录中),或者利用文件相似性是否可以改进文件集合混乱的信息检索和组织。为此,我们进行了一项在线研究,将自动分析50个Google Drive和Dropbox用户的云帐户与调查相结合,询问这些帐户中的成对文件。我们发现,位于文件层次结构不同部分的许多文件在参与者的感知方式以及算法可提取特征方面都很相似。参与者通常希望共同管理类似的文件(例如,删除一个文件意味着删除另一个文件),即使它们在文件层次结构中相距甚远。为了进一步了解这种关系,我们建立了回归模型,发现几个算法上可提取的文件特征可以预测人类对文件相似性的感知和所需的文件共同管理。我们的发现为利用文件相似性根据用户以前与类似文件的交互自动推荐访问、移动或删除操作铺平了道路。

工具书类

  1. David Abrams、Ron Baecker和Mark Chignell。1998.带书签的信息归档:个人网络空间的构建和组织。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  2. 塔法·阿拉希德(Tarfah Alrashed)、艾哈迈德·哈桑·阿瓦达拉(Ahmed Hassan Awadallah)和苏珊·杜梅斯(Susan Dumais)。2018.电子邮件的生命周期:对电子邮件重访的大规模分析。在2018年人类信息交互与检索大会论文集上。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 塔法·阿拉舍德、李嘉中、彼得·贝利、克里斯托弗·林、米拉德·肖库希和苏珊·杜梅斯。2019.评估用户行为,作为电子邮件重要性的代理。在万维网会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  4. Bao Xinlong和Thomas G.Dietterich。2011.文件夹预测:减少访问正确文件夹的成本。ACM智能系统与技术汇刊(TIST),第2卷,第1期(2011年)。谷歌学者谷歌学者
  5. 鲍新龙(Xinlong Bao)、乔纳森·赫洛克(Jonathan L.Herlocker)和托马斯·迪特里奇(Thomas G.Dietterich)。2006.更少的点击次数和更少的挫折感:降低访问正确文件夹的成本。第11届智能用户界面国际会议论文集。谷歌学者谷歌学者
  6. 黛博拉·巴劳(Deborah Barreau)和邦妮·纳迪(Bonnie A.Nardi)。1995.查找和提醒:从桌面进行文件组织。ACM SigChi Bulletin,第27卷,第3卷(1995年),第39-43页。谷歌学者谷歌学者数字图书馆数字图书馆
  7. 黛博拉·巴雷奥(Deborah K.Barreau)。1995.个人信息管理系统中的环境因素。《美国信息科学学会杂志》,第46卷,第5卷(1995年)。谷歌学者谷歌学者交叉引用交叉引用
  8. Yael Benn、Ofer Bergman、Liv Glazer、Paris Arent、Iain D.Wilkinson、Rosemary Varley和Steve Whittaker。2015年。在数字文件夹中导航使用与真实世界导航相同的大脑结构。《科学报告》,第5卷,第1卷(2015年)。谷歌学者谷歌学者交叉引用交叉引用
  9. 詹姆斯·贝内特(James Bennett)、斯坦·兰宁(Stan Lanning)等人,2007年。网飞奖。KDD杯和研讨会会议记录。谷歌学者谷歌学者
  10. Ofer Bergman、Ruth Beyth-Marom和Rafi Nachmias。2003.个人信息管理系统的用户主体方法。《美国信息科学与技术学会杂志》,第54卷,第9卷(2003年),第872-878页。谷歌学者谷歌学者数字图书馆数字图书馆
  11. Ofer Bergman、Ruth Beyth-Marom和Rafi Nachmias。2008年a。个人信息管理系统设计的用户主体方法:证据和实施。《美国信息科学与技术学会杂志》,第59卷,第2卷(2008年),第235-246页。谷歌学者谷歌学者数字图书馆数字图书馆
  12. Ofer Bergman、Ruth Beyth-Marom、Rafi Nachmias、Noa Gradovitch和Steve Whittaker。2008年b。改进了个人信息管理中的搜索引擎和导航偏好。ACM信息系统交易,第26卷,第4卷(2008年)。谷歌学者谷歌学者数字图书馆数字图书馆
  13. Ofer Bergman、Noa Gradovitch、Judit Bar-Ilan和Ruth Beyth-Marom。2013年a。个人信息管理中的文件夹与标记首选项。《美国信息科学与技术学会杂志》,第64卷,第10卷(2013年),1995-2012年。谷歌学者谷歌学者交叉引用交叉引用
  14. Ofer Bergman、Noa Gradovitch、Judit Bar-Ilan和Ruth Beyth-Marom。2013年b月。标记个人信息:态度和行为之间的对比。第76届ASIS&T年会会议记录。谷歌学者谷歌学者交叉引用交叉引用
  15. Ofer Bergman、Maskit Tene-Rubinstein和Jonathan Shalom。2013年c。在导航和搜索中注意力资源的使用。个人与普适计算,第17卷,第3卷(2013年),583-590。谷歌学者谷歌学者数字图书馆数字图书馆
  16. Ofer Bergman、Simon Tucker、Ruth Beyth-Marom、Edward Cutrell和Steve Whittaker。2009年。这并不是那么重要:使用GrayArea降级主观重要性较低的个人信息。在SIGCHI计算机系统中的人为因素会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  17. Ofer Bergman、Steve Whittaker和Yaron Frishman。2019.让我们谈谈个人:改进云中文档检索的小小推动。《文献杂志》(2019)。谷歌学者谷歌学者
  18. Ofer Bergman、Steve Whittaker、Mark Sanderson、Rafi Nachmias和Anand Ramamoorthy。2010.文件夹结构对个人文件导航的影响。《美国信息科学与技术学会杂志》,第61卷,第12卷(2010年),第2426-2441页。谷歌学者谷歌学者数字图书馆数字图书馆
  19. Ofer Bergman、Steve Whittaker、Mark Sanderson、Rafi Nachmias和Anand Ramamoorthy。2012.我们如何查找个人文件?操作系统、表示和深度对文件导航的影响。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  20. Richard Boardman和M.Angela Sasse。2004年,资料进入电脑而没有出来:一项关于个人信息管理的跨工具研究。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  21. 理查德·博德曼(Richard Boardman)、罗伯特·斯彭斯(Robert Spence)和安吉拉·萨西(M.Angela Sasse)。2003.层次太多?每天都在努力控制工作空间。第十届人机交互国际会议论文集。谷歌学者谷歌学者
  22. Will Brackenbury、Rui Liu、Mainack Mondal、Aaron J.Elmore、Blase Ur、Kyle Chard和Michael J.Franklin。2018年,排放数据沼泽:基于相似性的方法。在人在回路数据分析研讨会上。谷歌学者谷歌学者
  23. 塞尔吉奥·卡努托(Sergio Canuto)、蒂亚戈·萨尔斯(Thiago Salles)、蒂埃森·罗莎(Thierson C.Rosa)和马科斯·冈卡·阿尔维斯(Marcos A.Goncc alves)。2019.基于相似性的合成文档表示,用于文本分类中的元特征生成。第42届国际ACM SIGIR信息检索研究与开发会议论文集。谷歌学者谷歌学者
  24. Robert Capra和M.A.Perez-Quinones。2006.再融资行为的因素和评估。第29届国际ACM SIGIR信息检索研究与开发会议论文集。谷歌学者谷歌学者
  25. 苏明·杰里米亚·陈(Sumin Jeremiah Chen)、郑琴(Zhen Qin)、扎卡里·蒂尔·威尔逊(Zachary Teal Wilson)、布莱恩·李·卡拉奇(Brian Lee Calaci)、迈克尔·理查德·罗斯(Michael Richard Rose)、瑞安·李·埃文斯(Ryan Lee Evans)、肖恩·罗伯特·。2020年,提高谷歌硬盘的推荐质量。第26届ACM SIGKDD知识发现和数据挖掘会议论文集。谷歌学者谷歌学者数字图书馆数字图书馆
  26. Paul-Alexandru Chirita、Stefania Costache、Wolfgang Nejdl和Raluca Paiu。2006年,比格犬谷歌学者谷歌学者
  27. :桌面上语义增强的搜索和排名。《欧洲语义网络会议论文集》。谷歌学者谷歌学者
  28. 安德烈亚·西万(Andrea Civan)、威廉·琼斯(William Jones)、普雷德拉格·克拉斯尼亚(Predrag Klasnja)和哈里·布鲁斯(Harry Bruce)。2008.更好地按文件夹或标签组织个人信息关键在于细节。《美国信息科学与技术学会学报》,第45卷,第1期(2008年)。谷歌学者谷歌学者交叉引用交叉引用
  29. 保罗·科文顿、杰·亚当斯和埃姆雷·萨金。2016.YouTube推荐深度神经网络。在第十届美国计算机学会推荐系统会议论文集上。谷歌学者谷歌学者数字图书馆数字图书馆
  30. Gabor Cselle、Keno Albrecht和Rogert Wattenhofer。2007.BuzzTrack:电子邮件中的主题检测和跟踪。第十二届智能用户界面国际会议论文集。谷歌学者谷歌学者数字图书馆数字图书馆
  31. 杰西·大卫·丁尼恩和查尔斯·安东尼·朱利安。2019.无处不在的数字文件:文件管理研究综述。《信息科学与技术协会杂志》(2019年)。谷歌学者谷歌学者
  32. 杰西·大卫·丁尼恩(Jesse David Dinneen)、查尔斯·安东尼·朱利安(Charles-Antoine Julien)和伊尔贾·弗里森(Ilja Frissen)。2019.个人档案收集的规模和结构。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  33. 苏珊·杜梅斯(Susan Dumais)、爱德华·卡特尔(Edward Cutrell)、乔纳森·加迪斯(Jonathan J.Cadiz)、加文·扬克(Gavin Jancke)、拉曼·萨林(Raman Sarin)和丹尼尔·罗宾斯。2003.我见过的东西:一个用于个人信息检索和重复使用的系统。第26届国际ACM SIGIR信息检索研究与开发会议论文集。谷歌学者谷歌学者
  34. 斯蒂芬·菲契特和安迪·科克伯恩。2012.Accessrank:预测用户接下来会做什么。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  35. 斯蒂芬·菲契特(Stephen Fitchett)、安迪·科克伯恩(Andy Cockburn)和卡尔·古特温(Carl Gutwin)。2014.Finder亮点:增强文件浏览器的现场评估和设计。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  36. 秦高。2011.个人信息组织标签的实证研究:绩效、工作量、记忆和一致性。《国际人机交互杂志》,第27卷,第9卷(2011年),第821-863页。谷歌学者谷歌学者交叉引用交叉引用
  37. 谷歌。2019.谷歌Vision API。https://cloud.google.com/vision/。谷歌学者谷歌学者
  38. 沙伦·哈多夫·贾菲(Sharon Hardof-Jaffe)、阿诺·赫什科维茨(Arnon Hershkovitz)、哈马·阿布·基什克(Hama Abu-Kishk)、奥弗·伯格曼(Ofer Bergman)和拉菲·纳奇米亚斯。2009年,学生个人信息空间的组织策略。《数字信息杂志》,第10卷,第5卷(2009年)。谷歌学者谷歌学者
  39. 莎拉·亨德森和阿南斯·斯里尼瓦桑。2009年,个人数字文档结构的实证分析。《人机界面研讨会论文集》。谷歌学者谷歌学者数字图书馆数字图书馆
  40. Farnaz Jahanbakhsh、Ahmed Hassan Awadallah、Susan T.Dumais和Xuhai Xu。2020年。过去与推荐文档的交互对用户体验的影响。《2020年人类信息交互和检索会议论文集》。谷歌学者谷歌学者数字图书馆数字图书馆
  41. 威廉·琼斯(William Jones)、阿米·吉拉尼达·普瓦纳图拉克(Ammy Jiranida Phuwanatnurak)、拉杰迪尔·吉尔(Rajdeep Gill)和哈里·布鲁斯(Harry Bruce)。2005.不要拿走我的文件夹!:组织个人信息以完成任务。在CHI'05计算机系统人为因素扩展摘要会议录中。谷歌学者谷歌学者数字图书馆数字图书馆
  42. Mohammad Taha Khan、Maria Hyun、Chris Kanich和Blase Ur。2018.被遗忘但没有消失:确定云存储中纵向数据管理的需求。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  43. 穆罕默德·塔哈·汗、克里斯托弗·特兰、舒巴姆·辛格、迪米特里·瓦西尔科夫、克里斯·卡尼奇、布莱斯·乌尔和埃琳娜·哲列娃。2021.帮助用户自动查找和管理云存储中的敏感、消耗性文件。第30届USENIX安全研讨会会议记录。谷歌学者谷歌学者
  44. 芭芭拉·克瓦斯尼克(Barbara H.Kwasnik)。1989.个人文件的预期用途或目的如何影响其在办公室的分类。ACM SIGIR论坛,第23卷。207--210.谷歌学者谷歌学者数字图书馆数字图书馆
  45. 芭芭拉·克瓦斯尼克(Barbara H.Kwasnik)。1991.非文件属性因素在个人文件组织中的重要性。文献期刊。(1991).谷歌学者谷歌学者
  46. 芭芭拉·克瓦斯尼克(Barbara H.Kwasnik)。1992年。分类结构在反映和构建理论中的作用。分类研究在线进展,第3卷,第1期(1992年),63-82。谷歌学者谷歌学者
  47. 马克·兰斯代尔(Mark W.Lansdale)。1988年,个人信息管理心理学。《应用人类工效学》,第19卷,第1期(1988年),第55-66页。谷歌学者谷歌学者交叉引用交叉引用
  48. 保罗·拉夫拉卡斯(Paul J.Lavrakas)。2008年,调查研究方法百科全书。Sage出版物。谷歌学者谷歌学者
  49. Bongshin Lee和Benjamin B.Bederson。2003.收藏夹:可配置、可扩展的文件浏览器。技术报告。马里兰大学。谷歌学者谷歌学者
  50. 刘婉玉(Wanyu Liu)、奥利维尔·里乌尔(Olivier Rioul)、乔安娜·麦格雷内尔(Joanna Mcgrenere)、温迪·麦凯(Wendy E.Mackay)和米歇尔·博杜安·拉丰(Michel Beaudouin-Lafon)。2018.BIG文件:快速文件检索的贝叶斯信息增益。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  51. 托马斯·马龙。1983.人们如何整理自己的桌子对办公室信息系统设计的启示。《美国计算机学会信息系统汇刊》,第1卷,第1期(1983年),第99-112页。谷歌学者谷歌学者数字图书馆数字图书馆
  52. 夏洛特·梅西(Charlotte Massey)、肖恩·滕布鲁克(Sean TenBrook)、查康·塔特姆(Chaconne Tatum)和史蒂夫·惠塔克(Steve Whittaker)。2014.个人信息管理和个性:我们的个人文件系统对我们有何评价?。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  53. 托马斯·米科洛夫(Tomas Mikolov)、伊利亚·萨茨克沃(Ilya Sutskever)、陈凯(Kai Chen)、格雷格·科拉多(Greg S.Corrado)和杰夫·迪恩(Jeff Dean)。2013.单词和短语的分布式表示及其组成。神经信息处理系统进展论文集。谷歌学者谷歌学者
  54. David R.Millen、Jonathan Feinberg和Bernard Kerr。2006年。Dogear:企业中的社交书签。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者数字图书馆数字图书馆
  55. David R.Millen、Meng Yang、Steven Whittaker和Jonathan Feinberg,2007年。社交书签和探索性搜索。第十届欧洲计算机支持的合作工作会议记录。谷歌学者谷歌学者交叉引用交叉引用
  56. Kyong Eun Oh(京恩)。2012.将文件分类到文件夹后会发生什么?《美国信息科学与技术学会学报》(2012年)。谷歌学者谷歌学者交叉引用交叉引用
  57. Kyong Eun Oh(京恩)。2017.个人信息分类类型:刚性、模糊和柔性。《信息科学与技术协会杂志》,第68卷,第6卷(2017年),1491-1504。谷歌学者谷歌学者数字图书馆数字图书馆
  58. Michael Oppermann、Robert Kincaid和Tamara Munzner。2020年。VizCommander:计算可视化存储库中基于文本的相似性,以获得基于内容的建议。arXiv:2008.07702(2020)。谷歌学者谷歌学者
  59. Soya Park、Amy X.Zhang、Luke S.Murray和David R.Karger。2019.自动化电子邮件处理的机会:一项需求研究。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  60. Eyal Peer、Laura Brandimarte、Sonam Samat和Alessandro Acquisti。2017年,《超越土耳其:众包行为研究的替代平台》。《实验社会心理学杂志》,第70卷(2017年),153-163。谷歌学者谷歌学者交叉引用交叉引用
  61. 多产。2019https://www.prolific.co/。谷歌学者谷歌学者
  62. Dennis Quan、David Huynh和David R.Karger。2003.Haystack:一个创作最终用户语义web应用程序的平台。国际语义网络会议论文集。谷歌学者谷歌学者
  63. 布拉德利·罗德斯和萨德·斯塔纳。1996年。纪念代理:一个持续运行的自动信息检索系统。技术报告。AAAI公司。谷歌学者谷歌学者
  64. 利奥·索尔曼(Leo Sauermann)、冈纳·阿斯特兰·格里姆斯(Gunnar Aastrand Grimnes)、马尔特·基塞尔(Malte Kiesel)、克里斯蒂安·弗利特(Christiaan Fluit)、海科·莫斯(Heiko Maus)、多米尼克·海姆(Dominik Heim)、丹麦·纳迪姆(Dan。2006。语义桌面2.0:gnowsis体验。国际语义网络会议论文集。谷歌学者谷歌学者数字图书馆数字图书馆
  65. 马库斯·施罗德(Markus Schröder)、克里斯蒂安·吉勒克(Christian Jilek)和安德烈亚斯·丹格尔(Andreas Dengel)。2019.个人数据的交互式概念挖掘。arXiv:1903.05872(2019)。谷歌学者谷歌学者
  66. 理查德·西格尔(Richard B.Segal)和杰弗里·科珀特(Jeffrey O.Kephart)。1999.MailCat:组织电子邮件的智能助手。第十六届全国人工智能会议记录。谷歌学者谷歌学者
  67. Debmalya Sinha和Anupam Basu。2012.Gardener:一个文件浏览器助手,帮助用户维护语义文件夹层次结构。第四届智能人机交互国际会议论文集。谷歌学者谷歌学者交叉引用交叉引用
  68. 布伦特·史密斯和格雷格·林登。2017年。亚马逊网站20年的推荐系统。IEEE互联网计算,第21卷,第3卷(2017年)。谷歌学者谷歌学者
  69. John C.Tang、Eric Wilcox、Julian A Cerruti、Hernan Badenes、Stefan Nusser和Jerald Schoudt。2008.Tag-it、snag-it或bag-it:在电子邮件中组合标记、线程和文件夹。在CHI'08计算机系统人为因素扩展摘要会议录中。谷歌学者谷歌学者数字图书馆数字图书馆
  70. Sandeep Tata、Alexandrin Popescul、Marc Najork、Mike Colagrosso、Julian Gibbons、Alan Green、Alexander Mah、Michael Smith、Divanshu Garg、Cayden Meyer等,2017年。快速访问:为谷歌硬盘打造智能体验。第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集。谷歌学者谷歌学者数字图书馆数字图书馆
  71. 詹姆·提万(Jaime Teevan)、克里斯汀·阿尔瓦拉多(Christine Alvarado)、马克·S·阿克曼(Mark S.Ackerman)和大卫·R·卡格(David R.Karger)。2004年。完美的搜索引擎是不够的:定向搜索中定向运动行为的研究。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  72. 弗朗西斯科·维塔莱(Francesco Vitale)、伊莎贝尔·詹森(Izabelle Janzen)和乔安娜·麦格雷内尔(Joanna McGreenere)。2018年。围板和极简主义:数字数据保存的趋势。在SIGCHI计算机系统人为因素会议记录中。谷歌学者谷歌学者
  73. 罗杰·惠瑟姆和莱昂·克鲁克申克。2017年。文件夹的功能和未来。《与计算机交互》,第29卷,第5卷(2017年),第629-647页。谷歌学者谷歌学者
  74. 史蒂夫·惠塔克。2011年,个人信息管理:从信息消费到策展。《信息科学与技术年鉴》,第45卷,第1期(2011年)。谷歌学者谷歌学者交叉引用交叉引用
  75. Steve Whittaker、Ofer Bergman和Paul Clough。2010年,轻松触发爸爸:一项长期家庭照片检索研究。《个人与普适计算》,第14卷,第1期(2010年),第31-43页。谷歌学者谷歌学者数字图书馆数字图书馆
  76. 史蒂夫·惠塔克和夏洛特·梅西。2020年。情绪和个人信息管理:我们的感受会影响我们组织信息的方式。个人与普适计算,第24卷,第1期(2020年),695-707。谷歌学者谷歌学者数字图书馆数字图书馆
  77. 胡忠武、罗伯特·荣蓬禄、王锦辉和桂林郭。2008年。将TF-IDF术语权重解释为做出相关性决策。《ACM信息系统汇刊》,第26卷,第3期(2008年)。谷歌学者谷歌学者数字图书馆数字图书馆
  78. 徐海旭(Xuhai Xu)、艾哈迈德·哈桑·阿瓦达拉(Ahmed Hassan Awadallah)、苏珊·杜梅斯(Susan T.Dumais)、法亨·奥马尔(Farheen Omar)、波格丹·波普(Bogdan Popp)、罗伯特·鲁恩思韦(Robert Rounth。2020年。了解文档推荐的用户行为。在《网络会议记录》中。谷歌学者谷歌学者数字图书馆数字图书馆
  79. 郑冠杰、张福正、郑紫涵、杨翔、尼古拉斯·靖远、谢兴和李振辉,2018年。DRN:新闻推荐的深度强化学习框架。2018年万维网会议记录。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 羽毛群的档案在一起?云存储中用户感知文件相似性的度量和建模

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      封面图片ACM会议
      SIGIR’21:第44届国际ACM SIGIR信息检索研究与开发会议记录
      2021年7月
      2998页
      国际标准图书编号:9781450380379
      内政部:10.1145/3404835

      版权所有©2021所有者/作者

      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的部分或全部数字或硬拷贝以供个人或课堂使用。必须尊重本作品第三方组件的版权。对于所有其他用途,请联系所有者/作者。

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2021年7月11日

      检查更新

      限定符

      • 研究论文

      接受率

      总体验收率792属于3,983提交文件,20%

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器