Deconfounding Duration Bias in Watch-time Prediction for Video Recommendation

Zhan, Ruohan; Pei, Changhua; Su, Qiang; Wen, Jianfeng; Wang, Xueliang; Mu, Guanyu; Zheng, Dong; Jiang, Peng

摘要：观看时间预测仍然是通过视频推荐增强用户参与度的关键因素。随着在线视频的日益普及，它变得越来越重要。然而，观看时间的预测不仅取决于用户和视频之间的匹配，而且经常被视频本身的持续时间所误导。为了提高观看时间，推荐总是偏向于持续时间较长的视频。基于这种不平衡数据训练的模型面临着偏见放大的风险，这会误导平台过度推荐持续时间长的视频，但忽略了潜在的用户兴趣。
本文首次研究了视频推荐中观看时间预测中的持续时间偏差。我们使用因果图来说明持续时间是一个混杂因素，同时影响视频曝光和观看时间预测——视频的第一个影响导致了偏差问题，应该消除，而观看时间的第二个影响源于视频的内在特征，应该保留。为了消除不希望出现的偏差，但利用自然效果，我们提出了一个基于持续时间去融合分位数（D2Q）的观察时间预测框架，该框架允许在工业生产系统上执行可伸缩性。通过广泛的离线评估和现场实验，我们展示了这种持续时间消除框架的有效性，显著优于最先进的基线。我们已经在快手应用程序上全面推出了我们的方法，由于更准确的观看时间预测，该应用程序大大提高了实时视频消费。

评论：	10页
学科：	信息检索（cs.IR）
引用为：	arXiv公司：2206.06003[cs.IR]
	（或 arXiv:2206.06003v1[cs.IR]对于此版本）
	https://doi.org/10.48550/arXiv.2206.06003

计算机科学>信息检索

职务：视频推荐中观看时间预测中的持续时间偏差去混

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目