计算机科学>信息检索
职务: 视频推荐中观看时间预测中的持续时间偏差去混
摘要: 观看时间预测仍然是通过视频推荐增强用户参与度的关键因素。 随着在线视频的日益普及,它变得越来越重要。 然而,观看时间的预测不仅取决于用户和视频之间的匹配,而且经常被视频本身的持续时间所误导。 为了提高观看时间,推荐总是偏向于持续时间较长的视频。 基于这种不平衡数据训练的模型面临着偏见放大的风险,这会误导平台过度推荐持续时间长的视频,但忽略了潜在的用户兴趣。 本文首次研究了视频推荐中观看时间预测中的持续时间偏差。 我们使用因果图来说明持续时间是一个混杂因素,同时影响视频曝光和观看时间预测——视频的第一个影响导致了偏差问题,应该消除,而观看时间的第二个影响源于视频的内在特征,应该保留。 为了消除不希望出现的偏差,但利用自然效果,我们提出了一个基于持续时间去融合分位数(D2Q)的观察时间预测框架,该框架允许在工业生产系统上执行可伸缩性。 通过广泛的离线评估和现场实验,我们展示了这种持续时间消除框架的有效性,显著优于最先进的基线。 我们已经在快手应用程序上全面推出了我们的方法,由于更准确的观看时间预测,该应用程序大大提高了实时视频消费。