基于三模深信念网络的联合表示模型及其在查询和问题匹配中的应用

南江
Wenge RONG公司
彭宝林
倪一凡
张雄

出版物
信息和系统的IEICE交易  第卷。E99-D型  不。4   第页。927-935
出版日期:2016/04/01
公开:2016/01/14
在线ISSN:1745-1361
内政部:10.1587/传输.2015DAP0009
手稿类型:专题论文(数据工程和信息管理专题)
类别:
关键词:
cQA(质量保证),  深度信念网络,  联合代表,  三模式深度信念网络,  

全文:PDF格式(731.3 KB)>>
购买此文章



总结:
社区问答(cQA)的主要研究任务之一是为给定的新查询找到最相关的问题,从而为用户提供有用的知识。简单的方法是利用文本特征或bagof-words(BoW)表示,在查询和问题之间执行匹配过程。然而,这些方法存在词汇缺口问题,这意味着,如果词汇匹配失败,则无法对语义进行建模。此外,潜在语义模型,如潜在语义分析(LSA),试图通过低维表示将查询映射到相应的语义相似问题。但遗憾的是,LSA是一个浅层线性模型,无法对cQA中的高度非线性相关性进行建模。此外,BoW和面向语义的解决方案都使用单个字典来表示同一特征空间中的查询、问题和答案。然而,正如我们从数据中观察到的那样,它们之间的相关性意味着它们位于完全不同的特征空间中。根据这些观察结果,本文提出了一种三模式深度信念网络(tri-DBN),以提取查询、问题和答案的统一表示,并假设它们位于三个不同的特征空间。此外,我们将模型提取的统一表示与使用Yahoo!回答对数据集的查询。最后,实验结果表明,该模型能够捕获查询、问题和答案内部和之间的语义。此外,结果还表明,通过该方法提取的联合表示可以提高cQA文档搜索的性能。


开放存取发布