v(v)安大略省:vMF公司基于最优运输的半监督神经网络主题建模

徐伟杰,姜晓宇(Xiaoyu Jiang),Srinivasan Sengamedu Hanumantha Rao公司,弗朗西斯·伊纳奇,赵金进(Jinjin Zhao)


摘要
最近,受变分自编码器启发,神经主题模型(NTM)吸引了许多研究兴趣;然而,由于难以融入人类知识,这些方法在现实世界中的应用受到了限制。本文提出了一种半监督神经主题建模方法vONTSS,该方法使用基于von Mises-Fisher(vMF)的变分自编码器和最优传输。当为每个主题提供几个关键字时,半监督设置中的vONTSS会生成潜在主题,并优化主题关键字质量和主题分类。实验表明,vONTSS在分类精度和多样性方面优于现有的半监督主题建模方法。vONTSS还支持无监督主题建模。定量和定性实验表明,在无监督环境下,vONTSS在多个方面优于最近的NTM:vONTSS在基准数据集上发现高度聚集和连贯的主题。它也比最新的弱监督文本分类方法快得多,同时实现了类似的分类性能。我们进一步证明了最优输运损失和交叉熵损失在全局最小值处的等价性。
选集ID:
2023.结果-acl.271
体积:
计算语言学协会的研究结果:ACL 2023
月份:
七月
年份:
2023
地址:
加拿大多伦多
编辑:
安娜·罗杰斯,乔丹·博伊德·格雷伯,冈崎直(Naoaki Okazaki)
地点:
调查结果
SIG公司:
出版商:
计算语言学协会
注:
页:
4433–4457
语言:
网址:
https://aclantology.org/2023.findings-acl.271
内政部:
10.18653/v1/2023.查找-acl.271
双钥匙:
引用(ACL):
徐伟杰(Weijie Xu)、蒋晓宇(Xiaoyu Jiang)、斯里尼瓦桑·森加梅杜·哈努曼塔·拉奥(Srinivasan Sengamedu Hanumantha Rao)、弗朗西斯·伊安纳奇(Francis Iannacci)和赵金进(Jinjin Zha。2023vONTSS:基于vMF的最优传输半监督神经主题建模.英寸计算语言学协会的研究结果:ACL 2023,第4433–4457页,加拿大多伦多。计算语言学协会。
引用(非正式):
vONTSS:基于vMF的最优传输半监督神经主题建模(Xu等人,发现2023)
复制引文:
PDF格式:
https://aclantology.org/2023.findings-acl.271.pdf