RCV1

RCV1:一种用于文本分类研究的新的基准集合。路透社语料库第一卷(RCV1)是一个存档的超过800000手动分类新闻稿最近由路透社有限公司提供的研究目的。使用这些数据进行文本分类的研究需要详细地了解现实世界的约束下产生的数据。在与路透社人员的访谈和路透社文档的访问中,我们描述了用于产生RCV1数据的编码策略和质量控制程序、分层分类分类的预期语义以及消除错误数据所必需的校正。我们将原始数据称为RCV1-V1,并将校正后的数据作为RCV1-V2。我们在RCV1-V2上对几种广泛使用的监督学习方法进行了评估,说明了集合的性质,提出了新的研究方向,并为将来的研究提供了基线结果。通过在线附录,我们提供了详细的、每类实验结果以及分类赋值和分类结构的校正版本。

这个软件也是同行评审通过期刊toms.


ZBMaCT中的参考文献(99篇文章中引用)

显示结果1至20的99。
按年份排序(引文
  1. Fercoq,奥利维尔;比安奇,Pascal:一个具有大步长和可能不可分函数的坐标下降原始对偶算法(2019)
  2. Milzarek,安德烈;肖,仙桃市;岑,Shicong;文,Zaiwen;Ulbrich,米迦勒:非光滑非凸优化的随机半光滑牛顿法(2019)
  3. 宋,Yangqiu;奥巴迪,Shyam;彭,Haoruo;Mayhew,史蒂芬;罗斯,丹:走向任何语言零镜头主题分类文本文献(2019)
  4. 巴沙尔,李,Yuefeng:文本模式解读(2018)
  5. 柯蒂斯、Frank E.、诺赛德、豪尔赫:大规模机器学习的优化方法(2018)
  6. 布哈特,索菲;克莱默,斯特凡:文本分类的在线多标签依赖主题模型(2018)
  7. Elenberg,Ethon R.;Khanna,拉吉夫;迪马基斯,Alexandros G.;NeGHBAN,SAHORD:限制强凸性表示弱亚模(2018)
  8. Francisco Charte,Antonio J. Rivera,David Charte,Mayia J. del Jesus,小·弗朗西斯科·埃雷拉:管理多标签数据集的技巧、指南和工具:MLDR.DATETS R包和COMETA数据仓库(2018)阿西夫
  9. Gudivada,Venkat N.;阿巴巴菲德,KAMAAR:NLP的开源库、应用框架和工作流系统(2018)
  10. 勒布隆,ReMI;Pedregosa,Fabian;Lacoste Julien,西蒙:改进的随机增量方法的异步并行优化分析(2018)
  11. 林,Qihang;Nadarajah,Selvaprabu;Soheili,NeGAR:一个具有可行解路径的凸优化的水平集方法(2018)
  12. H,三上智也;牛,岗;苏吉亚玛,Masashi:基于正无标记学习的半监督AUC优化(2018)
  13. 王,Chenguang;宋,Yangqiu;李,颢然;张,明;韩,Jiawei:基于异构信息网络的文本相似度无监督元路径选择(2018)
  14. 袁,萧通;李,平;张,佟:梯度硬阈值追踪(2018)
  15. 岳,韩瑞;杨,青芝;王,Xiangfeng;袁,萧明:实现大数据集乘子的交替方向法:最小绝对收缩和选择算子的实例(2018)
  16. Andrea Esuli、Tiziano Fagni、Alejandro Moreo Fernandez:JATECs开源Java文本分类系统(2017)阿西夫
  17. 杜,润东;轰埠,达村;德雷克,巴里;Park,Haunun:DC-NMF:基于分治的非负矩阵分解快速聚类和主题建模(2017)
  18. Jalali,阿明;Fazel,Maryam;萧,林:Variational Gram函数:凸分析与优化(2017)
  19. 躁狂症,霍里亚;潘,Xinghao;Papailiopoulos,Dimitris;雷切特,本杰明;Ramchandran,Kannan;约旦,Michael I.:异步随机优化的扰动迭代分析(2017)
  20. 施密特,马克;Le Roux,尼古拉斯;巴赫,弗兰西斯:用随机平均梯度最小化有限和(2017)