RCV1型

RCV1:文本分类研究的一个新的基准集合。路透社语料库第一卷(RCV1)是一个超过80万手动分类的新闻热线故事的档案,最近由路透社有限公司提供用于研究目的。将这些数据用于文本分类的研究需要详细了解数据产生时的实际约束条件。通过对路透社人员的采访和对路透社文件的访问,我们描述了在产生RCV1数据时使用的编码策略和质量控制程序,层次分类法的预期语义,以及删除错误数据所需的更正。我们将原始数据称为RCV1-v1,校正后的数据称为RCV1-v2。我们在RCV1-v2上对几种广泛使用的监督学习方法进行了基准测试,说明了集合的性质,提出了新的研究方向,并为将来的研究提供了基线结果。我们提供了详细的,每个类别的实验结果,以及更正版本的类别分配和分类结构,通过在线附录。

这个软件也是同行评审按日记帐汤姆斯.


zbMATH参考文献(参考 104篇文章 参考)

显示104个结果中的1到20个。
按年份排序(引用)
  1. Yousefian,Farzad;Nedić,Angelia;Shanbhag,Uday V.:非强凸优化的随机和确定性拟牛顿方法:渐近收敛和速率分析(2020)
  2. Duchi,John;Namkoung,Hongseok:基于方差的凸目标正则化(2019)
  3. Fercoq,Olivier;Bianchi,Pascal:具有大步长和可能不可分离函数的坐标下降原对偶算法(2019)
  4. Karakus,Can;Sun,Yifan;Diggavi,Suhas;Yin,Wotao:分布式优化和学习中用于减少离散器的冗余技术(2019)
  5. Krishnamurthy,Akshay;Agarwal,Alekh;Huang,Zi Kuo;Iii,Hal Daumé;Langford,John:成本敏感分类的主动学习(2019年)
  6. Andre Milzarek;Xiao,Xiantao;Cen,Shicong;Wen,Zaiwen;Ulbrich,Michael:非光滑非凸优化的随机半光滑牛顿法(2019)
  7. 宋阳秋;乌帕德海伊,石亚姆;彭浩若;马休,斯蒂芬;罗斯,丹:走向任何语言的零镜头文本文献主题分类(2019)
  8. Bashar,医学博士Abul;Li,Yuefeng:文本模式解读(2018)
  9. Bottou,Léon;Curtis,Frank E.;Nocedal,Jorge:大规模机器学习的优化方法(2018)
  10. Sophie Burkhardt;Kramer,Stefan:文本分类的在线多标签依赖主题模型(2018)
  11. Elenberg,Ethan R.;Khanna,Rajiv;Dimakis,Alexandros G.;Negahban,Sahand:受限强凸性意味着弱子模块性(2018)
  12. Francisco Charte,Antonio J.Rivera,David Charte,María J.del Jesus,Francisco Herrera:管理多标签数据集的提示、指南和工具:mldr.datasets R包和Cometa数据存储库(2018)阿尔十四
  13. Gudivada,Venkat N.;Arbabifard,Kamyar:NLP的开源库、应用程序框架和工作流系统(2018)
  14. Leblond,Rémi;Pedregosa,Fabian;Lacoste Julien,Simon:用于随机增量方法的改进异步并行优化分析(2018)
  15. Lin,Qihang;Nadarajah,Selvaprabu;Soheili,Negar:具有可行解路径的凸优化的水平集方法(2018)
  16. Sakai,Tomoya;Niu,Gang;Sugiyama,Masashi:基于正向无标记学习的半监督AUC优化(2018)
  17. 基于异质相似性的度量方法:张浩明,杨浩光,非同质性测度网络;张浩明,张嘉明;非同质性测度网络
  18. 袁晓彤;李萍;张彤彤:梯度硬阈值追求(2018)
  19. 岳汉瑞;杨清志;王向峰;袁晓明:实现大数据集乘数交替方向法:最小绝对收缩和选择算子的案例研究(2018)
  20. Andrea Esuli,Tiziano Fagni,Alejandro Moreo Fernandez:JaTeCS开源JAva文本分类系统(2017)阿尔十四