×

用支持向量机进行文本分类。如何在输入空间中表示文本? (英语) Zbl 0998.68112

摘要:核函数的选择是支持向量机应用的关键。然而在本文中,我们发现在文本分类的情况下,词频变换对支持向量机性能的影响比核本身更大。我们讨论了重要性权重(如文档频率和冗余度)的作用,根据模型的复杂性和计算成本,我们还没有完全理解这一点,并且我们表明,即使在对像德语这样的高度屈折的语言进行分类时,也可以避免耗时的柠檬化或词干。

理学硕士:

68T05型 人工智能中的学习与自适应系统
PDF格式 BibTeX公司 XML 引用
全文: 内政部