跳转到主要内容
认证机构:IGI全球平台(112.34.110.148)
登录
注册
语言:
英语
欢迎使用InfoCi平台
IGI全球平台
IGI全球平台
无法进行身份验证。
IP:112.34.110.148
数据库搜索
数据库搜索
基本搜索
高级搜索
专家搜索
保存的搜索
索策略
研究工具
研究工具
帮助
用户指南
咨询委员会
用户资源
用户资源
针对研究人员
对于作者
对于图书馆员
参考中心
三
指数
该标题如下所示:
关闭
参考中心
该研究被引用于:
第条
基于变换的阿拉伯经典文本作者归属方法
应用科学
10.3390/app13127255
第条
Nahj Al-Balagha的作者验证
人文数字奖学金
10.1093/llc/fqab103
第条
文本挖掘中的作者归属研究综述
WIRE计算统计
10.1002/wics.1584
关闭
最近搜索的热门结果
关闭
基于合成少数民族过采样技术的阿拉伯文作者归属及不平衡文献的主成分分析
哈西娜·哈贾德(Hassina Hadjadj)、哈利姆·萨尤德(Halim Sayoud)
源标题:
国际认知信息学与自然智能杂志(IJCINI)
15(4)
版权:
© 2021
|
体积:
15
|
问题:
4
|
页:
17
国际标准编号:
1557-3958
|
EISSN公司:
1557-3966
|
EISBN13:
9781799859857
|
内政部:
10.4018/IJCINI.20211001.oa33
引用文章
引用文章
MLA公司
哈贾德、哈西纳和哈利姆·萨尤德。
“使用合成少数过度抽样技术和不平衡文献的主成分分析的阿拉伯语作者归因。”
IJCINI公司
第15卷,2021年第4期:第1-17页。
http://doi.org/10.4018/IJCINI.20211001.oa33
亚太地区
Hadjadj,H.和Sayoud,H.(2021)。
使用合成少数民族过采样技术和不平衡文档主成分分析的阿拉伯语作者归属。
国际认知信息学与自然智能杂志(IJCINI),15
(4), 1-17.
http://doi.org/10.4018/IJCINI.20211001.oa33
芝加哥
哈贾德、哈西纳和哈利姆·萨尤德。
“使用合成少数民族过采样技术和不平衡文档的主成分分析进行阿拉伯语作者归属”
国际认知信息学与自然智能杂志(IJCINI)
15,4号:1-17。
http://doi.org/10.4018/IJCINI.20211001.oa33
导出参考
最喜欢的
完整发布下载
查看全文HTML
查看全文PDF
摘要
如今,处理不平衡数据在数据挖掘和机器学习任务中都是一个巨大的挑战。
在本次调查中,我们对作者归因(AA)任务中的类别不平衡问题感兴趣,并对阿拉伯语文本数据进行了具体应用。
本文提出了一种基于主成分分析(PCA)和合成少数过采样技术(SMOTE)的混合方法,大大提高了非平衡数据的作者归属性能。
使用的数据集包含7位不同学者编写的7本阿拉伯语书籍,这些书籍被分割成相同大小的文本段,平均每篇文本长度为2900个单词。
实验结果表明,本文提出的基于SMO-SVM分类器的方法在作者归属准确率(100%)方面表现出很高的性能,尤其是在起始字符图方面。
此外,通过改善不平衡数据集(主要是功能词)中的AA性能,该方法显得非常有趣。
如果出现与翻译网站中包含的信息的准确性有关的任何问题,
请参阅网站的英文版本,即官方版本。
访问
www.igi-global.com/gateway/terms-and-conditions网站/
了解更多信息。