跳到主要内容
10.1145/1858378.1858391交流会议文章/章节视图摘要出版物页面a2cwic公司会议记录会议集合
研究文章

基于F评分特征选择的II型糖尿病数据库混合预测模型

出版:2010年9月16日 出版历史

摘要

医学数据是多维的,由大量的特征表示。这些高维数据库中的数百个独立特征(参数)需要同时考虑和分析,以便在医学预测中获得有价值的决策信息。大多数数据挖掘方法依赖于定义学习算法行为的一组特征,并直接或间接影响结果模型的复杂性。因此,为了提高高维数据挖掘任务的效率和准确性,必须使用有效的降维方法对数据进行预处理。本研究的目的是通过选择Pima印第安人糖尿病数据集的信息特征来提高糖尿病的诊断准确性。本研究提出了一种混合预测模型和F-score特征选择方法,以确定Pima Indians Diabetes数据集的最佳特征子集。利用F评分对糖尿病数据集的特征进行排序,聚类误差最小的特征子集是数据集的最佳特征子集。正确分类的实例确定了诊断模式,并用于进一步的分类过程。从分类器的准确度、灵敏度、特异性和曲线下面积(AUC)等方面衡量,支持向量机分类器的性能得到了改进,证明了所提出的特征方法确实提高了分类性能。该预测模型的预测准确度为98.9427,与文献中针对该问题的其他模型相比,它是对糖尿病数据集的最高预测准确度。

工具书类

[1]
}}Hammer、P.L.和;Bonates,T.O.(2006)。数据的逻辑分析——综述:从组合优化到医学应用。运筹学年鉴,148203-225
[2]
}}Saastamoinen,K.,&;Ketola,J.(2006)。基于逻辑相似性度量的医学数据分类。2006年IEEE控制论和智能系统会议记录(第1-5页)。
[3]
}}Tsirogiannis,G.、Frossyniotis,D.、Stoitsis,J.、Golemati,S.、Stafylopatis,A.和;Nikita,K.(2004)。使用稳健的多级组合方案对医疗数据进行分类。2004年IEEE神经网络国际联合会议论文集(第3卷,第25-29页)。
[4]
}}Gan,D.(2003)。糖尿病地图集,布鲁塞尔:国际糖尿病联合会(第二版)。http://www.ematlas.idf.org/webdata/docs/Atlas%202003-总结.pdf
[5]
}}Acharya,U.R.,Tan,P.H.,Subramanian,T.等人(2008年)。使用足迹描记器上的小波变换462 Q7自动识别461名患有或不患有神经病变的2型糖尿病患者。《医疗系统杂志》,32(1),21-29。
[6]
}}D.A.Bell,H.Wang,2004年。关联形式及其在特征子集选择中的应用,机器学习41,175--195。
[7]
}}Yang J和Honavar V,2001年。基于遗传算法的特征子集选择。在特征提取、构造和选择中:数据挖掘的观点。117-1361998年,第二次印刷。
[8]
}}Liu,H.和;Motoda,H.(1998)。用于知识发现和数据挖掘的特征选择。Kluwer学术出版社。
[9]
}}Pena,J.M.、Lozano,J.A.、Larranaga,P.和;Inza,I.(2001)。条件高斯网络无监督学习中的降维。IEEE模式分析和机器智能汇刊,23(6),590--603。
[10]
}}Yu,L.和;刘华(2003)。高维数据的特征选择:基于快速相关性的过滤解决方案。第20届机器学习国际会议论文集(第856-863页)。
[11]
}}塞班,M.,&;Nock,R.(2002)。一种基于信息论的特征选择的混合过滤/包装方法。模式识别,35(4),835--846。
[12]
}}Liu H和Yu L,1997年。数据挖掘的特征选择。智能数据分析1(3),131--156。
[13]
}}Kononenko I,Bratko I,Kukar M,1998年。机器学习在医学诊断中的应用。R.S.Michalski、I.Bratko和M.Kubat(编辑),《机器学习和数据挖掘:方法和应用:John Wiley&儿子,389-408。
[14]
}}亚松森A和纽曼D J,2007年。UCI机器学习{知识库{网址:http://www.ics.uci.edu/~mlearn/MLRepository.html}加州大学欧文分校。
[15]
}}邓,D.,&;Kasabov,N.(2001年)。通过演化自组织映射进行在线模式分析。第五届人工神经网络和专家系统(ANNES)半年期会议记录(第46-51页)。
[16]
}}Hoshi,K.、Kawakami,J.、Kumagai,M.等人(2005年)。贝叶斯型和SOM型神经网络用于甲状腺功能诊断的分析。《化学与制药公报》,第53期,第1570--1574页。
[17]
}}Kayaer,K.,&;Yildirim,T.(2003年)。使用一般回归神经网络对Pima Indian糖尿病进行医学诊断。《人工神经网络和神经信息处理国际会议论文集》(ICANN/ICONIP)(第181-184页)。
[18]
}}Polat,K.、Gunes,S.和;Aslan,A.(2008)。糖尿病分类的级联学习系统:广义判别分析和最小二乘支持向量机。应用专家系统,34(1),214--221。
[19]
}}Patil,B.M.等人(2010年)。2型糖尿病患者的混合预测模型。带应用程序的专家系统。
[20]
}}Pyle D,1999年。数据挖掘的数据准备:摩根考夫曼出版社。
[21]
}}陈永伟,林春杰,2005。将SVM与各种特征选择策略相结合。网址:www.csie.ntu.edu.tw/~cjlin/papers/features.pdf。
[22]
}}郭军,G.,潮渠,M.,&;W.Jianhong(2007)。数据聚类理论算法与应用(第1版)。ASA-SIAM公司。
[23]
}}威滕,H.I.,&Frank,E.(2005)。数据挖掘:实用机器学习工具和技术(第二版)。摩根考夫曼出版社。
[24]
}}徐春伟,林春杰,2002。支持向量机的一种简单分解方法。机器学习46(1-3),219--314。
[25]
}}黄成龙,廖鸿昌b,陈慕晨c,2008。乳腺癌诊断中使用支持向量机的预测模型构建和特征选择,应用专家系统,578-587
[26]
}}Delen,D.、Walker,G.和;Kadam,A.(2005)。预测乳腺癌生存率:三种数据挖掘方法的比较。医学中的人工智能,34472 113-127。

引用人

查看全部
  • (2024)预处理技术对机器学习检测糖尿病的影响2024年智能、安全和智能计算发展国际会议(ASSIC)10.1109/ASSIC60049.2024.10508016标准(1-4)在线发布日期:2024年1月27日
  • (2024)基于混合深度学习模型和神经模糊推理系统的冠心病框架早期检测与预防IEEE接入10.1109/通道2024.336653712(26683-26695)在线发布日期:2024年
  • (2024)使用机器学习技术识别阿根廷糖尿病高危人群的首次经验计算机科学–CACIC 202310.1007/978-3-031-62245-8_16(227-239)在线发布日期:2024年6月23日
  • 显示更多引用人

建议

评论

信息和贡献者

问询处

发布于

封面图片ACM其他会议
A2CWiC’10:印度第一届Amrita ACM-W女性计算机庆典论文集
2010年9月
425页
国际标准图书编号:9781450301947
内政部:10.1145/1858378
如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

出版商

计算机协会

美国纽约州纽约市

出版历史

出版:2010年9月16日

权限

请求对此文章的权限。

检查更新

作者标记

  1. AUC公司
  2. F分数
  3. Pima印第安人糖尿病数据集
  4. 支持向量机
  5. 精度灵敏度
  6. 数据挖掘
  7. 降维
  8. 特征选择
  9. 医疗数据
  10. 特异性

限定符

  • 研究文章

会议

A2CWiC‘10
A2CWiC’10:计算新兴趋势
2010年9月16日至17日
印度哥印拜陀

贡献者

其他指标

文献计量学和引文

文献计量学

文章指标

  • 下载次数(过去12个月)16
  • 下载次数(最近6周)
反映截至2024年9月21日的下载量

其他指标

引文

引用人

查看全部
  • (2024)预处理技术对机器学习检测糖尿病的影响2024年智能、安全和智能计算发展国际会议(ASSIC)10.1109/ASSIC60049.2024.10508016标准(1-4)在线发布日期:2024年1月27日
  • (2024)基于混合深度学习模型和神经模糊推理系统的冠心病框架早期检测与预防IEEE接入10.1109/通道2024.336653712(26683-26695)在线发布日期:2024年
  • (2024)使用机器学习技术识别阿根廷糖尿病高危人群的首次经验计算机科学–CACIC 202310.1007/978-3-031-62245-8_16(227-239)在线发布日期:2024年6月23日
  • (2023)机器学习方法检测早期糖尿病的比较研究2023年网络和先进系统国际会议(ICNAS)10.1109/ICNAS59892.2023.10330477(1-6)在线发布日期:2023年10月21日
  • (2022)一些慢性病的计算机诊断:过去二十年的医学历程工程计算方法档案2007年10月17日/11831-022-09776-x29:7(5525-5567)在线发布日期:2022年6月15日
  • (2022)遗传算法和基于朴素贝叶斯(GANB)的糖尿病预测系统微电子、通信系统、机器学习和物联网10.1007/978-981-19-1906-0_47(561-572)在线发布日期:2022年7月12日
  • (2020)一种新的慢性病混合分类方法国际医疗信息系统与信息学杂志10.4018/IJHISI.202001010115:1(1-19)在线发布日期:2020年1月
  • (2020)Pima印第安人糖尿病数据集预测方法的比较计算视觉与生物灵感计算10.1007/978-3-030-37218-7_83(735-750)在线发布日期:2020年1月7日
  • (2018)数据挖掘驱动的糖尿病诊断模型综述印度科学技术杂志10.17485/ijst/2018/v11i42/3266511:42(1-9)在线发布日期:2018年11月1日
  • (2018)糖尿病诊断模糊专家系统的开发2018年智能系统设计和应用计算方法国际会议(ICASSDA)10.1109/ICASSDA.2018.8477635(1-8)在线发布日期:2018年8月
  • 显示更多引用人

视图选项

获取访问权限

登录选项

完全访问权限

查看选项

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用联机查看电子阅读器.

电子阅读器

媒体

数字

其他

桌子

分享

分享

共享此出版物链接

在社交媒体上分享