摘要

本研究提出了识别系统的设计,该系统将区分健康人和帕金森氏病患者。利用模糊系统和神经网络的融合对帕金森病进行诊断。给出了所提出的模糊神经系统(FNS)的结构和学习算法。本文描述的方法可以增强所设计系统的能力并有效区分健康个体。通过使用UCI机器学习库中获得的数据对系统进行仿真,证明了这一点。进行了对比研究,仿真结果表明,所提出的模糊神经系统提高了所设计系统的识别率。

1.简介

在世界上,许多人患有帕金森氏病(PD)。这种疾病在60岁以后更常见[1]. 帕金森氏病是一种慢性中枢神经系统疾病,导致大脑神经细胞死亡。帕金森氏病是一种渐进性疾病,预计患此病的人数还会增加。这种疾病通常发生较慢,并且持续很长一段时间。

PD的症状持续并随着时间的推移而恶化。帕金森病的基本症状是运动相关症状。这些症状包括颤抖、四肢和躯干僵硬或僵硬、运动迟缓或缓慢,以及平衡或行走问题[2,]. 颤抖是一种基本症状,可能影响腿部、手臂、手、下颌或面部的颤抖。随着这些症状变得更加明显,患者可能会在说话、行走或完成其他简单任务方面遇到困难。其他症状与行为问题、抑郁、思考、睡眠和情绪问题有关。帕金森氏症患者可能在说话、吞咽和咀嚼方面有困难。尤其是在疾病的晚期,非运动特征,如痴呆和自主功能障碍,经常发生。为了控制症状,诊断和及时治疗非常重要。诊断基于患者的神经系统检查和病史。这种疾病的早期诊断很困难[]. PD的诊断取决于是否存在上述两种或两种以上症状。

包括嗓音受损在内的嗓音症状(发音困难)以及正常发音的问题(构音障碍)对PD的诊断很重要[4]. 研究论文[5]表明PD最重要的症状是发音困难。发音困难是声音的障碍。典型的吞咽困难症状包括响度降低、粗糙度降低、呼吸困难、谐波频谱较高部分能量降低和声带震颤加剧。帕金森氏病患者很难治疗这些症状。在[46]研究表明,大约90%的帕金森氏病患者有发音困难。吞咽困难包括嗓音的任何病理或功能问题[6]. 声音听起来嘶哑、紧张或费力。帕金森病患者的嗓音可能很难理解。帕金森病(PD)的诊断方法基本上是基于一般嗓音障碍的语音测量[4,79].

专业医生需要对许多因素进行分析,以准确诊断PD。通常,所做的决定是基于对患者当前测试结果的评估。如果专家想要评估的属性数量太多,问题就变得太难了。最近,为了提高PD诊断的准确性,人们开发了各种计算工具。这些工具为医生和医学专家做出有关患者的决策提供了极好的帮助。不同的人工智能(AI)技术、专家系统和决策系统被设计用于疾病的诊断或分类。它们是专家/医生潜在的良好支持工具。在医学诊断中开发高效的识别系统变得越来越重要。目前,各种人工智能技术,如专家系统、模糊系统和神经网络,正积极应用于利用语音信号诊断帕金森病。参考[4]介绍了一种新的发声障碍测量方法,音高周期熵(PPE),它对包括噪声环境在内的许多不可控的混杂效应具有鲁棒性,并将健康人与PD患者分开。非线性动力系统理论[4,10]和统计学习理论,例如线性鉴别分析(LDA)和支持向量机(SVM)[5,11],优选用于健康人或PD患者的分类,并基于发音困难的测量来区分健康人。不同的技术,如SVM[12],带RBF(径向基函数)核的SVM[13]、带有多层感知器(MLP)的SVM和径向基函数网络(RBFN)[14],用于诊断PD。In[15]Kohonen自组织映射(KSOM)和最小二乘支持向量机(LS-SVM)的集成,以及[,16]应用非线性时间序列分析工具对局部放电进行诊断。参考文献[17]使用模糊c均值算法[18]使用四种独立的分类模式、神经网络、DMneural、回归和决策树进行分类,并进行了比较研究。

使用上述方法是为了提高PD的分类精度。分类系统可以帮助提高诊断的准确性和可靠性,最大限度地减少可能的错误,并使诊断更具时间效率。知识发现的成功取决于探索不同类别的特定数据并应用适当方法提取主要特征的能力。本文研究了模糊系统和神经网络的融合在局部放电识别系统设计中的应用。

模糊系统可以处理与知识库中的信息或数据相关的不确定性[19]并被广泛用于解决不同的现实世界问题。模糊系统使用特定于过程混沌动力学的数据和知识,提高系统的性能。在文献中,提出了不同的神经和模糊结构来解决各种问题[2026]. 在[22,23]将聚类算法和梯度下降算法应用于多输入单输出模糊神经网络的设计。采用众所周知的ANFIS(自适应神经模糊推理系统)结构解决宫颈癌识别问题[27],用于优化冷却器负载[28],用于区分ESES(癫痫持续状态)和正常EEG(脑电图)信号[29]. 多个ANFIS结构的使用[27],导致网络参数数量增加。在这些论文中,使用的系统是专门设计的,大多数基本上基于Mamdani类型规则。这些系统的性能是通过测量分类率来确定的。为了提高分类系统的性能,本文提出了一种基于TSK规则的多输入多输出模糊神经系统(FNS)用于PD的识别。

论文组织如下。章节2描述了用于PD识别的模糊神经系统的结构。第节介绍了所提出系统的参数更新规则.截面4描述了仿真结果。结论见第节5.

2.基于FNS的识别

模糊神经系统将神经网络的学习能力与模糊推理系统的语言规则解释相结合。FNS的设计包括开发具有if-then形式的模糊规则。这可以通过神经网络的训练能力对分类系统的模糊if-thens规则的前提和后继部分进行优化定义来实现。模糊系统中使用的两种基本类型的if-then规则是Mamdani和Takagi-Sugeno-Kang(TSK)类型的模糊规则。第一种类型由规则组成,其前因和后因部分使用模糊值。第二种方法使用具有模糊前因和清晰后因部分的模糊规则。本文使用TSK型模糊规则进行系统设计。第二类模糊系统用线性系统近似非线性系统,其形式如下:哪里分别是系统的输入和输出信号,是输入信号的数量,以及是规则数。是输入模糊集;是系数。

用于PD分类的模糊神经网络的结构基于TSK型模糊规则,如图所示1FNS包括六层。在第一层,分配输入信号。第二层包括成员函数。这里每个节点对应一个语言术语。这里,对于每个进入系统的输入信号,计算输入值属于模糊集的隶属度。高斯隶属度函数用于描述语言术语:哪里    分别是高斯隶属函数的中心和宽度,以及是的成员函数第个输入变量第个学期。

第三层是规则层。这里的节点数等于规则数。在这里表示规则。该层的输出信号使用t-范数最小(AND)运算进行计算:其中∏是最小操作。

这些信号是第五层的输入信号。第四层是后续层。它包括线性系统。这里使用线性函数(LF)确定规则的输出值:

在第五层中,第三层的输出信号与第四层的输入信号相乘。的输出第个节点计算为.

FNS的输出信号确定为在这里是FNS的输出信号()和是第5层和第6层之间使用的连接的权重系数。计算输出信号后,开始网络训练。

3.参数更新

3.1. 模糊分类

FNS的设计(图1)包括确定模糊if-then规则的前件和后件的未知参数(1). 在模糊规则中,前因部分通过将空间划分为一组模糊区域来表示输入空间,后因部分描述这些区域中的系统行为。

如上所述,最近,许多不同的方法被用于设计模糊if-then规则。其中一些是基于集群的[2024,26]最小二乘法(LSM)[20,22,30],梯度算法[14,2023,26],遗传算法[24,25,28]和粒子群优化(PSO)[31].

本文将模糊聚类和梯度技术应用于模糊神经网络的设计。首先使用模糊聚类来设计前因(前提)部分,然后使用梯度算法来设计模糊规则的后因部分。模糊聚类是构建先行结构的一种有效技术。聚类方法的目的是从一个大数据集中识别一组特定的数据,从而生成系统行为的简明表示。每个聚类中心都可以转化为一个模糊规则来识别类别。开发了不同的聚类算法[3234]. 最近的模糊c-均值[32]和减法聚类[33,34]已经为模糊系统开发了算法。减法是无监督聚类[33]这是基于网格的山地聚类的扩展[34]. 这里输入数据点的簇数由聚类算法确定。有时我们需要控制输入空间中的簇数。在这些情况下,有监督的聚类算法是主要关注的问题。模糊c均值聚类就是其中之一。它可以有效地用于模糊系统[32]具有简单的结构和足够的精度。本文采用模糊c均值(FCM)聚类技术构造模糊系统的前提部分。

FNS的学习从更新if-then规则前件的参数开始,即FNS第二层的参数。为此,应用FCM分类来划分输入空间并构造模糊if-then规则的先行部分。FCM算法中使用了以下目标函数:哪里任何实数都大于1,在群集中,第个,共个-尺寸测量数据,-集群的尺寸中心,以及是表示任何测量数据和聚类中心之间相似性的任何范数。

通过目标函数的迭代优化实现输入数据的模糊分类(6),随着成员资格的更新和集群中心该算法包括以下步骤:(1)初始化矩阵,.(2)计算中心向量具有:(3)更新:(4)如果然后停止;否则设置并返回步骤(2)。

在分区的结果中,确定了集群中心。这些聚类中心将对应于FNS输入层中使用的隶属函数中心。使用簇中心之间的距离确定隶属函数的宽度。

通过模糊聚类对前因部分进行设计后,导出参数更新规则,用于训练模糊规则后因部分的参数。在本文中,我们应用了具有自适应学习速率的梯度学习。自适应学习速率保证了网络的收敛性,加快了网络的学习速度。

3.2. 使用梯度下降学习

在开始时,FNS的参数是随机生成的。为了生成合适的FNS模型,对参数进行了训练。为了通用性,我们使用梯度下降算法给出了FNS所有参数的学习过程。这些参数是网络第二层语言值的隶属函数以及第四层和第五层的参数。在FNS设计中,使用交叉验证技术将数据分离为训练集和测试集。培训包括参数值的调整。本文采用具有自适应学习速率的梯度学习来更新参数。自适应学习速率保证了网络的收敛性,加快了网络的学习速度。此外,动量被用来加快学习过程。

网络输出误差计算如下在这里是网络输出信号的数量,是网络的期望值和当前输出值()分别是。参数()网络的后继部分与隶属函数的参数()在前提下,使用以下公式调整FNS部分:在这里是学习率,是动量,是网络(输入神经元)的输入信号数是模糊规则(隐藏神经元)的数量,以及是输出神经元的数量。

中的导数(10)使用以下公式计算:

中的导数(11)由以下公式确定:在这里考虑

使用方程式(12)–(14),中的导数(10)和(11)并对FNS的参数进行了修正。

收敛性是FNS模型学习中的一个重要问题。梯度下降学习算法的收敛性取决于学习率初始值的选择。通常,学习率的初始值是在区间内选择的.学习率值过大可能导致学习不稳定;学习速率的小值导致学习速度慢。本文采用自适应方法更新这些参数。FNS参数的学习以较小的学习率值开始在学习过程中,如果误差变化值增加为正值,如果为负值,则减小。这一战略确保了新生力量的稳定学习。此外,动量项用于加快学习过程。使用李亚普诺夫函数可以获得每个时间实例的学习速率的最佳值[22,23]. 收敛性的推导见[22,23].

4.模拟研究

如上所述,FNS应用于帕金森病二酯的分类。这些人被分为两类:正常人和PD。为此,数据库取自加州大学欧文分校(UCI)的机器学习库。这些数据集是从医院捐赠的,许多研究人员对其进行了研究。数据集包括31人的生物医学声音测量;23人被诊断为帕金森病。每一行都包含23个语音参数的值。每列包含195项用于每个参数的数据。数据的主要目的是区分健康人和PD患者。用于识别PD的参数如表所示1这些是使用计算机语音实验室直接记录在计算机上的语音信号参数。在建模期间,对输入数据进行了预处理,输入数据在以下时间间隔内进行了标准化.缩放操作有助于简化系统的培训过程。归一化后,将这些数据作为输入信号输入FNS。

为了设计分类模型,首先生成具有23个输入和2个输出神经元的FNS结构。如果我们使用传统的神经模糊结构(例如[20]或[26])对于23个输入和2个聚类中心,应该生成pow(2,23)=8383608规则。这些规则是使用输入和集群中心的所有可能组合构建的。这是一个很大的数字。本文根据聚类结果选择规则数,即聚类中心数。

在FNS的设计中,应用模糊分类来划分输入空间并选择前提部分的参数,即FNS第二层中使用的高斯隶属度函数的参数。FCM聚类用于输入空间,每个输入有16个聚类。使用这些聚类的不同组合为22个输入构建了16个模糊规则。聚类后,使用输入空间梯度下降算法学习模糊规则的后继部分,即FNS第四层的参数。通过交叉验证实现学习。交叉验证概括了两个独立的数据集:训练和测试。它用于寻找分类器的精确模型。本文使用10倍交叉验证将数据分离到训练集和测试集,并用于评估分类精度。为了在FNS输出中达到所需的精度,应该有一组实验。在隐层中使用不同数量的神经元进行模拟。诊断PD的FNS设计步骤如下:(1)读取PD数据集。从统计数据中选择输入和输出(目标)信号。应用规范化。(2)输入学习速率和动量的值。设置簇数。生成网络参数。设置学习的最大时期数。(3)将分类算法应用于输入信号并确定聚类中心。(4)使用聚类中心来确定层2的隶属函数的中心。(5)使用成员函数的中心来确定成员函数的宽度。(6)使用输入统计数据定义10倍交叉验证的随机分区。(7)将当前学习时段数初始化为1。(8)使用PD数据集和交叉验证,确定培训和测试数据集。(9)确定训练和测试数据集中的行数。(10)将迭代次数初始化为1。(11)根据迭代次数从训练数据集中选择输入数据,并将其发送给FNS的输入。(12)计算网络输出。(13)使用网络输出和目标输出信号确定错误值。使用这些误差值计算平方误差之和(SSE)。(14)使用错误值更新网络参数(网络学习)。(15)应用自适应策略,使用SSE的当前值和先前值更新学习速率。(16)计算每次迭代获得的SSE之和,并保存为训练误差。对其他剩余的训练数据集重复步骤(11)–(16)。如果当前迭代次数小于训练集中的行数,则转至步骤(11),否则转至步骤(17)。(17)选择测试数据集。(18)将迭代次数设置为1。(19)根据迭代次数从测试数据集中选择输入数据,并将其发送到FNS的输入端。(20)计算FNS的输出。(21)使用网络输出和目标输出信号确定错误值。计算网络输出的SSE。(22)计算每次循环迭代获得的SSE之和,并保存为测试误差。对其他剩余的测试数据集重复步骤(19)–(22)。(23)用上一历元获得的测试误差值检查测试误差值。如果当前错误值小于上一个错误值,则转至步骤(24),否则转至步骤(25)。(24)保存网络参数。保存训练和测试错误值。(25)使用SSE的和来求均方根误差(RMSE)。打印测试和培训错误的值;增加epochs数。(26)检查当前的阶段数,以便继续学习过程。如果此数字小于最大纪元数,则重复步骤(8)-(26)。否则,转至步骤(27)。(27)打印步骤(24)中获得的培训和测试错误值。(28)停止训练。

分类系统的输入/输出数据的训练将是一种结构,其第一部分是二维输入向量,第二部分是二维输出簇。2描述了来自PD数据集的片段。FNS结构由23个输入和两个输出神经元生成。应用后生成模糊c-均值聚类和梯度下降算法对FNS的参数进行训练。在第一步中,使用模糊聚类,使用输入数据确定聚类中心。这些聚类中心用于组织每个模糊规则前件输入的隶属函数。规则层是第二层。模糊规则的后续部分使用线性函数进行组织。线性函数在第四层中确定。在对前件进行聚类和设计后,开始学习后件的参数。参数的初始值后继部分线性函数的区间选择.学习率和动量的初始值相应地选择为0.02和0.625。学习参数期间已更新规则的。在学习的结果中,构建了模糊规则。通过分类操作获得的聚类将成为模糊规则前件中使用的高斯隶属函数的中心。后继部分是在线性函数参数学习的基础上构造的。

将FNS的仿真结果与用于PD分类的其他模型的仿真结果进行比较。为了评估模型的结果,使用了均方根误差(RMSE):在这里是期望的输出值和是系统输出的实际值。

为了估计FNS聚类系统的性能,采用了聚类与当前输出信号之间的识别率和误差RMSE值。使用上述公式计算RMSE。识别率由正确分类的项目数除以项目总数计算得出:在FNS训练期间,所有输入数据都按间隔缩放然后对输入数据进行模糊c均值聚类。聚类结果用于设置模糊规则前件的参数,即FNS结构第二层的参数。应用梯度学习确定模糊规则后继部分的参数。这项学习已经进行了2000个时代。使用不同数量的模糊规则对FNS分类系统进行综合。培训使用了不同数量的规则:2、5、8、12和16。使用10倍交叉验证进行培训。在训练结果中,确定了FNS的参数。2描述了培训期间获得的RMSE值。一旦FNS经过培训,就可以用于测试。具有16个隐藏神经元的FNS训练、评估和测试阶段的RMSE值分别为0.232154、0.291636和0.283590。训练的学习率为0.01,动量率为0.825。描述了使用不同数量的规则(2、5、8、12和16)获得的FNS模型的训练和测试结果。模拟结果在十次模拟中取平均值。

从表结果表明,规则数量(或隐藏神经元数量)的增加会降低训练和测试用例的RMSE值,并提高识别率。使用聚类和梯度技术进行学习可以快速获得较低的RMSE值,并可以提高FNS在训练和测试阶段的性能。在第二个模拟中,对PD的分类进行了比较分析。将FNS分类模型的仿真结果与不同分类模型(如支持向量机(SVM)、神经网络(NN)、回归模型、决策树和基于FCM的特征加权)的仿真结果进行了比较。为了估计NN、SVM和FNS聚类系统的性能,比较了聚类与当前输出信号之间的识别率和误差RMSE值。在表中4给出了不同模型的仿真对比结果。如表所示,FNS分类系统的性能优于其他模型。

5.结论

本文介绍了利用模糊神经结构诊断帕金森病。给出了模糊神经网络的结构和学习算法。模糊聚类和梯度下降学习算法应用于模糊神经网络的开发。使用10倍交叉验证数据集进行学习。分类系统的设计是使用FNS中使用的不同数量的模糊规则进行的。16个隐层神经元的分类识别率达到100%。为了进行比较分析,使用不同的模型对PD进行了模拟。结果表明,FNS的分类性能优于其他用于PD分类的模型。

利益冲突

作者声明,本论文的出版不存在利益冲突。