跳到主要内容

利用语音样本的多重编辑最近邻和集成学习算法对帕金森病进行分类

摘要

背景

近年来,在帕金森病(PD)的分类中使用基于语音的数据已被证明提供了一种有效的、非侵入性的分类模式。因此,人们越来越关注适用于帕金森综合征的语音模式分析方法,以建立预测性远程诊断和远程监测模型。优化分类的障碍之一是减少采集语音样本中的噪声,从而确保更好的分类准确性和稳定性。虽然当前使用的方法有效,但很少检查调用实例选择的能力。

方法

在本研究中,提出并检验了一种PD分类算法,该算法结合了多数据最近邻(MENN)算法和集成学习算法。首先,使用MENN算法迭代选择最佳训练语音样本,从而获得具有高可分性的样本。接下来,使用集成学习算法,即随机森林(RF)或去相关神经网络集成(DNNE),从收集的训练样本中生成训练样本。最后,将训练好的集成学习算法应用于局部放电分类测试样本。使用最近存放的公共数据集对该方法进行了检验,并与其他当前使用的算法进行了比较。

结果

实验结果表明,与所研究的其他算法相比,该算法获得了最高程度的分类精度提高(29.44%)。此外,仅MENN算法就可以将分类精度提高45.72%。此外,该算法具有较高的稳定性,尤其是在结合MENN和RF算法时。

结论

本研究表明,当使用语音数据时,该方法可以改进PD分类,并且可以应用于寻求改进PD分类方法的未来研究。

背景

帕金森氏病(PD)是一种中枢神经系统的神经退行性疾病,其特征是运动反射、言语、行为和其他重要功能部分或全部丧失。它通常见于老年人,会导致患者言语和运动能力(写作、平衡、行走等)障碍[1]. PD是最常见的神经退行性疾病之一,发病率为20/10万,影响全球约500万人,其中一半的PD病例发生在中国[2]. 此外,由于帕金森病的诊断困难,这些统计数据可能低估了发病率。随着人口的增长,确诊帕金森病患者的数量将继续增加,从而增加了该病在未来的危害[2].

虽然确定帕金森病发病的原因仍不明确,但帕金森病通常被称为一种特发性疾病,涉及遗传和环境因素[1]. 不幸的是,一个可靠的PD生物标记物尚未确定,但症状通常可以反映PD的发生和发展,如震颤、僵硬、肌肉控制丧失、运动迟缓、平衡不良,尤其是嗓音问题[16]. 因此,根据症状诊断PD是合理有效的[714]. 其中,言语被证明是区分PWP(帕金森病患者)与健康对照组的有用信号,临床证据表明绝大多数PWP通常表现出某种形式的发音障碍[,7,1416]. 事实上,发音障碍可能是最早的前驱症状之一,在临床诊断前五年可以检测到[2]. 因此,利用语音数据有助于发展非侵入性早期PD诊断方法,语音改变包括响度降低、声带震颤和呼吸(噪音)增加,而PD相关的声带损伤的特征是发音困难(无法发出正常的声音)构音障碍(发音困难)。通过使用声学工具检测嗓音异常,如非周期振动、非高斯随机性、元音“a”发音异常等,可以测量发音障碍[2],带有特定的特殊单词和句子,如阿拉伯数字、特殊单词等,用于检测。

虽然很难进行可靠的PD诊断,但基于语音的诊断方法的有效性激发了研究人员开发决策支持工具,能够提取发音困难的语音特征,并设计分类算法,通过语音特征提取,将PD患者与健康患者区分开来,特征选择/转换与分类器设计[1724].

在检查特征提取时,特征类型通常包括音高类型、能量类型、速度类型和内容类型[1,2,1725]. 对于特征变换,常用的算法是PCA(主成分分析)[26,27,31,49]. 对于特征选择,常用的算法是基于NN(神经网络)的[2730,32,49],基于串行搜索[2,14,29,31],基于随机[32,33,48],第页基于价值的[2,2734],基于相关性[35,36]或基于熵[37],基于判别算法(DA)[47]. 对于分类器设计,主要使用的分类器包括支持向量机(SVM)[1,2,14,29,32,35,3841],克朗[1,2,26,28,40,41,47,48,49],随机林(RF)[2,30,36],贝叶斯网络[27,28,40,42,43,48],判别算法(DA)[27,29,31,37],概率神经网络(PNN)[27,43]或决策树[31,40,42,4446]. 此外,还将几种集成模型与单个分类器进行了比较[27,47,48,50,51].

虽然上述方法在一定程度上是有效的,但获得最佳语音样本是困难的,低质量的样本容易误导分类器,并对准确性产生负面影响。基于这一潜在缺陷,本研究研究了一种语音样本选择算法,以改善结果。首先,使用多数据最近邻(MENN)算法迭代选择最佳语音样本,从而增强训练样本的可分性。MENN算法通过删除可能误导分类器的样本,有效地优化了训练样本[50,52,54]. 接下来,使用集成学习算法、随机森林(RF)或去相关神经网络集成(DNNE)对所选择的训练样本进行分类。选择这两个集成进行比较,RF是一种经典的集成学习算法,具有已证明的稳定性[2,34,41],而DNNE是一种较新的集成学习算法,能够有效地最大化子学习算法之间的差异[51]. 最后,基于训练好的集成学习算法对测试样本进行分类。

方法

数据描述

本研究中使用的数据来自帕金森氏症语音数据集和多种类型的录音[1]由Sakar等人[1]并可在加州大学欧文分校(UCI)机器学习数据集存储库网站上获得。存放的数据集(表1)包括两个名为“Training_Data”和“Test_Data“的数据集。“Training_Data”数据集包括40名受试者,其中20名PD(6名女性,14名男性)和20名健康受试者(10名女性,10名男性),每个受试者采集26个语音样本。这些样本包含各种发音不同的语音片段,包括连续元音、数字发音、单词发音和短语句子发音。为了建立一个特征向量,在26个维度上提取每个语音样本的线性和非线性特征参数。“Test_Data”集合包括28名受试者(均为PD),每个受试者采集了6个语音样本,其中一半包含连续元音“a”的发音,另一半包含持续元音“o”的发音。然后由26个维度构造特征向量。

表1基于同一主题的语音样本描述

本研究中收集的数据属于20名PWP(6名女性,14名男性)和20名健康个体(10名女性,10名男性),他们在伊斯坦布尔大学Cerrahpasa医学院神经病学系进行了上诉。试验组由患有帕金森病0至6年的患者组成。受试组和对照组的个体年龄分别为43至77岁(平均值:64.86,标准偏差:8.97),以及45至83岁(平均数:62.55,标准差:10.79)[1].

除了Sakar等人[1]Little等人保存的另一个广泛研究的数据集也存在[2,14]. 选择Sakar等人数据集的主要原因如下:(1)Little等人数据集得到了更广泛的研究,分类准确度超过95%,与本文达到的接近100%的准确度相当;(2) Sakar等人的数据集包含更多样本,因此提供了更具统计意义的结果;(3) 只有少数研究对Sakar等人的数据集进行了检验,从而使研究结果更具洞察力;和(4)Sakar等人的数据集的相应分类精度当时并不理想。本研究的目的是表明,只要改变分类方法,这种类型的数据采集就可以实现PD的高分类精度。因此,在实验部分,大多数实验都基于Sakar等人的PD数据[1]. 由于经常调查Max-Little的局部放电数据,因此也基于数据验证了所提算法。

拟议算法的流程图(PD_MEdit_EL)

为了简化,建议的算法称为PD_MEdit_EL,流程图如下(图1). PD_MEdit_EL算法包括两个主要部分,一部分通过MENN优化语音样本,另一部分使用集成学习算法执行分类,使用RF或DNNE。按时间顺序,使用MENN算法对训练语音样本进行优化,然后使用集成学习(EL)算法对这些训练样本进行处理,得到一个经过训练的学习模型。最后,将训练好的学习算法应用于测试样本分类。

图1
图1

PD_MEdit_EL算法流程图

多编辑最近邻算法(MENN)

MENN算法是一种原型选择算法,当不同类别的样本具有重叠分布时,重叠区域更容易被误分类。假设,如果准确地删除重叠区域,则“噪音”或误导性数据可以大大抑制。因此,剩余样本将更好地反映不同类别的代表性样本,从而提高分类精度[52].

两编辑最近邻算法主要包括编辑和分类。首先,将样本分为训练样本和验证样本,对验证样本进行分类,并删除错误分类的样本。通常,如果样本量足够大,则应使用MENN。算法的主要过程如下:

第1步:原始样品\(X=\left\{{X{i}=\left({X{1},X{i2},\ldots,X{id}}\right)|i=1,{2}、\ldotsN}\right\}\)被随机分为子集,\(X{1},X{2},\ldots,X{s}\左({{text{s}}>3}\右)\),每个包含\(M_{1},M_{2},\ldots,M_}s})样品。d日是样品的尺寸,N个是样本数。

第2步:编辑过程。\(X_{i+1}\)作为训练集,使用KNN对集中的验证样本进行分类X(X) ,删除了错误分类的样本。重复这些设置=1至 = −1.如果 = ,X(X) 1是训练集。

第三步:将步骤2后保留的样本合并为新的样本集(X(X) 新建 ).

第4步:重复上述步骤,直到所有错误分类的样品都被清除。

在图中2,可以看到使用MENN算法编辑的训练样本的结果,与MENN之前的编辑相比,训练样本上的可分性提高了(图2a) 和后MENN编辑(图2b) ●●●●。

图2
图2

培训样本的编辑结果:MENN之前b条与MENN合作。(第一维是指第一个特征;第二维是指PD数据的第二个特征)

以前的研究表明,最近邻算法可以获得接近贝叶斯错误率的分类错误率P(P)*当使用足够大的样本量时[53]. 对于两个编辑最近邻算法,累进条件假识别率如下:

$$P\,(e/x)=1-\frac{{P(\omega_{i}/x)^{2}}{{sum\nolimits_{i=1}^{2{P(\ omega_}i}/x)^{2]}}$$
(1)

应用MENN算法时,累进条件假识别率如下:

$$P_{M}(e/x)=1-\frac{{\sum\nolimits_{i=1}^{2}{P(\omega_{i}/x)^{2^{M+1}}}}{{sum\nolimites_{i=1}^}{2}}{P$$
(2)

如公式所示,当M(M)增加。如果\(M\to\infty,{\text{then lim}}_{M\to+\infty}P_{M}\left({e/x}\right)={\hbox{min}}\left[{P\ left(}\omega_{1}/x}\ right),P\ left[{\omega_2}/x{\right.

随机森林

当使用RF算法作为分类器时,相应的训练如下[54]:

第1步:Bootstrap方法用于重新采样并随机生成T训练集:\(S_{1},\;S_{2},\ldots S_{T}\).

第2步:为每个集合生成相应的决策树:\(C_{1},\;C_{2},\ldots C_{T}\)从M个属性中随机选择属性,并使用确定的最佳分割来分割节点。

第三步:每棵树都可以完整地生长,而不需要修剪。

第4步:根据每个决策树,对测试集X中的样本进行分类,以生成相应的类:\(C_{1}\left(X\right),\;C_{2}\left(X\right),\ldots C_{T}(X)\).

第五步:采用投票方法,根据T决策树确定输出类别,投票数最大的类别成为指定类别。

Dnne公司

DNNE算法的主要原理[51]如下所述。

初始化训练套件 t吨 ; 基函数G(选项:sigmoid函数);正则化因子λ [0, 1]; 子分类器的数量为M,样本的维数为L。

程序经过培训的DNNE模型。

1:构造一个M单层反馈神经网络和集成学习算法(模型)。

2:随机初始化权重w个 j个 和偏见b条 j个 .

3:输入培训样本 并计算输出 ij公司 (x个 n个 )所有子分类器中,

$$g{ij}(x{n})=g{ij{(w{j},b{j},x{n{)$$
(3)

其中用于构建随机向量的函数连接网络(RVFL)需要训练样本 t吨 具有N个维度,\(D_{t}=\left\{{left({x{1},y_{1}}\right),\left以及在哪里\(\左({x_{n},y_{n{}}\右)\在R^{d}\乘以R\中)属于成对观察。这个G公司 ij公司 ()是指ij公司子分类器。

4:计算常数C 1 ,C 2 如等式(4)以下为:

$$\varphi\left({i,j,k,l}\right)=\sum\limits_{n=1}^{n}{g_{ij}\left}}$$
(4)

\(\varphi\left({i,j,k,l}\right)\)表示j个第个隐藏神经元第i个独立RVFL网络和第个隐藏神经元k第th个独立的RVFL网络。\(\varphi\left({i,j}\right)\)表示j个第个隐藏神经元基于th的网络与目标函数ψ(x个). 因此,C 1C 2可以表示为等式(5)和(6)以下为:

$$C_{1}=1-2\lambda\frac{{(M-1)^{2}}{{M^{2{}},\quad C_{2}=2\lambda \ frac{M-1}{M^}}$$
(5)
$$\mathop\sum\limits_{k=1}^{L}C_{1}\varphi\left({i,j,i,k}\right)\beta_{ik}+\mathop\sum\limits_{L\nei}^{M}\mathop \sum\limits_{k=1}^{L}C_2}\varfi\left$$
(6)

根据上述公式,误差e(电子) ,输出重量β ij公司 M(M) × L(左)可以得到线性方程。

因此,线性系统可以根据β ij公司 并且可以获得RVFL系综模型。为了简化计算,线性系统的矩阵形式如下等式(7)以下为:

$$H_{corr}B_{ens}=T_{H}$$
(7)

H(H) 校正 是隐藏的相关矩阵,B类 ens公司 是全局输出权重矩阵T型 小时 是隐藏目标矩阵。H(H) 校正 定义如下等式(8)和(9)以下为:

$$H_{corr}=\left[\begin{array}{ccccccc}C_{1}\varphi(1,1,1,1)&\cdots&C_{1}\varph(1,1,1,L)&\cdots&C_{2}\varpi(1,1,M,1)&\ cdots&C_2}\varfi(1,1,M,L)\\vdots&\vdots&\vdots&&\vdot \\C_{1{1\varphi&C_{1}\varphi(1,L,1,L)&\cdots&C_{2}\varfi(1、L,M,1)&\cdots&C_2}\varφ(1,L,M,L)\\C_{2}\varphi(2,1,1,1)&\cdots&C_2}\varfi(2,2,1,1,L)&\cdots&C_2}\valphi(2,1,M,1)&\ cdots&C_2}\ varphi C_{2}\varphi(2,1,M,1)和\cdots&C_{2}\varfi(2,L,M,L)\\\vdots&&\vdots&&\ vdots&&\C_{2}\varphi{2}\varphi(M,L,1,L)和\cdots&C_{1}\varfi结束{数组}\right]_{(ML\times ML),}$$
(8)
$$H_{corr(p,q)}=\left\{\begin{array}{l}C_{1}\varphi(m,n,k,l)\quad{\text{if m}}={\text}k;}}\\C_{2}\varpi(m、n,k、l)\quid{\text{otherwise;}\\end{array}\right$$
(9)

哪里第页,\(q=1,\ldots,M\乘以L;) \(m=\left\lceil{\frac{p}{L}}\right\rceil\),\(n=((p-1)\bmod\,L)+1);\(k=\left\lceil{\frac{q}{L}}\right\rceil\);\(l=((q-1)\bmod\,l)+1); mod表示模块化操作。B类 ens公司 和T 小时 可定义为如下等式(10)以下为:

$$B_{ens}=\left[{\beta_{11},\ldots,\beta{1L},\ beta{21},\tots,\ beta{2L}$$
(10)
$$T_{h}=\left[{\varphi\left({1,\,1}\right),\ldots,\varphi\ left([1,L}\right]),\varfi\ left[{2,\$$

β ij公司 可以使用梯度下降的优化技术进行修改,公式如下(11)以下为:

$$\帽子{乙}_{ens}=H_{corr}^{-1}T_{H}$$
(11)

DNNE算法可以编程实现。它的伪代码如下:

结果

实验条件

从“Train_Data”集合内的40名受试者中收集的一百四十个训练样本,每个样本由26个维度特征参数组成,通过留一交叉验证(LOO-CV)进行评估。如果大多数受试者样本是患者,则该受试者被视为患者;否则,该受试者被视为健康。由于并非所有样本都能平等地反映语音特征,为了减少来自同一主题的离群样本的影响,采用了一种称为leave-one-subjectout(LOSO)的交叉验证方法。在完成DNNE算法时,使用线性穷举搜索算法搜索最大参数值,搜索范围为M(M)在[2,15]内,RVFL网络的基函数L在[5,50]内,惩罚系数γ和升压阈值在[0,1]内。他们的步长分别为0.1和0.01。此外,60%的训练样本经常用于打包和增强整体效果。在执行RF时,统计上最优的决策树数量为500。支持向量机基于libsvm。执行MENN算法时,设置参数()是基于统计实验。对于MENN = 4. 对于分类模型的权重,通过监督训练进行设置。

本文的实验操作系统平台是Windows,版本7,32位操作系统,内存大小为4GB。数据处理在MATLAB 2014a版中完成。SVM、RF和浮雕算法来自MATLAB环境下的工具箱。DNNE算法来自MATLAB的官方网站。原始MENN算法来自文件交换相关网站(网址:http://www.pudn.com),但它是由我们修改并与DNNE和RF相结合的。其他部件由我们设计。

绩效评估标准

为了验证所提算法的有效性,使用分类准确度、敏感性和特异性作为评价标准TP(转移定价):真阳性,TN公司:真阴性,FP公司:假阳性和FN公司:假阴性。具体公式如下:

$$精度=\压裂{TP+TN}{TP+FP+TN+FN}$$

敏感性,也称为真阳性率,通过以下等式确定准确识别的疾病受试者的百分比:

$$敏感性=\压裂{TP}{TP+FN}$$

特异性,也称为真阴性率,通过以下等式确定准确识别的健康受试者的百分比:

$$特定性=\frac{TN}{TN+FP}$$

PD_MEdit_EL算法的分类性能

在本研究中,对利用集成学习算法RF和DNNE的PD_MEdit_EL算法进行了研究。到目前为止,只有四项研究对Sakar等人进行了研究[1]数据集,只有两个报告验证集的分类准确性[42,49]. 因此,只有两项研究[1,27]与本文研究的PD_MEdit_EL算法相当。目前,支持向量机被广泛应用于帕金森病的分类,因此,将具有线性和RBF核函数的支持向量机与提出的PD_MEdit_EL算法进行了比较(表2). 这些结果表明,无论LOO和LOSO如何,PD_MEdit_EL算法在分类准确性(ACC)、敏感性(SEN)和特异性(SPE)方面提供了最准确的分类。在检查所有分类决定因素时,RF(带MENN)是最佳的总体分类算法,而DNNE(带MENN)算法的LOSO平均SPE最高。在比较LOO和LOSO方法时,LOSO的分类性能高于LOO,这可能是因为LOSO有效地减少了主题内的离群值。

表2“Training_Data”集合的分类精度

总的来说,这些发现表明,当MENN与任一集成学习算法相结合时,与其他分类方法相比,可以看到显著的改进。在RF(使用MENN)方法检测ACC时,与SVM(线性)相比,分类得到了改进,增加了16.5%,SVM(RBF)增加了14%[1],增长29.44%,方法[27],增长0.3%。在DNNE(使用MENN)中检测准确度时,分类相对于SVM(线性)提高了8.37%,相对于SVM提高了5.87%,相对于中的方法提高了21.31%[1],但与中的方法相比减少了2.5%[27]. 关于RF(带MENN)方法的SEN,在年中,相对于SVM(线性)、相对于SVM(RBF)、相对于方法分别提高了27.5%、12.5%和37.58%[1]和中方法的7%[27]. 然而,当检查SEN以确定DNNE(使用MENN)方法时,相对于SVM(线性),分类只出现了改进,增加了6%,而该方法在[1],增长16.08%。这些结果表明,在分类性能方面,RF方法比DNNE算法更具鲁棒性。

接下来,针对“Test_Data”集合(表). 由于该组仅包含患者受试者,因此无法计算敏感性和特异性。此外,参考文献中的方法[27]没有报告“Test_Data”的分类准确性,因此省略了它。使用该数据集时的结果进一步表明了所提出的PD_MEdit_EL算法的优势,在RF(使用MENN)和DNNE(使用MERN)中可以看到明显更高的分类精度。当比较DNNE和RF算法时,在分类精度方面没有发现显著差异。表中获得的结果2也以图形方式显示在图中4.

表3“Test_Data”集合的分类精度
图3
图3

使用“Training_Data”集合在不同分类算法之间的分类性能。这个-轴:分类精度;DNNE_MENN和RF_MENN:反映提议的PD_MEdit_EL算法;SVM_Linear:带线性核函数的SVM;SVM_RBF:带径向基函数核的SVM;中的方法[27]:参考文献中的分类算法[27]

图4
图4

使用“Test_Data”集合在不同分类算法之间的分类性能。这个-轴:分类精度;DNNE_MENN和RF_MENN:反映所提出的PD_MEdit_EL算法;SVM_Linear:具有线性核函数的SVM;SVM_RBF:带径向基函数核的SVM;中的方法[27]:参考文献中的分类算法[27]

为了进一步检查分类性能,检查了算法之间相对于运行次数的差异;对于每个算法,分别对“Training_Data”和“Test_Data“集合进行了10次检查。这些发现与表中的数据一致2当检查“Training_Data”集合时,RF(带MENN)和DNNE(带MENN)都显示出最高的分类精度。然而,与DNNE(使用MENN)相比,RF(使用MENN)显示出更大程度的稳定性,这可能是因为DNNE很复杂。虽然DNNE(with MENN)方法总体上提高了分类精度,但其稳定性较差,因此不太理想。而中引用的方法[1]由于论文的原因,没有包括在这个比较中[1]不包括运行次数期间的精确度。由于它包含SVM_Linear和SVM_RBF组件,因此仍可以进行间接比较,以表明PD_MEdit_EL算法提供了比[1].

检查“Training_Data”集合时(图5)RF(带MENN)再次显示出最高的准确度和高稳定性,而RF(带MANN)和DNNE(带MERN)的分类准确度均高于目前用于帕金森病分类的SVM。在检查此数据集时,值得注意的是RF变得更加稳定,因此建议与此数据集具有更高的兼容性。

图5
图5

“Training_Data”集合不同算法的分类精度。这个-轴:分类精度;这个x个-axis:每个算法的运行次数;DNNE_MENN和RF_MENN:反映提议的PD_MEdit_EL算法;SVM_Linear:带线性核函数的SVM;SVM_RBF:带径向基函数核的SVM

检查“Test_Data”集合时(图6),RF(带MENN)再次显示出最高的准确度和高稳定性,而RF(带MENN)和DNNE(带MENN)都显示出比SVM更高的分类准确度,SVM目前用于帕金森病的分类。在检查该数据集时,值得注意的是,DNNE变得更加稳定,从而表明与该集具有更高的兼容性。

图6
图6

“Test_Data”集合的不同算法的分类精度。这个-轴:分类精度;这个x个-axis:每个算法的运行次数;DNNE_MENN和RF_MENN:反映提议的PD_MEdit_EL算法;SVM_Linear:带线性核函数的SVM;SVM_RBF:带径向基函数核的SVM

该算法在来自的PD数据中得到了验证[2]. Max Little等人在其数据集中引入了几种机器学习算法[2]. 结果表明,采用RBF核函数和浮雕算法的支持向量机效果最好。因此,在这里实现它是为了与所提出的算法进行比较。为了公平比较,该算法也是基于浮雕算法。CV方法是与纸张相同的十倍CV[2]做了。

从表中看到4,分类准确率优于表中的分类准确率2对于所提出的算法和LOSO,分类准确率从81.5%提高到87.8%;灵敏度从92.5%提高到95.4%。对于所提出的算法和LOO,分类准确率从70.93提高到87.8%;灵敏度分别从73.27%提高到95.4%。可能的原因是数据集中的样本数小于表中数据集的样本数2此外,值得注意的是,敏感性和特异性差异很大。可能的原因是患者和健康人的数量不同。换句话说,数据集是不平衡的。

表4 Max Little等人的PD数据分类精度。

值得注意的是,1040个样本来自40名受试者,因此,属于同一受试者的样本在某种程度上是相互依赖的。因此,如果训练集和测试集中的样本是独立的,则分类准确率可能会变差。然而,除了数据来源的论文外,相关论文中的验证部分没有考虑这一点。为了进一步研究这个问题,进行了一个实验。在实验中,当一个样本被分类时,属于同一主题的另外25个样本不用于构建分类模型。它可以保证训练集和测试集中的样本彼此独立。表格5显示了考虑依赖性和独立性之间的差异。从表中看到5,RF_MENN表示不考虑样本依赖性的算法;RF_MENN_inDe表示考虑样本相关性的算法;SVM_RBF是指不考虑样本相关性的带有RBF核算法的SVM;ENN_ inDe是指考虑样本相关性的具有RBF核算法的SVM。

表5相关性分类结果

从表中看到5当考虑样本的相关性时,无论采用何种RF和SVM算法,分类准确率都会变差。恶化的程度很大。然而,考虑样本依赖性的算法仍优于本文[1]. 与提出的算法和带RBF核的SVM相比,前者在考虑样本相关性时仍然更好。这意味着所提出的算法是有价值的。

MENN算法的效果

为了检验MENN算法的效果,对“Training_Data”集合进行了检验,该集合包括20名PD(6名女性,14名男性)和20名健康(10名女性,10名男性)受试者,每个受试者有26个语音样本。总共使用了1040个语音样本,并在MENN前后进行了检查,其中1039个样本接受了LOO培训(表6). 使用MENN算法,训练样本总数从1039个减少到731个,健康受试者的数量从519个减少至364个,患者受试者数量从520个减少至365个。此外,应用MENN算法后,尽管减少了样本数,但训练对象的数量没有变化。因此,MENN算法能够满足后续机器学习对训练样本数的要求。

MENN算法的观察效果进一步可视化(图7),三维是数据集中的前三个特征,用于确定坐标。在应用MENN算法之前,PWP平均患者样本和正常平均健康样本非常混合,很难分离(图7). 应用MENN算法后,样本混合大大改进,从而能够更好地进行后续分类。

图7
图7

样本分布(1)在和之前(2)应用MENN算法后(1维表示PD数据的第一个特征;2维表示PD数据库的第二个特征;3维表示PD存储的第三个特征)

接下来,使用“Training_Data”集合(表7),缩写与表中相同2已使用。MENN在提高DNNE和RF的分类性能方面发挥了重要作用。对于LOO下的DNNE,ACC提高了3.62%,SPE提高了13.33%。对于LOSO下的DNNE,ACC提高了4.12%,SEN提高了2.5%,SPE提高了5%。对于LOO下的RF,ACC改善了3.54%,SEN改善了1.65%,SPE改善了5.23%。对于LOSO下的DNNE,ACC从3.25%提高,SEN提高7%。最高改进率为7%,最高分类准确率为88%。

使用“Test_Data”集合(表8),缩写与表中相同2已使用。这些结果与表中的结果一致5在检查ACC时,样本的DNNE提高了14.88%,而受试者的DNNEs提高了10.72%。在检查ACC时,样本的RF提高了43.03%,而受试者的RF提高45.72%。获得的最高ACC为100%,样本的最大增幅为43.03%,受试者的最大增幅是45.72%。这种高度的改进可能是由于该数据集仅包含患者样本,从而使分类变得不那么困难。

表6应用MENN算法前后的比较

PD_MEdit_EL算法的显著性级别

为了确定PD_MEdit_EL算法与其他被检查的算法之间存在显著差异,基于十次实验计算了算法之间的ACC、SEN和SPE的p值(表9). 在LOO和LOSO方面,与SVM(线性)或SVM(RBF)相比,RF(带MENN)和DNNE(带MERN)之间的差异显示出一些高度显著的差异。虽然这些结果表明PD_MEdit_EL算法与所检查的算法之间存在显著差异,但在比较RF(与MENN)和DNNE(与MERN)时,没有发现显著差异,因此表明这两种算法的执行方式是相似的。

表7“Training_Data”集合的MENN算法改进

使用“Test_Data”集合(表10). 该数据集也呈现出同样的趋势,与SVM(线性)或SVM(RBF)相比,RF(带MENN)和DNNE(带MERN)之间存在一些非常显著的差异。然而,当比较RF(与MENN)和DNNE(与MERN)时,受试者没有发现显著差异,但这两种方法在样本上有显著的统计学差异。

表8 MENN算法对“Test_Data”集合的改进

讨论

其中,将多数据最近邻(MENN)算法与集成学习算法相结合,生成了一种用于局部放电诊断的分类算法PD_MEdit_EL。虽然已经进行了基于语音样本的PD分类研究,但很少有研究使用Sakar等人的数据集[1]. 由于这是一个较大且最近存放的数据集,因此选择它来检查这种新分类策略的有效性。虽然目前的分类算法研究特征提取、特征选择/转换和分类器设计,但它们无法通过选择来考虑样本优化。根据机器学习理论,实例选择对机器学习的质量和准确获得最终分类至关重要,异常值会添加“噪声”,从而误导分类器。在本研究中,使用样本选择算法MENN来减少这些异常值的影响。后续实验表明,该算法能够提供准确的分类。虽然在以前的研究中使用了RF方法,但当它与MENN算法结合时,发现了显著的改进(表9,10).

表9使用“Training_Data”集合确定方法重要性
表10使用“Test_Data”集合确定方法重要性

此外,还使用了两种集成学习算法RF和DNNE来提高PD分类的准确性和稳定性。虽然RF算法得到了更广泛的检验,但DNNE是一种新的分类算法。这两种算法的参数基于先验知识和统计实验,结果表明,这两种方法的性能优于参考文献中的算法[1],即使没有MENN算法。当组合集成学习算法和MENN算法时,在“Training_Data”(约30%)和“Test_Data)(约25%)集合中的分类性能都得到了进一步提高。Sakar等人[1]根据ACC、SEN和SPE对数据集进行了系统研究,包括检查样本和受试者。为了确定所提出的PD_MEdit_EL算法的统计有效性,我们检查了算法之间的显著性差异,并注意到PD_Medid_EL算法与其他被检查的算法之间存在一些非常显著的差异。

总的来说,与当前用于分类的检查算法相比,PD_MEdit_EL算法实现了更高的分类性能。这在一定程度上可以归因于处理数据的PD_MEdit_EL方法,而现有的检查算法没有这样做。这些处理技术包括特征选择、特征非线性变换、多重分类器等。因此,这些方法的结合使得PD_MEdit_EL算法成为PD分类的有效方法。

本文的主要贡献和创新可以描述如下:

  1. 1

    利用MENN算法对语音样本进行优化,从而提高PD分类精度。

  2. 2

    集成学习算法RF和DNNE与MENN一起进行了检验,结果进一步优化了PD分类。

  3. 三。

    对“Traning_Data”和“Test_Data“集合进行了系统的研究和验证,而相关研究不涉及“Test_Ddata”集合。

  4. 4

    与其他检测算法相比,所提出的PD_MEdit_EL算法的统计显著性得到了证实。

结论

虽然基于语音的PD分类已被证明是有效的,但现有方法缺乏优化语音样本的能力,这对于提高PD分类性能至关重要。在本研究中,将MENN算法和集成学习算法相结合,提出了一种新的分类算法(PD_MEdit_EL)。为了评估该算法的性能,使用了Sakar等人提供的公共数据集,并将该算法与现有方法进行了比较。实验结果表明,与所研究的算法相比,PD_MEdit_EL算法提供了更好的分类能力。此外,无论LOO或LOSO或所使用的数据集如何,所注意到的改进都是明显的,“Training_Data”集合的改进接近30%,“Test_Data“的改进接近25%。总的来说,这项研究提供了新的见解,可以应用于后续研究中,当使用语音数据时,PD分类。在不久的将来,我们将考虑检查压缩的语音特征数据,以进一步验证并可能修改PD_MEdit_EL算法。

缩写

产品开发:

帕金森病

菜单:

多数据最近邻

射频:

随机森林

挪威国家电力公司:

神经网络集成

PWP公司:

帕金森氏症患者

主成分分析:

主成分分析

NN编号:

神经网络

支持向量机:

支持向量机

项目编号:

概率神经网络

标高:

集成学习

RVFL(右飞行高度层):

功能连接网络LOO

简历:

去掉一项交叉验证

LOSO公司:

离开主题

工具书类

  1. Sakar BE、Isenkul ME、Sakar CO、Sertbas A、Gurgen F、Delil S、Apaydin H、Kursun O。收集和分析具有多种录音类型的帕金森语音数据集。IEEE J生物健康信息。2013年;17(4):828–34.

    第条 谷歌学者 

  2. Tsanas A、Little MA、McSharry PE、Spielman J、Ramig LO。用于帕金森病高精度分类的新型语音信号处理算法。IEEE Trans Biomed Eng.2012;59(5):1264–71.

    第条 谷歌学者 

  3. de Rijk MC、Launer LJ、Berger K、Breteler MM、Dartigues JF、Baldereschi M、Fratiglioni L、Lobo A、Martinez Lage J、Trenkwalder C、Hofman A。欧洲帕金森病的患病率:一项基于人群的队列合作研究。老年神经疾病研究小组。神经病学。2000;54(5):21–3.

    第条 谷歌学者 

  4. Van Den Eeden SK、Tanner CM、Bernstein AL、Fross RD、Leimpeter A、Bloch DA、Nelson LM。帕金森病发病率:年龄、性别和种族/民族差异。《美国流行病学杂志》。2003;157(11):1015–22.

    第条 谷歌学者 

  5. Elbaz A、Bower JH、Maraganore DM、McDonnell SK、Peterson BJ、Ahlskog JE、Schaid DJ、Rocca WA。帕金森综合征和帕金森病风险表。临床流行病学杂志。2002年;55(1):25–31。

    第条 谷歌学者 

  6. O'Sullivan SB,Schmitz TJ,《物理康复中的帕金森病》。第5版,费城:F.A.Davis公司;2007年,第856–94页。

    谷歌学者 

  7. 汗·T·帕金森病言语异常评估:综述。Idt.mdh.se.2014年。

  8. Das R.帕金森病诊断的多种分类方法的比较。专家系统应用。2010;37(2):1568–72.

    第条 谷歌学者 

  9. Hirschauer TJ、Adeli H、Buford JA。使用增强概率神经网络对帕金森病进行计算机辅助诊断。医学系统杂志。2015;39(11):1–12.

    第条 谷歌学者 

  10. Prashanth R、Roy SD、Mandal PK、Ghosh S.使用嗅觉丧失和REM睡眠障碍特征检测帕金森氏病。IEEE Eng-Med Biol Soc.年会;2014年,第5764–67页。

  11. Baghai-Ravary L,甜菜SW。语音信号自动分析用于语音障碍的临床诊断和评估。Springer Br Electr计算工程2012;115(2):31-6。

    谷歌学者 

  12. Kim H、Lee HJ、Lee W、Kwon S、Kim SK、Jeon HS、Park H、Shin CW、Yi WJ、Jeon BS、Park KS。使用智能手机对帕金森病患者步态进行无约束检测。医学和生物学会IEEE工程年度国际会议。医学和生物学会IEEE工程。年度会议;2015年,第3751–54页。

  13. Little MA、McSharry PE、Hunter EJ、Spielman J、Ramig LO。痛觉障碍测量在帕金森病远程监测中的适用性。IEEE Trans Biomed Eng.2009;56(4):1015–22.

    第条 谷歌学者 

  14. Hariharan M、Polat K、Sindhu R。用于准确检测帕金森病的新型混合智能系统。计算机方法程序生物识别。2014;113(3):904-13。

    第条 谷歌学者 

  15. Sapir S、Ramig LO、Spielman JL、Fox C.《共振峰集中率:构音障碍语音新声学测量的建议》。语言听力研究杂志2010;53(1):114–25.

    第条 谷歌学者 

  16. Rusz J、Bonnet C、KlempířJ、TykalováT、BaborováE、NovotnŬM、Ulseh A、Růzi ička E。言语障碍反映了帕金森病、进行性核上性麻痹和多系统萎缩的不同病理生理学。神经科学杂志。2010;262(2):992–1001.

    谷歌学者 

  17. Islam MS,Parvez I,Deng H,Goswami P。使用声音障碍(发音困难)检测帕金森病的异质分类器性能比较。2014年国际信息、电子和视觉会议(ICIEV);2014年,第1-7页。

  18. Pérez CJ、Naranjo L、Martín J、Campos-Roca Y.一种基于潜在变量的贝叶斯回归,用于解决帕金森病中的记录复制问题。第22届欧洲信号处理会议;2014年,第1447–51页。

  19. Athanasios T、Little MA、Mcsharry PE、Ramig LO。通过无创语音测试准确远程监测帕金森氏病进展。IEEE Trans Biomed Eng.2010;57(4):884–93.

    第条 谷歌学者 

  20. Benba A、Jilbab A、Hammouch A、Sandabad S.使用MFCC和SVM进行声纹分析,以检测帕金森病患者。2015年电气和信息技术国际会议(ICEIT),IEEE;2015

  21. Titze、Ingo R、Martin、Daniel W.《声音制作原理》。第2版,爱荷华州:国家。中心语音;2000

    谷歌学者 

  22. Schoentgen J,Guchteneere RD。抖动的时间序列分析。J电话。1995;23(23):189–201.

    第条 谷歌学者 

  23. Tsanas A、Little MA、McSharry PE、Ramig LO。拉米格。映射到标准度量的非线性语音分析算法实现了帕金森病症状平均严重程度的临床有用量化。J皇家足球协会界面。2011;59(8):842–55.

    第条 谷歌学者 

  24. Yair E,Gath I.帕金森病言语的高分辨率零极点分析。IEEE Trans Biomed Eng.1991;38(2):161–7.

    第条 谷歌学者 

  25. Orozco-Arroyave JR、Hönig F、Arias-Londoño JD、Vargas Bonilla JF、Daqrouq K、Skodda S、Rusz J、Nöth E。用三种不同语言说话时自动检测帕金森病。《美国科学院学报》2016;139(1):481–500.

    第条 谷歌学者 

  26. Ozkan H.帕金森病远程诊断分类方法的比较。熵。2016;18(4):115.

    第条 数学科学网 谷歌学者 

  27. Mahnaz B,Ashkan S.基于各种声音测试的帕金森病检测的多分类框架。国际J电话申请。2016年:1-9月。

  28. Froelich W,Wróbel K,Porwik P.使用语音信号分类诊断帕金森病。医学信息技术杂志。2014;23:1642–6037.

    谷歌学者 

  29. 阿拉斯加州古普塔Sharma RK。用于帕金森病评估的人声处理和分析。医学影像健康信息杂志。2016;6(1):63–70.

    第条 谷歌学者 

  30. 基于Ozcift A.SVM特征选择的旋转森林集成分类器用于改善帕金森病的计算机辅助诊断。医学系统杂志。2012;36(2):2141–7.

    第条 谷歌学者 

  31. Yang S,Zheng F,Luo X,Cai S,Wu Y,Liu K,Wu M,Chen J,Krishnan S。使用特征降维和核密度估计有效检测帕金森病患者的发音困难。《公共科学图书馆·综合》。2014;9(2):1–10.

    谷歌学者 

  32. Shahbakhti M,Taherifar D,Sorouri A.检测帕金森病的线性和非线性语音特征。2013年生物医学工程国际会议(BMEiCON-2013);2013年,第1-3页。

  33. Avci1 D,Dogantekin A.基于遗传算法-小波核极值学习机的帕金森病专家诊断系统。帕金森病;2016: 1–9.

  34. Mekyska J,Rektorova I,Smekal Z.帕金森病言语障碍自动分析的最佳参数选择。电信和信号处理(TSP),2011年8月18日至20日第34届国际会议;2011年,第408-12页。

  35. Sakar CO,Kursun O。使用发音困难测量对帕金森病进行远程诊断。医学系统杂志。2010;34(4):591–9.

    第条 谷歌学者 

  36. Galaz Z、Mekyska J、Mzourek Z、Smekal Z、Rektorova I、Eliasova I、Kostalova M、Mrackova M和Berankova D。帕金森病患者中性、压力修饰和押韵语言的部门韵律分析。计算机方法程序生物识别。2016;127:301–17.

    第条 谷歌学者 

  37. Su M,Chuang KS。通过语音信号检测帕金森病的动态特征选择。IEEE Mtt-S 2015生物医学和医疗保健应用射频和无线技术国际微波系列研讨会。IEEE;2015

  38. Khan T,Westin J,Dougherty M.帕金森病言语清晰度分类。生物信息工程2013;33(4):35–45.

    谷歌学者 

  39. Frid A、Safra EJ、Hazan H、Lokey LL、Hilu D、Manevitz L、Ramig LO、Sapir S.使用机器学习技术直接从自然语音进行帕金森病的计算诊断。IEEE软件科学、技术和工程国际会议;2014年,第50-3页。

  40. Kaya E,Findik O,Issmail B,Arslan A.离散化方法对帕金森病诊断的影响。国际Innov计算机信息控制协会。2011;7(8):4669–78.

    谷歌学者 

  41. Benba A、Jilbab A、Hammouch A。检测帕金森病患者的最佳声学线索的杂交。复杂系统世界会议;2014年,第622-5页。

  42. Islam MS,Parvez I,Deng H,Goswami P.使用语音障碍(发音障碍)检测帕金森病的异质分类器的性能比较。信息学、电子学和视觉国际会议。IEEE;2014年,第1-7页。

  43. Naranjo L、Pérez CJ、Campos-Roca Y、Martín J.解决帕金森氏病检测的语音记录复制问题。专家系统应用。2016;46(C):286–92。

    第条 谷歌学者 

  44. Spadoto AA、Guido RC、Papa JP、Falcao AX。通过最优路径森林识别帕金森病。医学和生物学会IEEE工程国际会议。IEEE工程医学生物学会会议纪要;2010年,第6087-90页。

  45. Froelich W,Wrobel K,Porwik P。使用语音样本和基于阈值的分类诊断帕金森病。医学影像健康信息杂志。2015;5(6):1358–63.

    第条 谷歌学者 

  46. 钟JW。根据语音特征对帕金森病进行分类的算法性能比较。韩国跨国公司2016;19(2):209–14.

    第条 谷歌学者 

  47. Gok M,Murat K。检测帕金森病的K近邻算法集成。国际系统科学杂志。2015;46(6):1108–12.

    第条 数学 谷歌学者 

  48. Mandal I,Sairam N.预测帕金森病的新机器学习算法。国际系统科学杂志。2014;45(3):647–66.

    第条 数学科学网 数学 谷歌学者 

  49. Chen H-L等。使用模糊k近邻方法检测帕金森病的有效诊断系统。专家系统应用。2013年;40(1):263–71.

    第条 谷歌学者 

  50. Juan LI,Wang YPA(王永平)。基于局部均值和类全局信息的快速邻居原型选择算法。紫冬花雪宝/自动化学报。2014;40(6):1116–25.

    谷歌学者 

  51. Alhamdoosh M,Wang D.快速去相关神经网络集成随机权重。信息科学。2014;264(6):104–17.

    第条 数学科学网 数学 谷歌学者 

  52. Hattori K,Takahashi M.模式分类问题中的一种新的最近邻规则。模式识别。1999;32(3):425–32.

    第条 谷歌学者 

  53. Rico Juan JR,Iñesta JM。使用最近邻规则减少训练集大小的新排名方法。图案识别信。2012;33(5):654–60.

    第条 谷歌学者 

  54. Piyush R,Ramakrishnan S.使用区域特定体积特征和随机森林分类器进行基于扩散张量的阿尔茨海默病图像分析。国际生物工程会议2013;43:691–4.

    第条 谷歌学者 

下载参考资料

作者的贡献

HZ和YL构思了整个研究,参与了研究的设计和协调,并帮助起草了手稿。LY、YL、XZ和MQ参与了所有受试者的测量,并起草了完整的手稿。PW、JY和FY负责管理试验,并协助撰写手稿中的讨论。所有作者阅读并批准了最终手稿。

致谢

作者感谢张燕玲教授和桂丽教授提出的宝贵建议。

竞争性利益

作者声明,他们没有相互竞争的利益。

数据和支持材料的可用性

本研究中使用的数据来自帕金森语音数据集(具有多种录音类型),该数据集由Sakar等人保存,可在加州大学欧文分校(UCI)机器学习数据库网站上获得。URL如下:

http://archive.ics.uci.edu/ml/datasets/Parkinson(帕金森)+语音+数据集++多种+类型+声音+录音.

基金

本研究由国家自然科学基金资助(编号:61108086、61171089、91438104、1304382)、重庆市基础与高级研究项目(cstc2016jcyjA0043、cstc2016jcyjA0134、cstc2016jcyjA0064),重庆市社会事业和民生保障科技创新专项基金(cstc2016shmszx40002,cstc2016-shmszx130014,cstc2016 shmszX0099)、中央高校基本科研业务费(CDJZR155507)、中国博士后科学基金(2013M532153)、,四川省普通基金(14ZB0303)、达州市科技局普通基金(KJJ201401)、重庆市博士后科学专项基金、教育部回归人才研究启动基金;陆军医学技术青年训练项目(13QNP120)。

作者信息

作者和附属机构

作者

通讯作者

通信至李永明.

权利和权限

开放式访问本文根据Creative Commons Attribution 4.0 International License的条款分发(http://creativecommons.org/licenses/by/4.0/),它允许在任何媒体上不受限制地使用、分发和复制,前提是您对原始作者和来源给予适当的信任,提供知识共享许可的链接,并指明是否进行了更改。知识共享公共领域专用豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有说明。

转载和许可

关于本文

检查更新。通过CrossMark验证货币和真实性

引用这篇文章

张,HH。,Yang,L.,Liu,Y。等。使用带有语音样本的多编辑最近邻和集成学习算法对帕金森病进行分类。生物医学工程在线 15, 122 (2016). https://doi.org/10.1186/s12938-016-0242-6

下载引文

  • 收到:

  • 认可的:

  • 出版:

  • 内政部:https://doi.org/10.1186/s12938-016-0242-6

关键词