摘要

为了解决室内环境中无线电波多径效应引起的信号采集误差大的问题,首先对运动平台上携带的信号源进行频谱信号采集,提取并存储小波阈值去噪算法处理后的信号进行频谱特征提取。然后,经过数据训练和识别,将信号源以随机模式输入系统进行识别。实验结果表明,改进的模糊聚类算法(FCA)对不同模式信号源的频谱特征识别率比频谱包络提取方法(SEEM)高12.7%。

1.简介

在运动平台的室内定位中,通信信号模式在信息交换中起着关键作用。由于室内无线电波传输的特点[1]在不同的通信信号模式中,可以自动改变工作模式以调整通信时的信道[2]不平滑。定位接入点AP可以识别运动平台上的信号源,加强定位和跟踪。频谱特征识别方法是非常重要的,对于波信号的识别非常重要。传统包络谱特征提取方法[]可以优化信号源频谱特征的选择[4]有效地提高了信号源的信号检测精度。然而,SEEM算法的特征提取很容易受到实验环境的限制。当室内环境发生较大变化时,SEEM算法提取的特征数据误差较大。

FCA是一种基于模糊系统理论的聚类算法[5]. Bezdek提出FCA[6]早在1973年,它就起源于改进的早期K-means聚类算法。FCA构造的目标函数可以在划分过程中实现同一聚类中样本的最大相似性和不同聚类之间样本的最小相关性。然而,FCA聚类中心的随机性较大,容易导致局部极值[7]. 同时,当测试样本的属性相互接近时,很难对其进行分类。所有这些都需要指导分类。基于两两回归融合的改进FCA可以与FCA相结合进行模糊分类,从而提高分类效率。

利用频谱分析仪接收机接收到的空间波信号的频谱来分析信号特性的方法已经成功地应用于许多领域。目前,一些学者已经研究了室外GPS卫星信号的频谱特性[8]雷达信号和无线电信号。然而,对室内干扰信号源的频谱特性研究较少。参考中[9]将发射极调制器的畸变和功率放大器的非线性特性引入分类器的构造模型中,测试结果表明发射极信号存在频谱畸变。参考中[10]利用信号的瞬态稀疏特征作为评价模式的基础,实现了辐射源信号特征的识别。参考中[11]通过分析辐射源信号的时频特性,提取相关特征,实现瞬态特性的识别。上述研究成果意义重大,但均未涉及室内定位信号源频谱特性的研究。

3.方法

3.1. 建筑模型

为了解决室内信号源的多径效应导致信号采集误差较大的问题,首先在室内平台上采集和处理无线电信号的频谱,然后将随机信号输入系统,识别出大信号。最后,信号采集和识别系统的结构如图所示1.

已知的通信信号源由SA44B频谱分析仪采集并输入频谱识别系统。根据GSM、CDMA、DCS和PHS四种常见的通信模式,在信号检测特征提取和识别后,提取相应的频谱特征并存储在数据库中。然后,经过学习和训练,获得了较高的频谱特征识别率。在线识别阶段,将工作模式未知的信号源输入识别系统,识别后确定输出信号源的工作模式。

3.2. 信号采集与处理

该部分用于区分目标的源信号,以进行定位;室内运动平台携带的信号源的四种模式的频谱信号在室内采集。CDMA信号源的频谱具有波形平滑、峰值明显的特点,如图所示2GSM模式下信号源的频谱比CDMA模式下的频谱粗,但峰值清晰,如图所示在采集的四种频谱中,DCS工作模式的频谱最为混乱,如图所示4。在PHS模式下,通信信号频谱的峰间距离较大,因此特性更加明显,如图所示5.

显然,四种模式的频谱信号特征复杂,频谱的最佳特征参数不易选择,频谱中存在大量杂波,影响了信号源的室内定位。

为了防止边缘信息的模糊,引入了一种非线性滤波器,其中中值滤波器可以很好地保持尖锐的边缘。中值滤波处理后的信号仍然含有噪声,小波去噪方法对降低无线电波信号中的高斯白噪声效果较好。小波去噪方法[12]包括模极值去噪法、小波相关去噪法和小波阈值去噪法。传统小波硬阈值函数[13]和软阈值方法[14]模型如所示

传统的小波硬阈值函数容易产生Gibbs振荡[15]而软阈值方法由于小波系数的恒定差异,容易产生“过平滑”失真[16].

如公式所示(2),阈值调整参数, 是邻域小波系数的平均值,以及是一个正数。什么时候?,阈值函数是连续的,可以克服硬阈值不连续引起的信号振荡问题;什么时候,新的阈值函数符合硬阈值函数的特点,可以克服硬阈值,从而克服了小波系数常差引起的失真。

当阈值调整参数,新的小波阈值函数是一个软阈值函数;当阈值调整参数,新的小波阈值函数是一个硬阈值函数。通过调整参数,我们可以得到不同模式的干扰信号源的信号处理结果。在对四种模式的频谱进行去噪后,我们可以将-分数[17],如图所示6.

3.3. 信号提取的频谱特征

选择信号频谱参数以提取峰值、对应的频率、信号频谱带宽和峰度[18]将不同模式信号源传输的信号作为无线电波信号对应模式的特征参数。逐步提取信号源的CDMA、GSM、DCS和PHS不同模式的特征参数,构建无线电波信号特征识别模型所需的矢量序列。如表所示1,CDMA、GSM、DCS和PHS的四种模式分别标记为.

3.4. 类别特征分析

特征集中特征向量的长度,特征向量的个数为然后,功能集被分为模糊群。为了表示每个特征向量所属的程度独立类,算法返回聚类中心矩阵和隶属度矩阵,其中每个元素表示属于属于会员。目标函数构造如下:

获取表中的每一行特征集1作为对应的特征向量可以建造,并且是模糊聚类算法的输入矩阵。簇数设置为,模糊权重参数为,迭代次数为500,迭代停止阈值参数为通过四种模式。集群中心集和成员矩阵通过运算可以得到四种特征向量中的一种。

如公式所示(),是集群中心集,是班级的集群中心, 是模糊权重参数,是模糊聚类中的初始聚类数,根据经验,以及是特征向量的欧氏距离去班级中心.通过迭代计算,数据接近最佳聚类中心.

从成员矩阵中的数据,我们可以找到特征向量所属的行号,即类标签的隶属度。每列数据中最大值对应的行代码是特征向量所属的类别号。根据矩阵,按列计算的最大数据值出现在第一行,因此特征数据在列中在表中1属于同一类别。根据列中特征数据的最大隶属度值近似, ,,可以确定状态类标签。

可以看出,上述提取的特征数据具有明显的类别特征,能够正确区分信号源的四种模式状态特征,但分辨率不够清晰,需要构建更详细的分类器进行区分。

3.5. 分类器的建立

传统的模糊聚类分析受核函数的影响,模糊选择不具有概率意义。同时,对非线性样本进行分类也很困难。因此,对于已知的特征集,类别标记序列是, ,是权重参数。对FCA的软区间分类优化模型的功能进行了改进,构建如下:

如公式所示(5),其中是一个常量,并且是逻辑损失函数,即,.对率回归模型的引入具有输出预测标记和概率参数的优点,适用于应用中的多分类问题。

因此,它相当于在贝叶斯框架中使用最大似然方法来解决内层最大化问题[19],如所示

, ,公式(7)可以转化为

如公式所示(7),它是的一个高阶连续凸函数.根据凸优化理论中的牛顿迭代法可以得到重量可以获得。此外,假设遵循伯努利分布遵循高斯先验分布。为了消除不相关的噪声成分,得到了似然估计概率模型,如所示

为了降低模型的学习程度,使用惩罚参数引入每个权重,得到概率评价模型。

如公式所示(9),是一个稀疏概率模型,由维超参数。可以看出,基于成对回归融合的改进FCA具有估计输出预测标记和同时添加概率参数的优点。

3.6. 分类处理的优化

由于软区间FCA分类模型具有较高的预测成本,为了降低模型训练误差的过拟合风险,采用SA算法加速FCA训练过程的收敛。SA算法易于全局优化,避免了局部极值,因此可以获得更好的全局收敛性。

步骤1。初始化程序,其中初始温度,初始解向量,步长,解空间向量维3、迭代次数200和终止阈值.

第2步。FCA模型用于计算初始解,SA算法用调用作为生成新点的初始点随机,其中是一个随机数,并且已计算。

步骤3。健身由计算-折叠交叉验证,其中折叠编号设置为5,全局最优值根据.如果,它已经接受了新的解决方案。否则,新的解决方案将被概率接受,哪里是当前温度控制参数。退火函数用于控制迭代速度,退火平滑系数设置为.

步骤4。当迭代满足标准时或者迭代次数达到,程序退出,获得样本的精细分类。

3.7. 培训和测试

为了验证上述模型的分辨率和泛化能力,还使用了“保留方法”来识别和验证从不同模式信号源采集的样本。将每种模式状态分成30组进行采样,共采集120组实验数据,并提取其特征参数。为了防止数据过度训练,在每组信号特征集中随机选择100组进行模型训练。使用20组特征样本作为分类器测试的验证集,迭代次数为500,然后停止阈值,并进行模型分类计算,得到混淆状态矩阵;根据混淆状态矩阵的测试结果,正确的样本可分为表对角线累计和,共18个;总体正确识别率可达90%,能够有效识别四种工作模式的信号。

其中,识别错误的模式信号为DCS。原因是该频带内信号源的频谱特性与相邻信号频带的频谱特性相近。当检测信号源的信号强度接近相邻频带的信号强度时,会出现误判,但误判率较低。根据模型分类计算出的混淆状态矩阵如表所示2这表明,该系统能够获得足够准确的结果,用于指定的信号源信号模式识别。

4.实验结果与分析

4.1、。识别率的比较

通过SA44B频谱接收机,在室内采集室内运动平台所携带信号源的四种模式的频谱信号。为了验证SEEM算法和SA-FCA算法特征选择的准确性,进行了定量测试实验。识别率是通过提取单位特征数中正确样本的百分比来衡量的。将每单位采集的样本数设置为200,计算正确特征值与总特征值的比例,如图所示7当光谱数增加到300时,最高识别率可达93.1%。然后,SEEM算法的特征选择能力随着特征数量的增加而降低。当SA-FCA提取的特征数量增加到400个时,最大特征识别率达到96%。从识别率对比图中可以看出,所选特征的数量越多越好,当特征数量达到400个时,特征数量呈下降趋势。

4.2. 最优特征的定位精度分析

此外,将信号源的优化频谱特征值用于定位实验,以验证优化算法对定位精度的影响。传统NN算法,KNN算法[20]在室内定位实验中,对SEEM算法和改进的FCA算法进行了比较,如图所示8.改进的FCA特征选择方法在1.3的定位误差下可以达到78%m、 比SEEM算法高13%。改进的FCA特征选择方法在1.5的定位误差下可以达到83%m、 比SEEM算法高8%。

5.讨论

无线电波信号特征值的分类分析是非法信号识别的基础。FCA模型聚类是一种广泛使用的无监督学习算法的“硬化分数”方法。通过调整隶属度准则,将特征集中的单个特征向量逐一划分为聚类中心的子类别,不同类别之间的相似性最小。据此,通过对CDMA、GSM、DCS和PHS四种不同模式信号的特征进行模糊聚类识别,利用少量样本数据来测试提取无线电波信号特征值类别的有效性。

FCA是一种适用于小样本集的通用分类器,也可以扩展到多分类领域。其核心思想是建立一个超平面模型,对特征空间中的样本数据进行分类并去除特定值。难点在于分离出置信度高、区间最大的超平面近程样本。

6.结论和未来工作

针对室内运动平台承载的信号源工作模式转换导致定位误差大的问题,本文首先从无线电波信号的频谱检测和特征识别的新角度阐述了干扰信号源的特征识别,并研究了无线电波的频谱特性,经过小波阈值法的去噪处理。然后,通过改进的FCA模型分类训练和识别,效果优于包络法。最后,将识别出的频谱特征值用于定位。采用传统的NN算法、KNN算法和seem算法以及改进的FCA算法进行室内定位实验。采集到的样本识别率比较理想,基于特征数据的定位效果较好。此外,还有其他类型的信号源需要进一步研究,这需要收集大量数据来丰富识别数据库,需要在后续实验中加以改进。

数据可用性

文章中包含了用于支持本研究结果的数据。

利益冲突

作者声明,他们没有相互竞争的利益。

致谢

这项工作得到了邢台市重点研究项目基金(No.2020ZC012)和邢台市青年人才项目基金(No 2021ZZ035)的支持。