杂志的下一篇文章
自动驾驶应用中基于实例分割融合的引导深度完成
下一篇特刊文章
FV-MViT:用于手指静脉识别的移动视觉转换器
期刊上的上一篇文章
卷积神经网络在心电分类中的去噪和傅立叶变换谱图
特刊上一篇文章
基于高斯混合模型、倒谱分析和特征遗传选择的说话人自动识别系统
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
第条

受损智能手机传感器读数对行为生物特征模型质量影响的研究

通过
帕韦·瑞布卡
1,
托马斯·拜科克(Tomasz Bąk)
1,
保罗·索贝尔
1
达米安·格泽卡
2,*
1
数字指纹,ul。波兰卡托维兹40-599 Elowna 38
2
西里西亚理工大学自动控制、电子和计算机科学学院。波兰Gliwice市Akademicka 16号,44-100
*
信件应寄给的作者。
传感器 2022,22(24), 9580;https://doi.org/10.3390/s22249580
收到的提交文件:2022年10月14日/修订日期:2022年11月28日/接受日期:2022年12月2日/发布日期:2022年12月7日
(本文属于特刊生物特征识别系统)

摘要

:
来自世界各地的网络安全公司使用最先进的技术提供最佳的恶意软件保护。近年来,行为生物测量已成为MFA(Multi-Factor Authentication)中最流行、应用最广泛的组件之一。用户体验(UX,User Experience)的有效性和缺乏影响力使得其在机密数据处理领域的分支机构中的受欢迎程度迅速增加,例如银行、保险公司、政府或军队。虽然行为生物特征方法显示出对欺诈者的高度保护,但它们容易受到输入数据质量的影响。选定的行为生物特征强烈依赖于手机IMU传感器。本文研究了数据间隙对行为生物测量模型准确性的有害影响,以针对这一问题提出适当的对策。

1.简介

根据联邦调查局2021年关于网络犯罪的报告[1]与2020年(114702起)相比,2021年向IC3(互联网犯罪投诉中心)报告的钓鱼攻击数量(241342起)翻了一番,几乎是2019年(26379起)的十倍。这些数据清楚地表明了网络钓鱼攻击的流行程度[2,]以及政府、银行和军事部门对网络钓鱼对策的需求是如何增长的。尽管许多公司和政府组织员工进行网络安全培训,但随着欺诈者攻击变得更聪明、更有针对性,账户仍在被黑客攻击[4,5]. 幸运的是,即使用户的登录名和密码是自愿提供给欺诈者的,仍然有许多方法可以保护帐户不被劫持;其中之一是行为生物识别。
智能手机传感器(例如,加速度计、磁强计、陀螺仪)在移动应用程序方面有很多应用程序,从娱乐(手机游戏)到监控用户行为(计步器、睡眠监测等)。最近,智能手机传感器在更先进的系统中得到了应用,如健康监测[6]或网络安全。随着多媒体和移动资源使用量的日益增加[7]行为生物计量学及其对网络安全的影响这一主题最近出现在许多涉及桌面和计算机的研究论文中[8]和手机[9]设备使用情况。
最新研究[10,11]已经表明,行为生物特征的使用已经成为MFA(多因素身份验证)越来越流行的一部分[12]. 在过去几年中,机密数据处理机构在实施身份盗窃对策时,更容易触及用户的行为模式(例如键盘敲击、鼠标移动或移动设备处理),因为这类数据不需要任何对用户体验有害的额外用户参与[13]. 此外,行为生物特征模型对欺诈者表现出很高的抵抗力,因为欺诈者的行为与用户的行为有很大不同;因此,用户帐户上的可疑活动(例如,大量转账)与不寻常的键盘或智能手机读数相结合可能表明存在攻击[14,15].
尽管个人用户行为生物特征模型是防止帐户劫持的有力武器,但它仍然容易受到二手设备提供的低质量数据的影响。交换手机或损坏某些传感器可能会降低欺诈检测的质量。为了保持行为生物计量认证服务的高质量,必须实施预防规则。本文比较了基于聚合加速度计和陀螺仪读数的示例性行为模型如何处理不完整的匿名用户数据。应用质量下降对策的第一阶段是将某些用户的行为数据读数标记为“低质量”,以防止数据损坏,从而将模型的分类精度降低到既定阈值以下。接下来的阶段将更加复杂,例如,提供抗传感器损坏的用户模型或应用额外的安全模式管道。
最近发表的关于行为生物特征的论文表明了人们对数据的实验态度,并介绍了一些没有涵盖现实生活中的困难的结果。以下分析提供了一个针对一家领先国家银行的行为认证的实际行业案例研究。本文涵盖了所有数据处理管道问题和某些用户数据的质量和数量问题,以及在使用多个设备和操作系统版本时遇到的困难。
在手稿的开头,介绍了数据集;然后,介绍了行为模型的数学背景(输入向量、结构、超参数等)。最后,对模型的输入向量进行人为干扰,并对其质量进行检查,以验证所提出的解决方案是否容易受到某些类型的数据缺失的影响。
作者强烈推荐熟悉的相关论文有[16]其中,研究人员提出了一项基于与设备交互的智能手机用户分类连续认证系统的建议,以及[17]提供BehavePassDB,这是一个用于移动行为生物特征解决方案基准测试的公共数据库。该数据库可用作沙箱,在输入更多数据之前测试新功能和分类算法。当考虑到用户体验时,行为生物测量在移动设备中的使用为零价格提供了可靠的安全性,许多研究人员强调保持最高质量用户体验的重要性[18]. 正是客户自己(行为生物测量网络安全解决方案涵盖的银行和其他机构)坚持让系统保持用户友好。此外,随着全球新冠肺炎疫情及其影响导致数字资源使用的严重变化,在其他安全系统出现故障的领域,行为生物学已被证明是一种高质量的网络攻击对策[19].

2.材料和方法

本研究使用的数据是从Android操作系统上运行银行应用程序的智能手机设备的加速度计和陀螺仪传感器获取的[20]来自一家领先国家银行的用户。从使用银行应用程序开始到结束收集传感器读数。在这种情况下,数据被发送到上游节点并进行实时评估。只要在会话的任何阶段检测到欺诈行为,就会向移动应用程序提供商(通常是银行的安全部门)发送警报信号。报警系统不会从历史行为配置文件中提取任何其他元数据。未存储或分析有关年龄、性别、银行历史记录、设备类型、操作系统或其他数据的信息。以下框图显示了如何组织客户端和所提供的安全系统之间的信息交换(图1):

2.1. 数据集结构

用户 u个 执行某个数字 S公司 N个 u个 名为会话的连接数 S公司 u个 (1) 通过银行应用程序与服务器连接。每个用户会话 u个 持续的时间 T型 S公司 u个 秒,由特征向量组成,其计数是由 F类 C u个 (2). 每个用户的特征向量 D类 在整个人口中由一个固定的数字组成( N个 =6)个特征 d日 (3). 用于分析的特征向量按以下方式形成:加速计x个轴线;加速计轴线;加速计z轴线;陀螺仪x个轴线;陀螺仪轴线;陀螺仪z轴。
S公司 u个 = [ 1 u个 ,   2 u个 ,   ,   k个 u个 ,   ,   S公司 N个 u个 u个 ]
u个 = [ D类 1 ,   D类 2 ,   ,   D类 F类 C u个 ]
D类 = [ d日 1 ,   d日 2 ,   ,   d日 N个 ]
为了应用用户分类,传感器从单个会话读取数据 u个 按列聚合到窗口中 W公司 间隔的 W公司 =20秒(4)。窗口向量的每个元素W公司表示存储特定间隔中所有特征向量的单个窗口。采样频率不统一,并且根据用户的设备和数据管道处理问题(例如,数据包丢失)而变化。聚合负责将数据转换为较小的块,并使其免受采样频率敏感的影响。
W公司 = [ W公司 1 ,   W公司 2 ,   ,   W公司 N个 W公司 ] ,   小时 e(电子) 第页 e(电子)   N个 W公司 = T型 S公司 u个 W公司
t吨 0 指示会话开始时间和 t吨 D类 x个 指示自以下日期起经过的时间 t吨 0 直到创建特征向量 D类 x个 (5). 单个窗口中所有特征向量的数量表示为 N个 M(M) (6).
W公司 j个 = u个 , 小时 e(电子) 第页 e(电子) t吨 D类 x个 W公司 = j个
W公司 j个 = [ 1 ,   2 ,   . ,   N个 M(M) ]
以下公式(7)–(9)显示了聚合特征向量 F类 创建时间:
W公司 j个 k个 = [ 1 ( k个 ) ,   2 ( k个 ) ,   ,   N个 M(M) ( k个 ) ]  
F类 = [ (f) 1 ,   (f) 2 ,   ,   (f) 4 N个 ]
(f) k个 = 第页 e(电子) t吨 e(电子) k个   o个 d日   4 ( W公司 j个 k个 )
聚合特征向量的总长度等于原始特征向量的长度乘以所有聚合方法的数量(8)-标准偏差、算术平均值、振幅和中位数,其表示为 4 N个 骨料的计算公式如下(10)所示:
第页 e(电子) t吨 e(电子) t吨 e(电子) ( X(X) ) = { 1 j个 = 1 ( x个 j个 μ ) 2 ,   小时 e(电子) 第页 e(电子)   μ = 1 j个 = 1 ( x个 ) , (f) o个 第页   t吨 e(电子) = 0 1 j个 = 1 ( x个 j个 ) , (f) o个 第页   t吨 e(电子) = 1 最大值 ( X(X) ) 最小值 ( X(X) ) (f) o个 第页   t吨 e(电子) = 2 x个 2   (f)     o个 d日   2 = 0 , x个 2 + x个 2 + 1 2   (f)     o个 d日   2 = 1   小时 e(电子) 第页 e(电子)   S公司 X(X) = o个 第页 t吨 ( X(X) ) (f) o个 第页   t吨 e(电子) =

2.2. 数据准备

为了确保可靠的培训和测试数据集,只有那些具有特定数量以上独特会话的用户( S公司 N个 u个 > 12 ),并考虑了可以为其建立模型的模型(未损坏的数据)。每个可行的会话都必须持续一段固定的时间 T型 S公司 n个 或更长时间( T型 S公司 u个 > T型 S公司 n个 =100 s)以确保至少 W公司 C n个 =5扇窗户持续时间 W公司 每个窗口生成一个子分数;进一步的子分数处理导致分数生成。下面的流程图显示了上述用户选择规则(图2):
在总共264个用户中,只有127个满足了要求(118个用户未满足数据量需求,19个用户未通过培训,导致生成了低质量模型)。示例性骨料W公司中显示了4个随机用户的传感器读数图3.
每个会话包含至少5个子分数,从0到1不等(表示来自分类器输出的相似性度量),以表明行为是用户喜欢的。为了正确评估课程,将M个子分数的最终得分作为其平均值进行计算(11)。只要最终分数超过用户定义的阈值(根据银行的某些业务要求进行评估),该会话就被视为欺诈(12)。
c(c) o个 第页 e(电子) = = 1 M(M) u个 b条 c(c) o个 第页 e(电子) M(M) ,   小时 e(电子) 第页 e(电子)   M(M) 5
n个 e(电子) n个 t吨 = { 0   ( u个 e(电子) 第页 ) ,   c(c) o个 第页 e(电子) < t吨 小时 第页 1   ( (f) 第页 u个 d日 t吨 e(电子) 第页 ) , (f)   c(c) o个 第页 e(电子) t吨 小时 第页
为了提供深入的数据洞察力,功能的重要性[21,22,23]对24个骨料进行了计算。使用XGBoost(eXtreme Gradient Boosting)分类算法估计特征重要性,并对其超参数进行启发式优化。[24]. 下面的箱线图(图4)显示了按平均重要性递减排序的特征重要性分布。
通过分析图2,我们可以注意到加速度计数据与平均值之间的关系,而陀螺仪提供了与标准偏差之间的最佳诊断值(较高的平均值和中值特征重要性)。这是由这些传感器提供的数据的性质造成的;根据传感器类型和聚合方法,可以看到特定的用户可区分性图5(加速计)和图6(陀螺仪)。为了提供更清晰的可视化效果,突出显示了4个随机选择的用户。

2.3. XGBoost培训

为了训练模型,用户的数据(子会话)被标记为授权会话,而考虑到其余126个用户的数据被标记为欺诈会话。随后,数据集被传递给XGBoost分类器——基于决策树的boosting估计器[25,26,27,28,29,30]其中,树被扩展为一个森林,其中每个估计器都是基于先前分类的残值。为了达到最佳模型,XGBoost的超参数针对整个人群进行了调整[31]. 用于达到最佳模型质量的方法如中的流程图所示图7该方法使用特定的超参数集训练存储在队列中的用户。在对所有用户进行训练后,计算其平均模型质量,并将其视为适应度。该过程使用不同的超参数集(来自进化算法)重复了固定次数。最佳超参数集不变,作为目标集处理。
使用进化算法优化分类器超参数,其结果显示在表1(未列出的参数设置为默认值)。进化算法从从均匀分布中随机选取6个超参数的10个随机值的种群开始,上下边界分别表示为“min”和“max”表1)并执行了10步向量交叉(选择两个不同超参数字典中的2个相等子部分并将其组合)和一个单值变异(从指定域中随机重新选择特定参数的值),每个步骤只留下顶级超参数值集。其适应度函数与分类器的目标函数相同,用公式(13)表示。在整个群体中提供最佳模型质量的向量被保留下来供进一步考虑。典型的基因型划分和突变见图8.
模型验证数据集由总数据的30%组成。为了重现真实的模型使用情况,以及防止数据泄漏,只对最近的读数进行评估。用于模型训练的目标函数由公式(13)表示,其中TP表示“真阳性”预测,TN表示“真阴性”,FP表示“假阳性”,FN表示“假阴性”:
(f) t吨 n个 e(电子) = e(电子) 日志 ( T型 T型 + F类 N个 ) 日志 ( T型 N个 T型 N个 + F类 ) 2
为了说明未损坏传感器的模型质量是什么样子的,让我们检查一下图9,根据目标函数和接收器工作特性曲线下面积(ROC-AUC)显示整个人群的模型质量分布。目标函数和接收器操作特性的值越高,模型质量越好。对模型造成的任何损坏(例如,将丢失值的数据应用于训练)都将导致这两个指标的衰减。

3.结果

通过将某些轴数据替换为零值来运行实验,以调查传感器损坏对行为生物特征模型质量的有害影响。进行这种分析的想法来源于了解模型输出是否仍然有效的必要性,这意味着行为生物测量提供的认证是可信的。对于较小的损坏(例如,一个陀螺仪轴),模型仍然可以提供有价值的信息,而删除来自所有轴的数据可能会导致模型变得完全无用。为了找到这些边界,我们考虑了两种最常见的数据收集故障:损坏传感器一个轴的数据和损坏传感器所有轴的数据。表2提供了有关平均模型质量如何因某些向量值的归零而衰减的信息。
该表明确证明,即使缺少一个轴也可能严重损害预测的质量。值得注意的是,由于数据变化,真实的负利率大幅下降,而真实的正利率几乎保持不变。这种行为会导致模型产生更多的假阳性输出,从而导致系统中出现大量虚假欺诈警报(不过,在大多数情况下,正确的用户检测是相同的)。中显示的直方图图10(灵敏度)和图11(特异性)清楚地表明了这种关系-特异性越高,模型将欺诈者归类为用户的可能性越小,敏感性越高,用户检测越可靠。

4.讨论

本文研究了用于行为生物测量的移动传感器数据的常见问题。为了正确处理错误数据(在检测特定轴上的零值时),有必要了解特定轴损坏的模型质量下降。分析结果表明,当某些传感器轴数据丢失时,用于用户身份验证的向量可能会导致模型精度大幅下降。值得注意的是,从特征重要性图和损伤影响表中得出的结论是,用户识别的最有害因素是加速度计读数的丢失(尤其是z轴-34 p.p.与原始目标函数进行比较)。这种损坏导致ROC-AUC下降与失去所有陀螺仪读数相同(ROC-AUC下降0.15)。这是由于加速度计zaxis提供用户识别数据,它非常负责指示用户持有智能手机或平板电脑的位置,以及他/她的握力如何随时间变化。另一方面,当涉及到陀螺仪时zaxis,此参数保存的用户识别数据量最低(目标函数仅下降了9 p.p.)。这可能是因为在这个轴上不存在实质性的角运动,或者因为所有的运动在整个人群中都是可重复的。

5.结论

真负比率是受影响最大的指标,这意味着该模型正确区分用户与其他人群的能力将无法很好地发挥作用,该模型将用户会话归类为欺诈会话。这种行为会引发虚假警报,严重恶化安全系统。为了防止这种情况,我们可以通过增加特异性来改变分类阈值水平,但要牺牲敏感性;然而,这种方法不会提高总体模型的准确性。这些轻微的特异性下降应通过增加分类阈值的预定义因子来补偿(这将导致目标函数的增加),而较高的下降应引起一个标志,表明评估分数无效。处理低质量模型的另一种方法是降低它们在身份验证系统中的权重。通常,通过行为生物计量学的授权使用几个模型来衡量几种类型的活动——如果我们可以评估某个模型对某些数据的质量,我们可以降低该模型在生成最终分数时所提供的贡献。另一种避免质量下降的方法是使用不同的分类器,这些分类器不太容易受到数据损坏,或者使用数据预处理方法使模型免受数据损坏。我们也可以考虑修改分类管线,即使在特定轴上只有零值,我们可以决定是评估会话还是跳过评估(例如,只有在引入特定轴损伤后,灵敏度没有下降到70%以下,特异性没有下降到60%以下时,才能运行身份验证过程)。额外的会话评估块将采用模型统计数据以及数据结构,并评估预测可靠性(图12).
值得注意的是,对模型质量下降的进一步检查可以用于估计许多与设备/用户相关的问题,例如,识别设备损坏。如果用户没有显示任何分类问题的症状,并且在一段时间后生成大量错误警报,我们可能会得出结论,传感器不再正常工作,或者存在不同的问题(例如,用户疾病或恶意软件攻击)。然而,这些假设需要进一步研究。
未来的工作将主要集中在建设高质量受损传感器处理管道上。在发生数据损坏的情况下,我们必须能够快速评估传入信息的质量,并找到检测会话劫持的有效方法,即使由于数据收集错误而丢失了最有价值的信息。
需要采取的其他研究方向应侧重于使系统免受错误数据的影响,以及通过引入新型抗噪分类器和数据处理器来提高系统的整体质量。还应该记住的是,不同的设备(键盘或鼠标)和不同的功能可能不会对分析结果做出类似的反应。应单独检查因数据丢失而导致的质量下降,并向其介绍的对策可能与针对移动设备实施的对策不同。

作者贡献

概念化,P.R。;方法、P.R.和D.G。;软件、P.R.、T.B.和P.S。;验证、P.R.和D.G。;形式分析、P.R.、T.B.和D.G。;调查,P.R。;资源,公关。;数据管理、P.R.和P.S。;书面原稿编制,P.R。;写作审查和编辑,T.B.和D.G。;可视化,P.R。;监督,D.G。;项目管理,T.B。;资金收购、P.R.、T.B.和D.G.所有作者均已阅读并同意手稿的出版版本。

基金

本文是在项目POIR.01.01-00-0082/20“基于行为生物特征和机器学习方法的用户身份验证新方法的开发和验证”下进行的,该项目由欧洲区域发展基金根据2014-2020年智能增长业务计划第1.1项措施共同资助,部分由青年研究人员法定研究基金资助,部分由波兰格利维策西里西亚理工大学自动控制、电子和计算机科学学院的法定活动资助。

机构审查委员会声明

不适用。

知情同意书

不适用。

数据可用性声明

不适用。

利益冲突

作者声明没有利益冲突。资助者在研究设计中没有任何作用;收集、分析或解释数据;在撰写手稿时,或在决定公布结果时。

工具书类

  1. 互联网犯罪报告。互联网犯罪投诉中心(IC3)。2020年。在线提供:https://www.ic3.gov/Media/PDF/AnnualReport/2020_IC3Report.PDF(2022年11月1日访问)。
  2. Desolda,G。;费罗,L.S。;Marrella,A。;Catarci,T。;网络钓鱼攻击中代价高昂的M.F.人为因素:系统文献综述。ACM计算。Surv公司。 2022,54, 173. [谷歌学者] [交叉参考]
  3. Alkhalil,Z。;休age,C。;纳瓦夫,L。;Khan,I.网络钓鱼攻击:最新综合研究和新解剖。前面。计算。科学。 2021,, 563060. [谷歌学者] [交叉参考]
  4. 沙巴兹尼扎德,H。;科里尼,F。;Rashidirad,M.,员工在网络钓鱼攻击中的行为:什么样的个人、组织和技术因素重要?J.计算。信息系统。 2021,61, 539–550. [谷歌学者] [交叉参考]
  5. Aneke,J。;阿迪托,C。;Desolda,G.帮助用户识别网络钓鱼骗局:设计网络钓鱼攻击警告界面中的解释消息。2021年9月22日至24日在西班牙马拉加举行的人机交互国际会议记录;施普林格:瑞士查姆,2021年;第403-416页。[谷歌学者] [交叉参考]
  6. Majumder,S。;Deen,M.J.健康监测和诊断用智能手机传感器。传感器 2019,19, 2164. [谷歌学者] [交叉参考] [绿色版本]
  7. Falkowski-Gilski,P.《使用移动设备消费多媒体内容:年度用户案例研究》。架构(architecture)。阿库斯特。 2020,45, 321–328. [谷歌学者] [交叉参考]
  8. Teh,附言。;特奥,A.B.J。;Yue,S.击键动力学生物统计学调查。科学。世界J。 2013,2013, 408280. [谷歌学者] [交叉参考] [绿色版本]
  9. Stylios,I。;科科拉基斯,S。;O.Thanou。;Chatzis,S.移动设备上的行为生物识别和连续用户身份验证:一项调查。信息融合 2021,66, 76–99. [谷歌学者] [交叉参考]
  10. Sahdev,S.L.公司。;辛格,S。;Kaur,N。;Siddiqui,L.《数字银行自适应身份验证的行为生物统计学——防范无瑕疵隐私》。2021年2月17日至19日在印度诺伊达举行的2021年技术和管理创新实践国际会议(ICIPTM)会议记录;第261-265页。[谷歌学者] [交叉参考]
  11. Almalki,S。;阿塞里,N。;Roy,K.使用鼠标点击流数据分析对在线连续认证和异常检测进行实证评估。申请。科学。 2021,11, 6083. [谷歌学者] [交叉参考]
  12. 奥梅托夫,A。;Bezzateev,S。;Mäkitalo,北卡罗来纳州。;安德列夫,S。;Mikkonen,T。;Koucheryavy,Y.多因素认证:一项调查。密码学 2018,2, 1. [谷歌学者] [交叉参考] [绿色版本]
  13. Chalhoub,G。;弗莱恰斯,I。;北卡罗来纳州恩塔拉。;Abu-Salma,R。;Tom,E.将用户体验纳入智能家居设备的安全和隐私设计:案例研究。2020年4月25日至30日在美国夏威夷州火奴鲁鲁举行的2020年CHI计算机系统人为因素会议的扩展摘要会议记录。[谷歌学者] [交叉参考]
  14. 松冈,K。;Irvan,M。;小林,R。;Yamaguchi,R.S.多因素认证中基于神经网络的分数融合方法。2020年3月16日至18日,美国路易斯安那州奥尔良举行的第十届ACM数据和应用程序安全与隐私会议记录。[谷歌学者] [交叉参考]
  15. 宫泽,A。;陶,T.P。;Yamaguchi,R.S.使用基于神经网络的分数融合增强的相关性进行多因素行为认证。2022年1月8日至11日,美国内华达州拉斯维加斯,IEEE第19届年度消费者通信与网络会议(CCNC)会议记录;第569-577页。[谷歌学者] [交叉参考]
  16. 罗查,R。;卡内罗,D。;科斯塔·R。;Analide,C.使用行为生物统计学在移动设备中进行连续认证。2019年6月26日至28日在西班牙阿尔维拉举行的第十届环境智能国际研讨会《环境智能——软件和应用程序会议录》;Novais,P.、Lloret,J.、Chamoso,P.,Carneiro,D.、Navarro,E.、Omatu,S.、Eds。;施普林格国际出版公司:瑞士查姆,2020年;第1006卷,第191–198页。[谷歌学者] [交叉参考]
  17. 斯特拉加佩德,G。;维拉·罗德里格斯(Vera-Rodriguez,R.)。;托洛萨纳,R。;Morales,A.BehavePassDB:移动行为生物统计学和基准评估公共数据库。模式识别。 2023,134, 109089. [谷歌学者] [交叉参考]
  18. Falkowski-Gilski,P。;Stefaánski,J.移动用户的质量期望。J.电信。技术信息。 2015,1, 15–19. [谷歌学者]
  19. Chyzhevska,M。;罗曼诺夫斯卡,N。;A.拉姆斯基。;Venger,V.公司。;Obushnyi,M.行为生物测定作为网络安全工具。2021年10月26日,乌克兰基辅,《信息和电信系统网络安全提供程序II》;第2卷,第88-97页。[谷歌学者]
  20. Falkowski-Gilski,P。;Stefannski,J.安卓操作系统:综述。特姆·J。 2015,4, 116–120. [谷歌学者]
  21. 曾戈罗,T.W。;Mahesworo,B。;布迪亚托,A。;鲍利,J。;Suparyanto,T。;Pardamean,B.在印尼结直肠癌病例表型分类模型中的重要性。计算机程序。科学。 2019,157, 313–320. [谷歌学者] [交叉参考]
  22. 陈,C。;Shi,H。;江,Z。;Salhi,A。;陈,R。;崔,X。;Yu,B.DNN-DTIs:使用XGBoost特征选择和深度神经网络改进药物-靶点相互作用预测。计算。生物医学。 2021,136, 104676. [谷歌学者] [交叉参考]
  23. 穆斯林文学硕士。;Dasril,Y.公司破产预测框架基于最具影响力的特征,使用XGBoost和堆叠集成学习。国际电工杂志。计算。工程师(IJECE) 2021,11, 5549–5557. [谷歌学者] [交叉参考]
  24. Putatunda,S。;Rama,K.XGBoost超参数优化的Hyperopt与其他方法的比较分析。2018年信号处理与机器学习国际会议论文集,2018年11月28日至30日,中国上海;第6-10页。[谷歌学者] [交叉参考]
  25. 奥古莱耶,A.A。;Wang,Q.-G.XGBoost慢性肾脏疾病诊断模型。IEEE/ACM传输。计算。生物信息。 2020,17, 2131–2140. [谷歌学者] [交叉参考]
  26. 达利瓦尔,S.S。;Nahid,A.-A。;Abbas,R.使用XGBoost的有效入侵检测系统。问询处 2018,9, 149. [谷歌学者] [交叉参考] [绿色版本]
  27. 景,X。;邹强。;严,J。;Dong,Y。;Li,B.基于mRMR-XGBoost算法的冬小麦条锈病遥感监测。远程传感器。 2022,14, 756. [谷歌学者] [交叉参考]
  28. 桑德斯,W。;李,D。;李伟(Li,W.)。;Fang,Z.N.使用极端梯度增强(XGBoost)预测洪水分期的数据驱动洪水警报系统(FAS)。 2022,14, 747. [谷歌学者] [交叉参考]
  29. 刘,Y。;Wang,H。;Fei,Y。;刘,Y。;沈,L。;庄,Z。;张欣。基于改进XGBoost的青梅酸度预测研究。传感器 2021,21, 930. [谷歌学者] [交叉参考]
  30. Shahbazi,Z。;Byun,Y.C.使用机器学习管道进行加密货币汇率预测的知识发现。传感器 2022,22, 1740. [谷歌学者] [交叉参考]
  31. 陈,J。;赵,F。;孙,Y。;Yin,Y.基于遗传算法的改进XGBoost模型。国际期刊计算。申请。Technol公司。 2020,62, 240. [谷歌学者] [交叉参考]
图1。行为生物测量安全系统的数据交换管道。
图1。行为生物测量安全系统的数据交换管道。
传感器22 09580 g001
图2。用户选择规则管道。
图2。用户选择规则管道。
传感器22 09580 g002
图3。关于加速度计平均读数的示例用户数据()和陀螺仪读数的标准偏差(b条)间隔20秒。
图3。关于加速度计平均读数的示例用户数据()和陀螺仪读数的标准偏差(b条)间隔20秒。
传感器22 09580 g003
图4。特征的聚合数据(平均值、标准偏差、中位数和幅度)的重要性x个,、和z加速度计轴和陀螺仪读数。
图4。特征的聚合数据(平均值、标准偏差、中位数和幅度)的重要性x个,、和z加速度计轴和陀螺仪读数。
传感器22 09580 g004
图5。平均()和标准偏差(b条)加速度计的x个轴(所有用户)。
图5。平均()和标准偏差(b条)加速度计的x个轴(所有用户)。
传感器22 09580 g005
图6。平均()和标准偏差(b条)陀螺仪的x个轴(所有用户)。
图6。平均()和标准偏差(b条)陀螺仪的x个轴(所有用户)。
传感器22 09580 g006
图7。表示XGBoost分类器超参数优化过程的流程图。
图7。表示XGBoost分类器超参数优化过程的流程图。
传感器22 09580 g007
图8。来自进化算法的示例性超参数子基因型。
图8。进化算法中的示例超参数子基因型。
传感器22 09580 g008
图9。所有用户的模型质量分布-目标函数()和ROC-AUC(b条).
图9。所有用户的模型质量分布-目标函数()和ROC-AUC(b条).
传感器22 09580 g009
图10。未损坏数据的用户敏感度直方图()和数据,无加速计轴z(b条).
图10。数据未损坏的用户灵敏度直方图()和数据,无加速计轴z(b条).
传感器22 09580 g010
图11。数据未损坏的用户特性直方图()和数据,无加速计轴z(b条).
图11。数据未损坏的用户特性直方图()和没有加速度计轴的数据z(b条).
传感器22 09580 g011
图12。预测质量评估管道建议。
图12。预测质量评估管道方案。
传感器22 09580 g012
表1。使用遗传算法优化XGBoost分类器超参数。
表1。使用遗传算法优化XGBoost分类器超参数。
超参数价值分钟马克斯描述
n估计量2201350弱分类器的数量(梯度增强树)
最小儿童体重727儿童所需的最小实例重量总和(hessian)
子样本0.6580.10.99训练实例的子样本比率
colsample_bytree(colsample _ bytree)0.7910.51构造每棵树时列的子采样率
reg _阿尔法0.41502权重的L1正则化项
雷格朗姆达0.56602权重上的L2正则项
表2。传感器数据损坏对平均模型质量的影响。
表2。传感器数据损坏对平均模型质量的影响。
零位特征敏感
(真阳性率)
特异性
(真阴性率)
目标函数ROC-AUC公司
无(未损坏的数据)0.780.740.720.76
加速计(x个轴)0.710.650.560.68
加速计(轴)0.700.610.500.66
加速计(z轴)0.800.430.380.61
加速计(x个,,z轴)0.710.330.140.52
陀螺仪(x个轴)0.770.610.580.69
陀螺仪(轴)0.780.600.580.69
陀螺仪(z轴)0.770.680.630.72
陀螺仪(x个,,z轴)0.770.450.380.61
出版商备注:MDPI对公布的地图和机构关联中的管辖权主张保持中立。

分享和引用

MDPI和ACS样式

Rybka,P。;Bąk,T。;索贝尔,P。;Grzechca博士。受损智能手机传感器读数对行为生物特征模型质量影响的调查。传感器 2022,22, 9580.https://doi.org/10.3390/s22249580

AMA风格

Rybka P、Bąk T、Sobel P、Grzechca D。受损智能手机传感器读数对行为生物特征模型质量影响的调查。传感器. 2022; 22(24):9580.https://doi.org/10.3390/s22249580

芝加哥/图拉宾风格

Rybka、Paweł、Tomasz Bąk、Pawes Sobel和Damian Grzechca。2022.“受损智能手机传感器读数对行为生物识别模型质量影响的调查”传感器22,24号:9580。https://doi.org/10.3390/s22249580

请注意,从2016年第一期开始,该杂志使用文章编号而不是页码。请参阅更多详细信息在这里.

文章指标

返回页首顶部