计算机工程与应用

选择

YOLO系列目标检测算法研究进展

王临毅、白静、李文静、姜金哲

计算机工程与应用2023, 59 (14): 15-29. 内政部：10.3778/j.issn.1002-8331.2301-0081

摘要（1364）

PDF（件）（1009KB）(791）

保存

基于YOLO的算法是目标检测领域的研究热点之一。近年来，随着YOLO系列算法及其改进模型的不断提出，基于YOLO的算法在目标检测领域取得了优异的效果，并在现实中广泛应用于各个领域。本文首先介绍了典型的目标检测数据集和评价指标，回顾了YOLOv1~YOLOv 7的总体YOLO框架和目标检测算法的发展。然后，从输入、特征提取和预测三个阶段总结了数据增强、轻量级网络构建和IOU丢失优化等八个改进方向的模型及其性能。然后介绍了YOLO算法的应用领域。最后，结合目标检测的实际问题，总结并展望了基于YOLO算法的发展方向。

参考|相关文章|韵律学

选择

道路交通流数据预测方法研究综述

孟闯、王辉、林浩、李克岑、王新鹏

计算机工程与应用2023, 59 (14): 51-61. 内政部：10.3778/j.issn.102至8331.2209至0458

摘要（1281）

PDF（件）（605KB）(613）

保存

道路交通流预测作为智能交通系统的一个重要分支，在拥堵预测、路径规划中发挥着重要作用。道路交通流数据的时空多态性和复杂相关性，迫使大数据时代道路交通流预测方法的变革和升级。为了挖掘交通流的时空特征，学者们提出了各种方法，包括模型融合、模型算法改进、数据定义转换等，以提高模型的预测精度。为了合理总结各种交通流预测方法，根据使用的方法类型，将其分为三类：基于统计的方法、基于机器学习的方法和基于深度学习的方法。本文通过对各种交通流预测方法的总结，总结和分析了近年来新的模型和算法，旨在为相关研究人员提供研究思路。最后，对交通流预测方法进行了总结和展望，并给出了未来交通流预测领域的探索方向。

参考|相关文章|韵律学

选择

基于深度学习的目标检测算法研究与应用综述

张阳廷、黄德奇、王东伟、何佳佳

计算机工程与应用2023, 59 (18): 1-13. 内政部：10.3778/j.issn.1002-8331.2305-0310

摘要（1032）

PDF（件）（662KB）(622）

保存

随着深度学习的不断发展，深度卷积神经网络越来越多地应用于目标检测领域，目前已应用于农业、交通、医学等许多领域。与传统的基于特征的手工方法相比，基于深度学习的目标检测方法可以同时学习低层和高层图像特征，具有更好的检测精度和泛化能力。为了概述和总结目标检测领域的最新进展和技术，通过分析近年来基于深度学习的目标检测技术，回顾了基于深度学习的目标检测算法及其应用的现状。首先，总结了两种目标检测网络体系结构（两相和单相）的发展及其优缺点；其次，描述了骨干网、数据集和评价指标，比较了经典算法的检测精度，总结了经典目标检测算法的改进策略；最后，对目标检测应用的现阶段进行了讨论，并提出了目标检测领域未来的研究重点。

参考|相关文章|韵律学

选择

可解释人工智能综述

赵燕玉、赵晓勇、王磊、王宁宁

计算机工程与应用2023, 59 (14): 1-14. 内政部：10.3778/j.issn.1002-8331.2208-0322

摘要（911）

PDF（个）（683KB）(567）

保存

随着机器学习和深度学习的发展，人工智能技术已逐渐应用于各个领域。然而，采用人工智能的最大缺点之一是它无法解释预测的基础。模型的黑盒特性使人类不可能在医疗、金融和自动驾驶等关键任务应用场景中真正信任它们，从而限制了人工智能在这些领域的扎根应用。推动可解释人工智能（XAI）的发展已成为实现地面关键任务应用的一个重要问题。目前，国内外还缺乏对XAI相关领域的研究综述，也缺乏对因果解释方法和可解释方法评价的研究。因此，本研究首先从解释方法的特点出发，从解释类型的角度将主要的解释方法分为三类：模型依赖方法、模型依赖方法和因果解释方法，并分别进行总结和分析，然后总结了解释方法的评价，列举了可解释人工智能的应用，最后讨论了当前可解释性问题并提出了展望。

参考|相关文章|韵律学

选择

农村电子商务物流下无人机与车辆协同配送路径优化研究

徐玲、杨林超、朱文兴、钟绍军

计算机工程与应用2024, 60 (1): 310-318. 内政部：10.3778/j.issn.1002-8331.2306-0115

摘要（809）

PDF（件）（666KB）(657）

保存

无人机交付已成为解决最后一刻后勤挑战的重要解决方案。无人机和车辆之间的协作交付模型克服了无人机交付能力不足的局限性，提高了安全性，使其成为无人机参与交付过程的重要途径。为了解决农村电子商务物流“最后一刻”配送的困难和高昂成本，本研究构建了一个混合整数规划模型。目标是在考虑协作无人机车辆模式和多无人机多包裹递送等限制的同时，最大限度地降低递送成本。提出了一种两阶段算法来优化无人机协同配送路径。在第一阶段，使用约束自适应K-means算法确定车辆停靠点的范围。在第二阶段，采用改进的遗传算法，结合爬山和分裂操作员，识别无人机和车辆的最佳交付路径。随后，进行了案例研究实验，验证了模型和算法的可行性和有效性。研究结果有望为农村电子商务物流最后一刻的成本降低和效率提高提供新的见解和有价值的参考。

参考|相关文章|韵律学

选择

基于激光雷达的SLAM综述

刘明哲、徐广辉、唐唐、钱小建、耿明

计算机工程与应用2024, 60 (1): 1-14. 内政部：10.3778/j.issn.102-83312308-0455

摘要（807）

PDF（件）（854KB）(516）

保存

同步定位与映射（SLAM）是自主移动机器人和自主驾驶系统的关键技术，激光扫描仪（也称为激光雷达）作为SLAM算法的支持传感器发挥着至关重要的作用。本文全面回顾了基于激光雷达的SLAM算法。首先，介绍了基于激光雷达的SLAM的总体框架，详细说明了前端里程计、后端优化、环路闭合检测和地图构建模块的功能，并总结了所使用的算法。其次，按照2D到3D和单传感器到多传感器融合的顺序，对具有代表性的开源算法进行了描述和总结。此外，它还讨论了常用的开源数据集、精度评估指标和评估工具。最后，从深度学习、多传感器融合、多机器人协作和鲁棒性研究四个方面展望了基于激光雷达的SLAM技术的发展趋势。

参考|相关文章|韵律学

选择

改进的YOLOv7-tiny目标检测轻量级模型

刘浩翰、范一鸣、何怀清、惠康华

计算机工程与应用2023, 59 (14): 166-175. 内政部：10.3778/j.issn.1002-8331.2302-0115

摘要（791）

PDF（件）（830KB）(305）

保存

目前，目标检测算法参数多，计算复杂度高。然而，移动终端的存储容量和计算能力有限，难以部署。因此，本文针对移动终端设备提出了改进的YOLOv7-tiny。以改进的ShuffleNet v1和EALN-GS为基本构建单元，进一步提出了一种高效的骨干网络和轻量级特征融合网络。这两部分的结合可以降低计算复杂度，获得更丰富的语义信息，进一步提高检测精度。利用Mish激活函数增加非线性表达式，提高模型的泛化能力。实验结果表明，与原模型相比，改进模型的精度提高了3.3%，参数和计算数量分别减少了4.8%和13.7%，模型规模减少了8.7%。改进后的YOLOv7-tiny在保持高精度的同时减少了模型的参数和计算量，进一步提高了检测效果，并为在边缘终端设备中部署提供了可行性。

参考|相关文章|韵律学

选择

公交无人机城市物流配送模式研究

彭勇、任志

计算机工程与应用2024, 60 (7): 335-343. 内政部：10.3778/j.issn.1002-8331.2212-0252

摘要（627）

PDF（个）（755KB）(518）

保存

电子商务的快速发展，迫使物流业不断转型升级。鉴于地方政府鼓励发展公共交通，倡导绿色低碳物流配送模式，研究了无人机公交配送模式。在对问题进行解释后，建立了配送成本最低的数学模型，并设计了智能广义变量邻域搜索元启发式算法来求解该问题。同时，为了提高算法的效率，引入K-均值聚类和贪婪算法来生成初始解。首先，针对不同规模的实例，比较了各种局部搜索策略和各种算法，验证了算法的有效性。其次，以标准CVRP为例，将单车配送模式和无人机协同配送模式与公交车辅助无人机配送模式进行比较，以证明其成本和时间优势。最后，选取北京快速公交2号线及其周边客户点，通过改变公交站点间距和发车间隔进行敏感性分析，结果表明，增加站点间距的影响大于发车间隔的变化。

参考|相关文章|韵律学

选择

机器人导航路径规划算法综述

崔伟、朱发正

计算机工程与应用2023, 59 (19): 10-20. 内政部：10.3778/j.issn.1002-8331.2301-0088

摘要（584）

PDF（件）（595KB）(317）

保存

路径规划是机器人导航的关键技术之一。优秀的路径规划算法可以快速找到最佳无碰撞路径，提高操作效率。现有的大多数分类方法难以表达算法之间的差异和联系。为了更清楚地区分不同的路径规划算法，根据其原理和性质，将其分为基于图的搜索、基于仿生的、基于势场的、基于速度的和基于采样的算法。介绍了每种类型算法的概念、特点和发展现状，从单查询和多查询算法的角度分析了较为广泛使用的基于样本的算法，并对不同类型的路径规划算法的优点和问题进行了比较和总结。最后，从多机器人协作、多算法融合和自适应规划等方面展望了机器人路径规划算法的未来发展趋势。

参考|相关文章|韵律学

选择

基于机器学习的信用卡交易欺诈检测研究综述

姜洪勋、姜俊毅、梁勋

计算机工程与应用2023, 59 (21): 1-25. 内政部：10.3778/j.issn.1002-8331.2302-0129

摘要（584）

PDF（件）（674 kb）(361）

保存

机器学习在信用卡交易检测方面有其独特性，面临着更复杂的环境。由于人类智能的介入，机器学习在欺诈检测方面遇到了比人脸识别和无人驾驶更困难的挑战，如果只应用工程学科的过程，就会导致失败。本文描述了2000年以来信用卡反欺诈研究的历史；确定了面向检测的机器学习领域的定义、范围、技术流、应用程序和其他关键概念及其相互联系；分析了欺诈检测的一般架构，并从特征工程、模型/算法和评估指标方面总结了交易欺诈检测研究的最新进展；讨论了信用卡交易欺诈的各种检测算法，列举了它们的初衷、核心思想、解决方法、优缺点和相关扩展；重点介绍欺诈识别的非监督、监督和半监督学习模型，以及各种集成，如模型级联和聚合；解决了三大挑战，即海量数据、样本偏差和概念漂移，并编译了最新的进展来缓解这些问题。本文总结了机器学习在信用卡欺诈识别中的局限性、争议和挑战，并对未来的研究方向提供了趋势分析和建议。

参考|相关文章|韵律学

选择

基于多模态融合的情感分析算法综述

郭旭、迈里丹五寿尔、古兰拜尔图尔洪

计算机工程与应用2024, 60 (2): 1-18. 内政部：10.3778/j.issn.1002-8331.2305-0439

摘要（581）

PDF（件）（954KB）(423）

保存

情绪分析是一种新兴技术，旨在探索人们对实体的态度，可以应用于各种领域和场景，如产品评估分析、民意分析、心理健康分析和风险评估。传统的情感分析模型侧重于文本内容，但一些特殊的表达形式，如讽刺和夸张，很难通过文本检测出来。随着技术的不断进步，人们现在可以通过音频、图像和视频等多个渠道表达自己的观点和感受，因此情绪分析正在转向多模式，这为情绪分析带来了新的机会。多模态情感分析除了包含文本信息外，还包含丰富的视觉和听觉信息，通过融合分析可以更准确地推断隐含的情感极性（积极、中性、消极）。多模态情感分析的主要挑战是跨模态情感信息的整合；因此，本文重点研究了不同融合方法的框架和特点，描述了近年来流行的融合算法，讨论了当前小样本场景下的多模态情感分析，以及当前的发展现状、常用数据集、特征提取算法、，应用领域和挑战。预计本综述将帮助研究人员了解多模态情绪分析领域的研究现状，并启发他们开发更有效的模型。

参考|相关文章|韵律学

选择

MRI重建的深度学习方法综述

邓格文、魏国辉、马志清

计算机工程与应用2023, 59 (20): 67-76. 内政部：10.3778/j.issn.102-83312302-0057

摘要（545）

PDF（件）（580KB）(298）

保存

磁共振成像（MRI）是临床上常用的成像技术，但成像时间过长限制了其进一步发展。基于欠采样k空间数据的图像重建是加速MRI成像的重要组成部分。近年来，深度学习在MRI重建中显示出巨大的潜力，其重建结果和效率优于传统的压缩感知方法。为了梳理和总结当前基于深度学习的MRI重建方法，首先介绍了MRI重建问题的定义，然后分析了深度学习在数据驱动的端到端重建和模型驱动的展开优化重建中的应用，然后提供重建的评价指标和通用数据集，最后讨论了当前MRI重建面临的挑战和未来的研究方向。

参考|相关文章|韵律学

选择

微光图像增强研究方法综述

彭大新、郑彤、李志辉

计算机工程与应用2023, 59 (18): 14-27. 内政部：10.3778/j.issn.1002-8331.2210-0143

摘要（506）

PDF（件）（645KB）(279）

保存

微光图像增强的目的是在微光条件下恢复细节完整的图像，逐渐成为计算机图像处理研究的热点。图像成像质量对智能安防、视频监控等场景至关重要，在相关行业具有非常广阔的应用前景。为了深入研究微光图像增强，首先对传统的微光图像强化方法进行了详细的分类和分析，然后列出了基于深度学习的图像增强方法，详细介绍了所使用的各种网络和解决的问题，并对上述方法进行了比较。然后，对数据集进行了详细的分析和研究，并对一些常用的评价指标进行了简要的梳理。最后，对研究内容进行了总结，指出了当前研究的难点，并指出了未来的研究目标。

参考|相关文章|韵律学

选择

机器学习在放射分析中的应用综述

卢惠民、薛涵、王义龙、王桂增、桑鹏程

计算机工程与应用2023, 59 (17): 22-34. 内政部：10.3778/j.issn.1002-8331.2210-0435

摘要（500）

PDF（件）（5275KB）(279）

保存

放射组学是一种从标准医学图像中定量提取特征的技术。借助机器学习构建预测或诊断模型，可以提取数据并应用于临床决策支持系统，以提高诊断准确性，已广泛应用于肿瘤分期、癌症检测、生存分析等任务。综述了机器学习在辐射分析中的应用及研究进展。重点讨论了机器学习算法在辐射学分析各个阶段的适用性和局限性，并从原理和应用效果方面对具有代表性的算法进行了彻底的梳理和分析。全面介绍了辐射分析各阶段工作的评价方法。组织了公开可用的医学图像数据集和用于辐射特征提取的软件工具包。最后，讨论了机器学习在辐射学中的未来发展。

参考|相关文章|韵律学

选择

基于深度神经网络的图像修复算法

吕建峰、邵丽珍、李雪梅

计算机工程与应用2023, 59 (20): 1-12. 内政部：10.3778/j.issn.1002-8331.2303-0111

摘要（416）

PDF（件）（720KB）(424）

保存

随着深度学习的迅速发展，计算机视觉技术的应用越来越广泛。同时，基于损伤图像的已知信息的深度神经网络图像修复技术也成为了一个热门话题。对近年来基于深度神经网络的图像修复方法进行了回顾和分析。首先，从模型优化的角度对图像修复方法进行了分类和总结。然后介绍了常用的数据集和性能评价指标，并对相关数据集进行了各种基于深度神经网络的图像修复算法的性能评价和分析。最后，分析了现有图像修复方法面临的挑战，并对未来的研究工作进行了展望。

参考|相关文章|韵律学

选择

基于生物信息学的蛋白质功能预测综述

李新辉、钱玉荣、岳海涛、胡越、陈嘉莹、冷洪勇、马梦楠

计算机工程与应用2023, 59 (16): 50-62. 内政部：10.3778/j.issn.1002-8331.2212-0167

摘要（412）

PDF（件）（761 kb）(234）

保存

蛋白质功能预测任务旨在为缺失功能标签的蛋白质数据提供功能注释。随着蛋白质测序技术的发展，数据库中的蛋白质数量迅速增长，由于蛋白质数据的复杂性和多样性，蛋白质功能预测任务非常具有挑战性，受到了研究人员的密切关注。本文首先回顾了机器学习在蛋白质功能预测中的发展历史。其次，对近年来的蛋白质功能预测方法进行了分类和总结，并分析了各种算法之间的异同。最后，对蛋白质功能预测中存在的问题进行了讨论，并对该领域的未来研究进行了展望。

参考|相关文章|韵律学

选择

改进YOLOv7小目标检测算法的研究

李安达、吴瑞明、李旭东

计算机工程与应用2024, 60 (1): 122-134. 内政部：10.3778/j.issn.1002-8331.2307-0004

摘要（369）

PDF（件）（884KB）(213）

保存

随着深度学习在国内目标检测中的不断应用，传统的大中型目标检测取得了惊人的进展。然而，由于卷积网络本身的局限性，在小目标检测中仍然存在漏检和误检问题。以数据集Vissdrone 2019和数据集FloW-Img为例，研究了YOLOv7模型，并在网络结构上改进了骨干网络的ELAN模块。Focal NeXt块集成到ELAN模块的长短梯度路径中，以提高小目标的特征质量，并改进输出特征中包含的上下文信息内容。将RepLKDeXt模块引入头部网络，不仅取代了SPPCSPC模块，简化了模型的整体结构，还利用多通道、大卷积核和Cat操作优化了ELAN-H结构。最后，引入SIOU损失函数代替CIOU函数，提高了模型的鲁棒性。结果表明，改进的YOLOv7模型减少了参数数量和计算复杂度，在具有高小目标密度的Visrone 2019数据集上，其检测性能基本保持不变。它在具有小目标的稀疏FloW-Img数据集上增加了9.05个百分点，进一步简化了模型并提高了其适用性。

参考|相关文章|韵律学

选择

无人机飞行控制系统故障诊断技术综述

安雪、李少波、张一宗、张安思

计算机工程与应用2023, 59 (24): 1-15. 内政部：10.3778/j.issn.1002-8331.2305-0137

摘要（339）

PDF（件）（917KB）(1380）

保存

近年来，无人机（UAV）以其运行成本低、机动性强等独特优势，被广泛应用于各种复杂的军事和民用领域。同时，复杂多样的任务对无人机系统的可靠性和安全性提出了更高的要求。无人机故障诊断技术能够提供及时准确的诊断结果，有助于无人机的维护、维修和保养，对提高无人机的作战效能具有重要意义。因此，本文首先对无人机飞行控制系统进行了分析，并对故障进行了分类。其次，对无人机故障诊断技术的研究方法和现状进行了分析和总结。最后，讨论了无人机故障诊断技术面临的主要挑战，并指出了未来的发展方向；旨在为无人机故障诊断技术领域的研究人员提供一些参考，促进我国无人机故障检测技术水平的提高。

参考|相关文章|韵律学

选择

电动汽车充电站选址智能决策优化综述

魏冠元、王冠群、阮冠美、耿娜

计算机工程与应用2023, 59 (21): 52-65. 内政部：10.3778/j.issn.1002-8331.2302-0021

摘要（337）

PDF（件）（683KB）(208）

保存

电动汽车充电站的合理选址对推动电动汽车产业发展和城市交通战略布局具有重要作用。系统地回顾了充电站选址智能决策优化的相关文献，为充电站的未来规划提供参考。阐述了电动汽车充电站选址的基本原则和影响因素。总结了基于电动汽车出行仿真和数据分析的充电需求估算方法。介绍了基于点需求、起点对流量需求和电动汽车运行轨迹的电动汽车充电站选址模型。总结了电动汽车充电站选址模型的精确算法、启发式算法和深度学习算法。最后，讨论了现有研究的局限性，并展望了未来的研究重点和方向。

参考|相关文章|韵律学

选择

基于CNN变换器特征融合的多目标跟踪算法

张英俊、白晓辉、谢宾虹

计算机工程与应用2024, 60 (2): 180-190. 内政部：10.3778/j.issn.1002-8331.2211-0028

摘要（334）

PDF（件）（787KB）(195）

保存

在卷积神经网络（CNN）中，卷积可以有效地提取对象的局部特征，但很难捕获全局表示；在可视化Transformer中，注意机制可以捕获远距离特征依赖，但会忽略局部特征细节。为了解决上述问题，提出了一种基于CNN-transformer混合网络的多目标跟踪算法CTMOT（CNN transformer multi-object tracking），用于特征提取和融合。首先，采用基于CNN和Transformer的骨干网络，分别提取图像的局部特征和全局特征。其次，使用双向桥接模块（TBM）将这两个特性充分集成。然后，将融合后的特征输入两个并行解码器进行处理。最后，对解码器输出的检测盒和跟踪盒进行匹配，得到最终的跟踪结果，完成多目标跟踪任务。通过对MOT17、MOT20、KITTI和UA-DETRAC多目标跟踪数据集的评估，CTMOT算法的MOTA指标分别达到76.4%、66.3%、92.36%和88.57%。它相当于MOT数据集上的SOTA方法，并在KITTI数据集上实现了SOTA效果。同时，MOTP和ID指标在所有数据集上都达到了SOTA效果。此外，由于目标检测和相关是同时完成的，因此可以进行端到端的目标跟踪，跟踪速度可以达到35FPS，这表明CTMOT算法在跟踪的实时性和准确性上取得了良好的平衡，具有很大的潜力。

参考|相关文章|韵律学

选择

用于小目标检测的重构SPPCSPC和优化降采样算法

齐祥明、蔡瑞、高一萌

计算机工程与应用2023, 59 (20): 158-166. 内政部：10.3778/j.issn.1002-8331.2305-0004

摘要（326）

PDF（件）（651KB）(176）

保存

提出了一种基于YOLOv7的SPPCSPC重构和小目标优化降采样检测算法。该算法旨在解决检测图像中小目标的挑战，包括相互遮挡、复杂背景和有限数量的特征点。为了改进密集小目标的检测，对相关密集目标区域进行了增强，包括裁剪CBS层，引入SimAM注意机制，减少主干网SPPCSPC模块中的池核。这些修改允许更好地提取相互遮挡的小目标的特征。在颈部网络中，下采样结构中的SConv被SPD Conv取代，并增加了四个下采样支路。这些更改减少了特征丢失，并增加了在复杂背景中捕获小目标特征的能力。此外，网络模型的Wise-IoU损失函数取代了CIoU，它专注于一般质量帧，提高了收敛速度。在公共数据集VisDrone2021上进行了比较和消融实验，与原始YOLOv7算法相比，本文将mAP增加了5.09个百分点，FPS值达到40，参数计数减少了2.5 MB。它清楚地表明，改进后的算法在保持快速推理速度和减少参数数量的同时，显著提高了检测精度。此外，在公共数据集VOC2007+2012上进行了泛化实验，其中mAP增加了3.35个百分点，表明改进的算法具有通用性，可以应用于多种场景。

参考|相关文章|韵律学

选择

农村地区卡车和无人机协同配送路线的优化

姜丽、王红艳、梁长勇、董俊峰

计算机工程与应用2023, 59 (14): 306-314. 内政部：10.3778/j.issn.1002-8331.2204-0226

摘要（310）

PDF（件）（643KB）(259）

保存

针对农村地区交通条件差、网络覆盖率低等终端分布现状，以及农村聚落集群分布的特点，提出了基于集群的卡车和无人机路由问题。考虑到卡车和无人机之间的合作模式以及无人机的多包装配送，建立了一个混合整数规划模型，以最小化综合配送成本，并提出了一个两阶段混合蚁群算法来联合优化卡车路线和无人机路线。在第一阶段，设计了一种基于2-opt局部搜索策略的改进自适应蚁群算法来计算卡车路径。在第二阶段，使用最近聚类机制和蚁群算法计算无人机路径，并结合这两个阶段获得卡车和无人机路径的综合解。最后，通过数值算例验证了所建模型的可行性和所设计算法的有效性。该方法也为农村地区终端物流配送降低成本、提高效率提供了决策参考和依据。

参考|相关文章|韵律学

选择

改进的YOLOv8道路损伤检测算法

李松、石涛、荆方科

计算机工程与应用2023, 59 (23): 165-174. 内政部：10.3778/j.issn.1002-8331.2306-0205

摘要（309）

PDF（件）（671KB）(232）

保存

道路损坏检测是保障道路安全、实现道路损坏及时修复的重要任务。针对现有道路损伤检测算法中检测效率低、成本高、难以应用于移动终端设备等问题，提出了一种基于改进YOLOV8的轻量级道路损伤检测方法YOLOV8-Road Damage（YOLOV 8-RD）。首先，结合CNN和Transformer的优点，提出了一种能够提取道路损伤图像全局和局部特征信息的BOT模块，以适应裂纹物体的大跨度和细长特征。然后，在主干网和颈部网络的末端引入协调注意（CA），将位置信息嵌入到信道注意中，增强特征提取能力，抑制无关特征的干扰。此外，在YOLOv8颈部网络中使用C2fGhost模块，以减少特征通道融合过程中的浮点计算，减少模型参数的数量，提高特征表达性能。实验结果表明，在RDD2022数据集和道路损伤数据集中，与mAP50相比，改进算法比原算法提高了2%和3.7%，而模型参数数量仅为2.8×106，计算量仅为7.3×109，分别减少了6.7%和8.5%。该算法的检测速度达到88 FPS，能够实时准确地检测出道路损坏目标。通过与其他主流目标检测算法的比较，验证了该方法的有效性和优越性。

参考|相关文章|韵律学

选择

基于知识表示学习的知识图生成研究进展

于梦波、杜建强、罗继根、聂斌、刘勇、邱俊阳

计算机工程与应用2023, 59 (18): 59-73. 内政部：10.3778/j.issn.1002-8331.2212-0119

摘要（300）

PDF（件）（777千克）(123）

保存

知识图（KG）是一种基于图的数据结构，其中知识以三元组（头实体、关系、尾实体）的形式表示。随着人工智能的发展，知识图在智能系统推荐、问答、知识搜索等方面发挥了重要作用。然而，构建的知识图是不完整的，这影响了知识图的下游任务应用。知识图补全可以很好地解决这个问题。近年来，基于知识表示学习的知识图完成方法成为研究热点。它以表示向量的形式学习实体和关系在低维连续向量空间中的嵌入特征，旨在预测未知事实信息以完成知识图。根据知识库的不同类型，首先将其分为静态知识图完成、时态知识图完成和多模态知识图完成。其次，对这三种知识图完成方法拟解决的关键问题、设计思想、模型评价等方面进行了比较和总结。最后，展望了知识图补全的未来发展方向，为相关领域的研究人员提供参考。

参考|相关文章|韵律学

选择

单幅图像三维人脸重建方法综述

王静婷、李惠斌

计算机工程与应用2023, 59 (17): 1-21. 内政部：10.3778/j.issn.1002-8331.2210-0041

摘要（299）

PDF（件）（961KB）(290）

保存

近年来，三维人脸重建任务作为“数字人”技术的重要组成部分，受到了学术界和工业界的高度重视。特别是，通过将传统的摄像机模型、光照模型、三维人脸统计变形模型、深度卷积神经网络和深度生成模型充分结合，基于单个图像的三维人脸重建任务取得了很大进展。本文针对单幅图像三维人脸重建问题，将现有的研究工作分为基于隐式空间编码和显式空间回归的两类。第一类研究工作对基本三维人脸统计模型的基系数求解和损失函数设计进行了优化，以提高重建效果，具有人脸拓扑变化鲁棒性的优点，但缺乏细节特征。第二类研究工作在显式空间以多个数据的形式表示3D人脸，并通过深度网络直接回归，通常可以获得更个性化的3D人脸细节特征，并且对光照和遮挡等干扰因素具有更好的鲁棒性。此外，基于常用的数据集和评价指标，本文充分探讨和比较了这两类典型方法的优缺点。最后，对全文进行了总结，指出了基于单幅图像的三维人脸重建任务的主要挑战和未来发展趋势。

参考|相关文章|韵律学

选择

深度学习在结肠息肉分割中的应用综述

孙福燕、王琼、吕宗旺、龚春燕

计算机工程与应用2023, 59 (23): 15-27. 内政部：10.3778/j.issn.1002-8331.2303-0124

摘要（293）

PDF（个）（626KB）(207）

保存

大多数结直肠癌起源于结肠息肉的恶性病变。利用计算机辅助诊断系统对结肠息肉进行自动、准确的分割，可以帮助医生提高结肠镜检查中息肉的检出率，具有重要的临床意义。目前，深度学习技术被广泛应用于医学图像分割，基于深度学习的结肠息肉分割算法也取得了重大进展。首先，简要介绍了传统的息肉分割算法及其优点和局限性。其次，从基于经典CNN结构的分割模型、U-Net结构和多模型融合三个方面对深度学习息肉分割算法进行了综述，总结了该算法的改进策略及其优点和局限性。总结了结肠息肉图像的公共数据集和数据预处理方法。最后，总结了基于深度学习的息肉分割面临的挑战，并展望了该领域未来的研究方向。

参考|相关文章|韵律学

选择

图卷积神经网络及其在图像识别中的应用

李文静、白静、彭斌、杨占元

计算机工程与应用2023, 59 (22): 15-35. 内政部：10.3778/j.issn.1002-8331.2302-0273

摘要（291）

PDF（件）（803KB）(274）

保存

卷积神经网络在图像识别领域得到了广泛的应用，显示出显著的特征提取能力。然而，它天生是为处理欧几里德空间中的结构化数据而设计的，因此不太适合处理非结构化数据。为了解决这一局限性，图卷积神经网络利用光谱和空间方法来扩展卷积运算的范围，实现非欧几里德空间中的特征学习。GCN对图形数据具有平移不变性，有助于非结构化数据的表示学习。首先，阐述了基于谱域和空间域的两类图卷积神经网络的基本原理和改进工作。然后，围绕图像识别领域，介绍了图卷积神经网络在多标签图像识别、基于骨架的行为识别和高光谱图像分类中的应用，总结了研究进展，并对相关模型进行了性能比较和分析。最后，对全文的内容进行了总结，并展望了未来的发展方向。

参考|相关文章|韵律学

选择

结合Swin和多尺度特征融合的细粒度图像分类

项建文、陈敏荣、杨白冰

计算机工程与应用2023, 59 (20): 147-157. 内政部：10.3778/j.issn.1002-8331.2211-0456

摘要（276）

PDF（个）（718KB）(176）

保存

针对细粒度图像分类中类内方差高、类间方差低的问题，提出了一种基于Swin和多尺度特征融合（SwinFC）的细粒度影像分类模型。使用具有多级分层设计的Swin Transformer模型作为一种新的视觉主干网络，提取局部和全局信息以及多尺度特征。然后，在每个阶段的分支上嵌入一个集成外部依赖性注意和跨空间注意的模块，旨在捕获数据样本之间的潜在相关性和来自不同空间方向的鉴别特征信息，增强网络每个阶段的信息表示，引入特征融合模块对每个阶段提取的特征进行多尺度融合，使网络能够学习到更全面、互补和多样的特征信息。最后，为了扩大类间差异，缩小类内差异，采用特征选择模块选择重要且有鉴别能力的图像块，增强了网络的鉴别能力。实验结果表明，该方法达到了92.5%的分类准确率，在三个公共细粒度图像数据集CUB-200-2011、NABirds和WebFG-496上的分类性能分别为91.8%和85.84%，优于大多数主流方法。此外，与基准模型Swin相比，分类性能分别提高了1.4、2.6和4.86个百分点。

参考|相关文章|韵律学

选择

视频文本跨模式检索综述

陈雷、奚一萌、刘立波

计算机工程与应用2024, 60 (4): 1-20. 内政部：10.3778/j.issn.1002-8331.2306-0382

摘要（268）

PDF（件）（3662KB）(252）

保存

模式定义了数据存在的具体形式。各种模态数据类型的迅速扩展使多模态学习成为人们关注的焦点。作为该领域的一个重要分支，跨模式检索取得了显著进步，尤其是在图像和文本的集成方面。然而，与图像相反，视频封装了更丰富的模态数据数组，并提供了更广泛的信息范围。这种丰富性与用户对全面和适应性强的信息检索解决方案日益增长的需求相吻合。因此，近年来，视频文本跨模式检索已成为一个新兴的研究领域。为了深入理解视频文本跨模式检索及其最新发展，对现有的代表性方法进行了系统的回顾和总结。首先，重点分析了当前基于深度学习的单向和双向视频文本跨模式检索方法。这项分析包括对每个类别中的开创性作品进行深入探索，突出其优势和劣势。随后，讨论转向实验观点，介绍了特定于视频文本跨模式检索的基准数据集和评估指标。比较了几种标准方法在基准数据集中的性能。最后，讨论了视频文本跨模式检索的应用前景和未来的研究挑战。

参考|相关文章|韵律学

选择

Ghost-YOLOv8交通标志检测算法

熊恩杰、张荣芬、刘玉红、彭景祥

计算机工程与应用2023, 59 (20): 200-207. 内政部：10.3778/j.issn.1002-8331.2306-0032

摘要（267）

PDF（件）（564KB）(175）

保存

针对当前传统网络模型中交通标志检测精度低、检测不准确的问题，提出了一种基于YOLOv8n优化改进的Ghost-YOLOv 8交通标志检测模型。首先，用GhostConv代替某些Conv，设计一个新的C2fGhost模块代替一些C2f，降低了模型的参数，提高了模型的检测性能。其次，GAM关注机制-
在颈部增加了nim模块，增强了特征中的语义和位置信息，提高了模型的特征融合能力；然后，为了检测检测小目标时语义信息的丢失，增加了一个小目标检测层，以增强深层语义信息和浅层语义信息的结合。最后，使用GIoU边界损失函数代替原有的损失函数，改进了网络边界框架的主干。实验结果表明，改进模型在中国交通标志检测数据集TT100K中的准确度（Precision）和平均准确度平均值（mAP）分别比原模型提高9.5和6.5个百分点。模型参数数量和模型大小的减少分别为0.223×109和0.2MB。综合说明，本文的模型在提高检测精度的同时减少了模型的数量和大小，明显优于比较算法，也满足边缘计算设备的要求，具有实际应用价值。

参考|相关文章|韵律学

选择

网上课程推荐系统综述

于鹏、刘兴宇、程浩、杨家琦、陈国华、何朝波

计算机工程与应用2023, 59 (22): 1-14. 内政部：10.3778/j.issn.1002-8331.2305-0162

摘要（264）

PDF（个）（692KB）(206）

保存

网络教育的快速发展导致了在线课程数量的爆炸式增长，学习者很容易陷入“课程超载”导致的课程信息获取效率低下的境地，这推动了在线课程推荐系统的出现和发展。目前，在线课程推荐系统已经成为研究的热点，在这一领域已经提出了大量的方法，因此有必要系统地回顾和分析最新的研究进展。本文首先概述了在线课程推荐系统的基本框架和相关概念，然后重点比较分析了现有在线课程推荐中使用的各种核心推荐方法，包括基于关联规则挖掘、矩阵分解、概率模型、，深度学习、智能优化、语义计算等。最后，本文介绍了在线课程推荐系统和公共可用数据集的各种评价指标，并提出了未来的发展方向。

参考|相关文章|韵律学

选择

图形可视化布局方法的最新研究综述

杨卓、谢亚琪、陈毅、詹银伟

计算机工程与应用2023, 59 (16): 1-15. 内政部：10.3778/j.issn.1002-8331.2212-0068

摘要（263）

PDF（件）（863KB）(176）

保存

图形可视化是图形数据的直观表示。随着图形处理的广泛应用，一个良好的图形可视化可以导致对图形数据的深刻而有效的理解。然而，随着图形数据量的增长，图形可视化的布局面临着计算时间长、发现图形中重要结构和关系困难以及节点重叠和复杂边缘交叉导致的视觉混乱等挑战。因此，如何快速布局大规模图形数据，如何加强对图形中重要结构和关系的探索，如何生成图形数据的美观布局，成为亟待解决的问题。近几十年来，人们提出了各种基于应力模型和美学准则的优化方法来解决这些问题。此外，图挖掘、图嵌入和图神经网络等机器学习方法从图形数据特征的角度为图形可视化布局提供了新的替代解决方案。相比之下，机器学习方法在图形数据布局的效率和性能上都优于其他方法。本文从力导向算法、基于美学约束的方法、图挖掘算法和机器学习方法四个方面简要总结了图形可视化布局的最新研究成果。最后，讨论了图形可视化布局方法的未来发展。

参考|相关文章|韵律学

选择

农业知识图谱综述

唐文涛、胡泽林

计算机工程与应用2024, 60 (2): 63-76. 内政部：10.3778/j.issn.1002-8331.2305-0203

摘要（261）

PDF（件）（629KB）(194）

保存

知识图是大数据时代的关键技术，特别是知识工程。利用知识图强大的语义理解和知识组织能力，解决农业知识分散、无序等问题，可以解决现代农业建设中知识覆盖面不足的问题。首先，考虑到农业数据的复杂性和特殊性，介绍了农业知识图的构建方法和框架。其次，综述了农业知识图构建中的四项关键技术——本体构建、知识抽取、知识融合和知识推理的国内外研究现状。此外，还对农业知识图在决策支持、智能答疑系统和推荐系统中的系统应用进行了梳理。最后，给出了农业知识图的几个具体实例。基于农业知识图的研究现状，对其未来的研究方向进行了展望。

参考|相关文章|韵律学

选择

深度学习方法在医学CT超分辨率中的应用综述

田妙妙、张丽嘉、张少敏、赵代夫

计算机工程与应用2024, 60 (三): 44-60. 内政部：10.3778/j.issn.1002-8331.2303-0224

摘要（260）

PDF（件）（867KB）(182）

保存

图像超分辨率（SR）是计算机视觉领域提高图像分辨率的重要处理方法之一，在医学图像领域具有重要的研究意义和应用价值。高质量和高分辨率的医学CT图像在当前的临床过程中非常重要。近年来，基于深度学习的医学CT图像超分辨率重建技术取得了显著进展。本文综述了这一领域的代表性方法，并系统地回顾了医学CT图像超分辨率重建技术的发展。首先，介绍了SR的基本理论，给出了常用的评价指标。然后，重点介绍了基于深度学习的医学CT图像超分辨率重建的创新和进展，并对每种方法的主要特点和性能进行了综合比较分析。最后，讨论了医学CT图像超分辨率重建方向上的难点和挑战，并对未来的发展趋势进行了总结和展望，希望能为相关研究提供参考。

参考|相关文章|韵律学

选择

机器视觉在作物种子检测中的研究进展

王浩、朱玉华、李志辉、郑彤

计算机工程与应用2023, 59 (22): 69-83. 内政部：10.3778/j.issn.1002-8331.2303-0166

摘要（242）

PDF（件）（858KB）(147）

保存

农作物种子是农业生产的基础。种子检测作为一种重要的工具，在种子生产、贸易和利用的各个方面发挥着不可或缺的作用。然而，传统的作物种子鉴定方法效率低下，需要人力和专用测试设备的支持。相比之下，机器视觉技术可以高效、准确地模拟人类视觉功能，实现对目标的无损检测，有助于实现作物种子品种识别、分级和分类的自动化和智能化。本文首先简要介绍了机器视觉技术中的图像采集和预处理方法，并以玉米种子为例给出了当前主流的处理流程，然后具体介绍了机器视觉技术中传统机器学习和深度学习两种检测方法在作物种子检测中的应用。最后，针对玉米不健全籽粒的研究，在将其分为上述两种检测方法的同时，对其进行了具体的描述，并指出了玉米不健康籽粒检测目前存在的问题和未来的研究方向。

参考|相关文章|韵律学

选择

模糊环境下基于CNN图像增强的跨域自适应目标检测

郭莹、梁瑞林、王润敏

计算机工程与应用2023, 59 (16): 187-195. 内政部：10.3778/j.issn.1002-8331.2211-0132

摘要（234）

PDF（件）（714KB）(154）

保存

本文提出了一种基于卷积神经网络（CNN）图像增强的跨域自适应目标检测方法，解决了自主车辆视觉感知系统在雾天条件下捕获的图像质量低导致目标检测算法精度降低的问题。构建了一个端到端的目标检测网络，该网络集成了DIP（数字图像处理）和CNN自适应图像增强模块，通过自适应学习增强参数的小型CNN参数预测器来改善雾天的图像质量。此外，一个多尺度DA（域自适应）模块连接到YOLOv4骨干网，通过对抗性训练，减少了雾天条件引起的域差异，提高了雾天目标检测的准确性。在培训阶段，CNN、DA和YOLOv4以端到端的方式学习。在检测阶段，去除了CNN和DA模块，仅使用预训练权重在正常和雾天自适应检测的图像，不会增加原始网络的复杂度，从而满足自主车辆的时序要求。基于开放数据集Foggy Cityscapes的实验表明，该方法可以显著提高多雾天气下的图像质量，平均目标检测准确率提高10.4%，有效提高了多雾条件下自主车辆的目标检测能力。

参考|相关文章|韵律学

选择

深度学习优化器的发展综述

常西龙、梁坤、李文涛

计算机工程与应用2024, 60 (7): 1-12. 内政部：10.3778/j.issn.1002-8331.2307-0370

摘要（232）

PDF（件）（1327KB）(259）

保存

优化算法是通过最小化损失函数来提高深度学习模型性能的最关键因素。GPT等大型语言模型已经成为自然语言处理领域的研究热点，传统梯度下降算法的优化效果受到了限制。因此，自适应矩估计算法应运而生，其泛化能力明显优于传统优化算法。基于梯度下降、自适应梯度和自适应矩估计算法，分析了优化算法的优缺点。本文将优化算法应用于Transformer体系结构，并选择法语-英语翻译任务作为评估基准。实验表明，自适应矩估计算法可以有效提高模型在机器翻译任务中的性能。同时，讨论了优化算法的发展方向和应用。

参考|相关文章|韵律学

选择

改进的YOLOv8多尺度轻型车辆目标检测算法

张立峰、田莹

计算机工程与应用2024, 60 (三): 129-137. 内政部：10.3778/j.issn.1002-8331.2309-0145

摘要（224）

PDF（件）（713KB）(216）

保存

针对传统车辆目标检测模型存在的硬件要求高、检测精度低、重叠目标漏检率高等问题，提出了一种基于YOLOv8的改进型车辆目标检测算法RBT-YOLO。使用多尺度融合方法重建主网络。通过增加卷积运算和调整输入/输出通道数来改进BiFPN，以适应YOLOv8，增强其特征融合能力。在从颈部区域输出特征映射后，引入了一种称为“三重注意”的轻量级注意机制，以增强模型的特征提取能力。为了解决实际场景中目标高度重叠的问题，使用SoftNMS（soft non-maximum suppression）代替原NMS，使模型对候选框的处理更加温和，从而增强了模型的检测能力，提高了召回率。在Pascal VOC和MS COCO数据集上的实验结果表明，与其他经典检测模型相比，该RBT-YOLO模型的性能优于原始模型，减少了约60%的参数和计算量，mAP分别提高了2.6和3.0个百分点，在大小和精度上都优于其他经典检测模式，从而显示出较强的实用性。

参考|相关文章|韵律学

选择

基于深度元学习的少快照图像分类综述

周伯军、陈志宇

计算机工程与应用2024, 60 (8): 1-15. 内政部：10.3778/j.issn.1002-8331.2308-0271

摘要（223）

PDF（件）（1091KB）(286）

保存

深度元学习已经成为解决少数镜头分类问题的一种流行范式。综述了基于深度元学习的少镜头图像分类算法的最新进展。从问题描述入手，总结了基于深度元学习的少快照图像分类算法的分类，介绍了常用的少快照数据集和评价标准。随后，从三个方面阐述了典型模型和最新研究进展：基于模型的深度元学习方法、基于优化的深度元教育方法和基于度量的深度元教学方法。最后，对现有算法在流行公共数据集上的性能进行了分析，总结了本课题的研究热点，并讨论了其未来的研究方向。

参考|相关文章|韵律学

选择

联合学习中的攻击方法和防御机制综述

张世文、陈爽、梁伟、李仁发

计算机工程与应用2024, 60 (5): 1-16. 内政部：10.3778/j.issn.1002-8331.2306-0243

摘要（220）

PDF（件）（792KB）(247）

保存

联邦学习的攻防技术是联邦学习系统安全的核心问题。联合学习的攻防技术可以显著降低被攻击的风险，大大提高联合学习系统的安全性。深入了解联邦学习的攻击和防御技术可以推进该领域的研究，实现联邦学习的广泛应用。因此，研究联合学习的攻防技术具有重要意义。本文首先简要介绍了联合学习的概念、基本工作流程、类型以及潜在的安全问题。随后，本文介绍了联邦学习系统可能遇到的攻击，并在介绍过程中对相关研究进行了总结。然后，从联邦学习系统是否有针对性的防御措施入手，将防御措施分为两类：通用防御措施和针对性防御措施，并进行了针对性总结。最后，对联邦学习安全性的未来研究方向进行了回顾和分析，为相关研究人员在联邦学习安全方面的研究工作提供参考。

参考|相关文章|韵律学

阅读次数最多的文章