计算机应用》唯一官方网站››2023,第43卷››问题(3): 752-758.内政部:10.11772/j.issn.1001-9081.2022010053

• 人工智能 • 上一篇   

融合边特征与注意力的表格结构识别模型

吕学强1,张煜楠1,韩晶1(),崔运鹏2,李欢2  

  1. 1网络文化与数字传播北京市重点实验室(北京信息科技大学), 北京 100101
    2农业农村部农业大数据重点实验室(中国农业科学院农业信息研究所), 北京 100081
  • 收稿日期:2022-01-17 修回日期:2022-04-06 接受日期:2022-04-11 发布日期:2022-04-26 出版日期:2023-03-10
  • 通讯作者:韩晶
  • 作者简介:吕学强(1970—),男,辽宁抚顺人,教授,博士,主要研究方向:多媒体信息处理
    张煜楠(1996—),男,北京人,硕士研究生,主要研究方向:计算机视觉
    韩晶(1990—),女,河北邯郸人,助理研究员,博士,主要研究方向:图像处理
    崔运鹏(1972—),男,吉林和龙人,研究员,博士,主要研究方向:农业信息技术
    李欢(1992—),女,湖北红安人,研究员,硕士,主要研究方向:数据挖掘。
  • 基金资助:
    国家自然科学基金资助项目(62171043)

融合边缘特征和注意力的表结构识别模型

李雪强1,张云南(Yunan ZHANG)1,京汉1(),崔云鹏2,李欢2  

  1. 1网络文化与数字传播研究北京市重点实验室(北京信息科技大学),北京100101
    2农业部农业大数据重点实验室(中国农业科学院农业信息研究所),北京100081
  • 收到:2022-01-17 修订过的:2022-04-06 认可的:2022-04-11 在线:2022-04-26 出版:2023-03-10
  • 联系人:京汉
  • 关于作者:吕雪强,1970年生,博士,教授。他的研究兴趣包括多媒体信息处理。
    张云南,1996年出生,硕士研究生。他的研究兴趣包括计算机视觉。
    崔云鹏,1972年生,博士,研究员。他的研究兴趣包括农业信息技术。
    李欢,1992年生,硕士,研究员。她的研究兴趣包括数据挖掘。
  • 支持单位:
    国家自然科学基金项目(62171043)

摘要:

针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR公司首先,提出图边注意力网络(通用电气)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP公司数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR F1个百分点。在消融实验中,GEAN-TSR公司采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR公司能够有效提升网络性能,更好地完成表格结构识别任务。

关键词: 图神经网络, 图注意力网络, 特征融合, 表格结构识别, 表格解析

摘要:

针对现有表结构识别方法中存在的依赖先验知识、鲁棒性不足、表达能力不足等问题,提出了一种融合边缘特征和注意的新的表结构识别模型,即基于图边缘-注意网络的表结构识别模型(GEAN-TSR)。首先,图边缘注意网络(GEAN)提出作为主干网络,并基于边缘卷积结构,引入并改进了图注意机制,以聚集图节点特征,从而解决了图网络特征提取过程中的信息丢失问题,提高了图网络的表达能力。然后,引入边缘特征融合模块,将浅层图形节点信息与图形网络输出进行融合,以增强图形网络的局部信息提取和表达能力被集成到文本特征融合模块中,用于边缘的分类和预测。在SciTSR-COMP数据集上的对比实验表明,与现有的最优模型Split,Embed and Merge(SEM)相比,GEAN-TSR的召回率和F1分数分别提高了2.5和1.4个百分点。烧蚀实验表明,使用特征融合模块后,GEAN-TSR的各项指标均达到了最优值,证明了该模块的有效性。实验结果表明,GEAN-TSR可以有效地提高网络性能,更好地完成表结构识别任务。

关键词: 图形神经网络, 图形注意力网络, 特征融合, 表结构识别, 表解析

中图分类号: