计算机科学››2024,第51卷››问题(5): 216-222.数字对象标识:10.11896/jsjkx.230300034

• 人工智能 • 上一篇   下一篇

基于深度多视图网络的政务事件分拨方法

李子琛1,易修文2,3,陈顺1,2,3,张钧波1,2,3,李天瑞1  

  1. 1西南交通大学计算机与人工智能学院 成都 611756
    2北京京东智能城市大数据研究院 北京 100176
    3 京东城市(北京)数字科技有限公司 北京 100176
  • 收稿日期:2023-03-05 修回日期:2023-06-13 出版日期:2024-05-15 发布日期:2024-05-08
  • 通讯作者:易修文(xiuwenyi@foxmail.com)
  • 作者简介:(zichen_li@126.com)
  • 基金资助:
    国家重点研发计划(2019YFB2103205);北京市科技新星(Z211100002121119)

基于深度多视网络的政府事件调度方法

李自晨1、易秀文2,3、陈顺1,2,3、张俊波1,2,3,李天瑞1  

  1. 1西南交通大学计算与人工智能学院,成都611756
    2京东智能城市研究中心,中国北京100176
    3京东智慧城市科技有限公司,中国北京100176
  • 收到:2023-03-05 修订过的:2023-06-13 在线:2024-05-15 出版:2024-05-08
  • 关于作者:李自晨,1997年生,研究生。他的主要研究兴趣包括城市计算和深度学习。
    易修文,1991年生,博士,数据科学家,研究员,CCF(编号45025M)成员。他的主要研究兴趣包括时空数据挖掘和深度学习。
  • 支持单位:
    国家重点研发计划(2019YFB2103205)和北京新星计划(Z211100002121119)。

摘要:12345政务服务便民热线是由各地市政府设立的专门受理热线事项的公共服务平台。随着政府信息化进程的推进,12345热线作为市民与政府交流纽带的重要性大大提高,并对事件处置的效率提出了更高的要求。针对传统事件分拨方法主要依赖于分拨人员人工操作、速度较慢、准确率不高,且需要消耗大量人力资源的问题,文中提出了一种基于深度多视图网络的政务事件分拨方法。首先,通过自监督学习训练带权重的图卷积神经网络,从历史记录中抽取事件归口-分拨部门的分拨行为特征作为事件的归口视图。其次,使用经过政务领域语料微调的BERT(误码率)模型,提取事件描述与事件标题的语义特征,得到事件的语义视图。然后,使用基于交叉注意力机制的残差网络,将事件的两种视图融合,得到事件的融合表征。最后,将融合表征输入分类器,得到事件分拨的结果。在南通市12345热线的数据集上进行实验,结果表明,所提方法在各项指标上均优于其他基线方法,能够有效提高事件分拨的效率。

关键词: 12345热线, 事件分拨, 文本分类, 多视图学习, 深度学习, 城市计算

摘要:12345政务服务便民热线是地方政府为处理热线事件而设立的公共服务平台。近年来,随着政府数字化的推进,12345热线作为公民与政府之间的沟通纽带的重要性大大提高,对事件处理效率的要求也越来越高。针对传统的事件调度方法主要依靠调度员的手动操作,速度慢、准确性低、耗费大量人力资源的问题,提出了一种基于深度多视图网络的政府事件调度方法。首先,我们通过自监督学习训练带权值的图卷积神经网络,并从历史任务记录中提取事件类别分散部门的行为表示。然后,使用经过政府领域语料库微调的BERT模型提取事件描述和事件标题的语义表示。然后,利用基于注意机制的残差网络对事件的多个视图进行融合,得到事件的融合表示。最后,将融合表示送入分类器以获得事件分派结果。在南通12345热线数据集上的实验表明,该方法在各种指标上都优于其他基线方法,可以提高事件调度的效率。

关键词: 12345热线, 事件调度, 文本分类, 多视图学习, 深度学习, 城市计算

中图分类号: 

  • TP399型
[1] DEVLIN J,CHANG M W,LEE K,等.伯特:语言理解深度双向变换器的预训练[C]//计算语言学协会北美分会2019年会议论文集。人类语言技术,2019:4171-4186。
[2] 杨泽,戴泽,杨毅,等.Xlnet:语言理解的广义自回归预训练[C]//第33届神经信息处理系统国际会议论文集.2019:5753-5763。
[3] 刘毅,OTT M,GOYAL N,等.罗伯塔:一种稳健的优化伯特预训练方法[C]//第二十届全国计算语言学会议论文集.2021:1218-1227。
[4] 郑永平,马雪莲.利用政府热线数据促进智慧治理——以广州市政府热线为例[J]。电子政务,2018(12):18-26。
[5] 赵建新,王恩,孟天刚.联系市民与城市:大城市治理中的热线与政府回应:基于北京12345政府热线的大数据分析[J]。电子政务,2021(2):2-14。
[6] PU X,LONG K,CHEN K,等.基于语义的成都热线记录短文本快速聚类方法[C]//2019 IEEE可信、自主和安全计算国际会议,普适智能与计算国际会议、云与大数据计算国际会议和网络科技大会国际会议.2019:516-521。
[7] 罗建英,邱姿,谢国强,等。基于word2vec[C]//2018网络分布式计算与知识发现国际会议的城市热线投诉文本分类模型研究。IEEE,2018年。
[8] 彭霞,李毅,司毅,等。利用12345投诉热线数据处理日常城市问题的社会感知方法[J]。计算机、环境和城市系统,2022,94:101790。
[9] LIU B.GCN-BERT和基于记忆网络的中国政府热线事件文本多标签分类[J]。IEEE接入,2022,10:109267-109276。
[10] 陈刚,舍X,陈J,等.中国政府热线的自动工单分配方法[J]。工程报告,2023,5(3):e12580。
[11] SALTON G,WONG A,YANG C S.自动索引的向量空间模型[J]。ACM通讯,1975年,18(11):613-620。
[12] LEWIS D D.Naive(Bayes)at四十:信息检索中的独立性假设[C]//第十届欧洲机器学习会议论文集.1998:4-15。
[13] JOACHIMS T.基于支持向量的文本分类ma-chines:具有许多相关特征的学习[C]//第十届欧洲机器学习会议论文集.1998:137-142。
[14] JOHNSON R,ZHANG T.用于文本分类的深金字塔卷积神经网络[C]//计算语言学协会第55届年会论文集.2017:562-570。
[15] 刘平,邱X,黄霞.基于多任务学习的递归神经网络文本分类[C]//第二十五届国际人工智能联合会议论文集.2016:2873-2879。
[16] VASWANI A,SHAZEER N,PARMAR N,et al.注意就是你所需要的一切[C]//第31届神经信息处理系统国际会议论文集.2017:6000-6010。
[17] SUN S.多视图机器学习综述[J]。神经计算与应用,2013,23:2031-2038。
[18] 吴志清,张永伟,尚磊.基于语义特征的微博多视角情感分类[J]。CAAI智能系统汇刊,2017,12(5):745-751。
[19] GØNEN M,ALPAYDIN E.多核学习算法[J]。机器学习研究杂志,2011,12:2211-2268。
[20] 张明,李涛,李毅,等.城市区域嵌入的多视图联合图表示学习[C]//第二十届国际人工智能联合会议论文集.2021:4431-4437。
[21]YAN J D,JIA C Y.基于对偶图神经网络信息融合的文本分类方法[J]。计算机科学,2022,49(8):230-236。
[22]KIPF T N,WELLING M.图卷积网络半监督分类[C]//第五届学习表征国际会议论文集.2017。
[23]VELI采科维奇P,CUCURULL G,CASANOVA A等.图形注意力网络[C]//第六届学习代表国际会议论文集.2018。
[24]SCHULMAN J,MORITZ P,LEVINE S等。使用广义优势估计的高精度连续控制[C]//第四届学习代表性国际会议论文集.2016。
[25]范伟,马毅,李强,等.用于社会推荐的图形神经网络[C]//万维网会议.2019:417-426。
[26]WU S,SUN F,ZHANG W,等.反馈系统中的图形神经网络:综述[J]。ACM计算调查,2022,55(5):1-37。
[27]何凯,张X,任S,等.图像识别的深度剩余学习[C]//IEEE计算机视觉与模式识别会议论文集.2016:770-778。
[28]JOULIN A,GRAVE E.,BOJANOWSKI P,et al.高效文本分类技巧包[C]//计算语言学协会欧洲分会第十五届会议论文集.2017:427-431。
[29]IYYER M,MANJUNATHA V,BOYD-GRABER J,et al.深层无序组合与文本分类的句法方法竞争[C]//计算语言学协会第53届年会和第七届国际自然语言处理联合会议论文集.2015:1681-1691。
[30]YANG Z,YANG D,DYER C,等.文档分类的层次注意网络[C]//计算语言学协会北美分会2016年会议论文集:人类语言技术.2016:1480-1489。
[31]CHEN G.政府热线工作订单分类Fu-sing RoBERTa和特征提取[J]。计算机与现代化,2022(6):21-26。
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!