计算机科学››2018,第45卷››发行(6A): 72-74.

智能计算 • 上一篇   下一篇

汉语阅读理解中词义判断题的解答研究

谭叶1,2,武宇飞1  

  1. 山西大学计算机与信息技术学院 太原0300061
    山西大学计算智能与中文信息处理教育部重点实验室 太原0300062
  • 出版日期:2018-06-20 发布日期:2018-08-03
  • 说唱乐介:谭红叶(1971-),女,博士,副教授,主要研究方向为自然语言处理、信息检索,电子邮件:hytan_2006@126.com;武宇飞(1994-),男,硕士生,主要研究方向为中文信息处理,电子邮件:598974237@qq.com(通信作者)。
  • 基金资助:
    国家自然科学基金项目(61673248),国家高技术研究发展计划(863计划)项目(2015AA015407),国家自然科学基金青年项目(61100138,61403238,61502287),山西省回国留学人员科研项目(2013-022),山西省2012年度留学回国人员科技活动择优项目资助

汉语阅读理解中词义判断问题的回答

谭红叶1,2,吴玉飞1  

  1. 山西大学计算机与信息技术学院,太原0300061
    山西大学计算智能与中文信息处理教育部重点实验室,太原0300062
  • 在线:2018-06-20 出版:2018-08-03

摘要:阅读理解任务是在给定的单篇文本上,要求计算机根据文本的内容对相应的问题作出回答。以北京语文高考阅读理解为背景,对其中的词义判断题进行了分析与研究,提出了一个基于支持度计算的解答框架,并尝试使用语言模型、点互信息与句子相似度种方法来计算支持度。通过实验验证,种方法在真实数据集和自动构造的数据集上均有一定成效。其中,基于点互信息的支持度计算方法在真实数据集上表现最好,获得了75%项目

关键词: 词义判断, 阅读理解, 支持度

摘要:阅读理解任务要求计算机根据给定文本的测试上下文回答相关查询。本文以北京高考阅读理解为背景,研究了词义判断,提出了一个基于支持值的框架,该框架通过n-gram、PMI和句子相似来计算。实验结果表明,这三种方法对实际数据和自动数据都有很好的效果。在所有方面,基于PMI的支持值在实际数据上的性能最好,准确率达到75%。

关键词: 词义判断, 阅读理解, 支持值

中图分类号: 

  • TP391型
[1]赵红红.汉语阅读理解问答题解答研究[D] ●●●●。太原:山西大学,2016年。<br/>[2] FERRUCCI D、LEVAS A、BAGCHI S等。沃森:超越危险![J] 。人工智能,2013199-200(3):93-105。<br/>[3] PE AS A,HOVY E H,FORNER P,et al.2011年CLEF上QA4M-RE概述:机器阅读评估的问题解答[C]‖2011年跨语言评估论坛实验室和研讨会论文集,笔记本论文.2011:303-320[4]卢志茂,刘挺,李生.统计词义消歧的研究进展[J] ●●●●。2006年,34(2):333-343。<br/>[5]宗成庆.统计自然语言处理第二版[M] ●●●●。北京:清华大学出版社,2013年。<br/>[6]杨陟卓.基于上下文语境的词义消歧方法[J] ●●●●。计算机应用,2015,35(4):1006-1008。<br/>[7] 陈永生,吴海堂.通过平行文本扩大词义消歧[C]‖第二十届全国人工智能大会和第十七届人工智能创新应用大会。美国宾夕法尼亚州匹兹堡,DBLP,2005:1037-1042。<br/>[8] PILEHVAR M T,JURGENS D,NAVIGLI R.Align,Disambiguate and Walk:衡量语义相似性的统一方法[C]‖计算语言学协会会议.2013.<br/>[9] 陆伟平,黄海英.基于依赖适应度的自动知识获取词义消歧[J]。软件杂志,2013,24(10):2300-2311[10] AGIRRE E,SOROA A.基于知识的词义消歧的随机行走[M]。剑桥:麻省理工学院出版社,2014年。<br/>[11] MANNING C D,RAGHAVAN P,SCHUTZE H.信息检索导论[M]。王斌,译.北京:人民邮电出版社,2010年。<br/>[12]吴军.数学之美第二版[M] ●●●●。北京:人民邮电出版社,2014年。<br/>[13] WOODS A M.利用语言特征完成句子[C]‖计算语言学协会会议。2016:438-442。<br/>[14] 刘涛,崔毅,尹清,等.零代词分辨率大规模伪训练数据的生成与利用[J].arXiv.org/abs/1606.01603。
[1] 孙晓寒, 张莉.
基于评分区域子空间的协同过滤推荐算法
基于评级区域子空间的协同过滤推荐算法
计算机科学, 2022, 49(7): 50-56.https://doi.org/10.11896/jsjkx.210600062
[2] 邱嘉作, 熊德意.
我觉得
神经问题生成的前沿:文献综述
计算机科学, 2021, 48(6): 159-167.https://doi.org/10.11896/jsjkx.201100013
[3] 舟,舟。
基于深度学习的机器阅读理解综述
基于深度学习的机器阅读理解研究
计算机科学, 2019, 46(7): 7-12.https://doi.org/10.11896/j.issn.1002-137X.2019.07.002
[4] 刘飞龙,郝文宁,陈刚,靳大尉,宋佳星.
基于双线性函数注意力双-LSTM模型的机器阅读理解
基于双线性函数的机器阅读理解Bi-LSTM模型的注意事项
计算机科学, 2017年,44(Z6):92-96。https://doi.org/10.11896/j.issn.1002-137X.2017.6A.019
[5] 齐飞,王宁,张丽方,孙伟娟.
基于列重合度的网络表格一致性扩展
基于列重叠的一致Web表增强
计算机科学, 2017, 44(9): 208-215.https://doi.org/10.11896/j.issn.1002-137X.2017.09.039
[6] 徐卫,李晓粉,刘端阳.
基于命题逻辑的关联规则挖掘算法L-埃克拉特
基于命题逻辑的关联规则挖掘算法L-Eclat
计算机科学, 2017年,44(12):211-215。https://doi.org/10.11896/j.issn.1002-137X.2017.12.038
[7] 徐本强,谭雪微,邹丽.
基于真值支持度的直觉模糊推理方法
基于真值支持度的直觉模糊推理
计算机科学, 2016, 43(3): 68-71.https://doi.org/10.11896/j.issn.1002-137X.2016.03.013
[8] 樊兵娇,徐伟华.
获取路线
有序信息系统中基于粗糙集的证据获取与组合方法
计算机科学, 2015, 42(6): 54-56.https://doi.org/10.11896/j.issn.1002-137X.2015.06.012
[9] “”、“”、“”。
一种基于逻辑的频繁序列模式挖掘算法
基于逻辑的频繁序列模式挖掘算法
计算机科学, 2015, 42(5): 260-264.https://doi.org/10.11896/j.issn.1002-137X.2015.05.052
[10] 杨泽民.
基于时序和兴趣度约束的加权关联规则挖掘算法研究
基于时间和兴趣度约束的加权关联规则挖掘算法研究
计算机科学, 2013, 40(3): 259-262.
[11] 关晓蔷钱宇华.
基于不完备信息系统的决策树生成算法
基于不完备信息系统的决策树生成算法
计算机科学, 2012, 39(1): 156-158.
[12] 谢福鼎,周晨光,张永,杨东巍.
应用主观逻辑的无线传感器网络信任更新算法
无线传感器网络中基于主题逻辑的信任更新算法
计算机科学, 2011, 38(9): 50-54.
[13] 刘东波,卢正鼎.
模糊喇叭子句规则挖掘算法研究
模糊Horn子句规则挖掘算法研究
在这种情况下,2011, 38(9): 142-145.
[14] 郭鑫,董坚峰,周清平.
动态数据库中的频繁子树挖掘算法
从动态数据库中挖掘频繁子树
计算机科学, 2011, 38(5): 138-141.
[15] 杜永萍何明.
基于多策略的单文档问答式信息检索技术
基于多策略的单文档问答
计算机科学, 2009, 36(7): 193-196.https://doi.org/10.11896/j.issn.1002-137X.2009.07.046
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!