汉语阅读理解中词义判断题的解答研究

计算机科学››2018,第45卷››发行（6A）: 72-74.

汉语阅读理解中词义判断题的解答研究

谭叶^1,2,武宇飞¹

山西大学计算机与信息技术学院太原030006¹
山西大学计算智能与中文信息处理教育部重点实验室太原030006²

出版日期:2018-06-20 发布日期:2018-08-03
说唱乐介：谭红叶(1971-),女,博士,副教授,主要研究方向为自然语言处理、信息检索,电子邮件：hytan_2006@126.com;武宇飞(1994-),男,硕士生,主要研究方向为中文信息处理,电子邮件：598974237@qq.com(通信作者)。
基金资助:
国家自然科学基金项目(61673248),国家高技术研究发展计划(863计划)项目（2015AA015407），国家自然科学基金青年项目(61100138,61403238,61502287),山西省回国留学人员科研项目(2013-022),山西省2012年度留学回国人员科技活动择优项目资助

汉语阅读理解中词义判断问题的回答

谭红叶^1,2，吴玉飞¹

山西大学计算机与信息技术学院，太原030006¹
山西大学计算智能与中文信息处理教育部重点实验室，太原030006²

在线：2018-06-20 出版：2018-08-03

摘要/摘要

摘要：阅读理解任务是在给定的单篇文本上,要求计算机根据文本的内容对相应的问题作出回答。以北京语文高考阅读理解为背景,对其中的词义判断题进行了分析与研究,提出了一个基于支持度计算的解答框架,并尝试使用语言模型、点互信息与句子相似度三种方法来计算支持度。通过实验验证,三种方法在真实数据集和自动构造的数据集上均有一定成效。其中,基于点互信息的支持度计算方法在真实数据集上表现最好,获得了75%项目

关键词: 词义判断, 阅读理解, 支持度

摘要：阅读理解任务要求计算机根据给定文本的测试上下文回答相关查询。本文以北京高考阅读理解为背景，研究了词义判断，提出了一个基于支持值的框架，该框架通过n-gram、PMI和句子相似来计算。实验结果表明，这三种方法对实际数据和自动数据都有很好的效果。在所有方面，基于PMI的支持值在实际数据上的性能最好，准确率达到75%。

关键词： 词义判断，阅读理解，支持值

中图分类号:

TP391型

谭红叶, 武宇飞.汉语阅读理解中词义判断题的解答研究[J] ●●●●。计算机科学, 2018年，45（6A）：72-74。https://doi.org/

谭红叶，吴玉飞。汉语阅读理解中词义判断问题的回答[J] ●●●●。计算机科学，2018，45（6A）：72-74。https://doi.org/

参考文献

[1]赵红红.汉语阅读理解问答题解答研究[D] ●●●●。太原:山西大学,2016年。 [2] FERRUCCI D、LEVAS A、BAGCHI S等。沃森：超越危险！[J] 。人工智能，2013199-200（3）：93-105。 [3] PE AS A，HOVY E H，FORNER P，et al.2011年CLEF上QA4M-RE概述：机器阅读评估的问题解答[C]‖2011年跨语言评估论坛实验室和研讨会论文集，笔记本论文.2011:303-320[4]卢志茂,刘挺,李生.统计词义消歧的研究进展[J] ●●●●。，2006年，34（2）：333-343。 [5]宗成庆.统计自然语言处理第二版[M] ●●●●。北京:清华大学出版社,2013年。 [6]杨陟卓.基于上下文语境的词义消歧方法[J] ●●●●。计算机应用,2015,35（4）：1006-1008。 [7] 陈永生，吴海堂.通过平行文本扩大词义消歧[C]‖第二十届全国人工智能大会和第十七届人工智能创新应用大会。美国宾夕法尼亚州匹兹堡，DBLP，2005:1037-1042。 [8] PILEHVAR M T，JURGENS D，NAVIGLI R.Align，Disambiguate and Walk:衡量语义相似性的统一方法[C]‖计算语言学协会会议.2013. [9] 陆伟平，黄海英.基于依赖适应度的自动知识获取词义消歧[J]。软件杂志，2013,24（10）：2300-2311[10] AGIRRE E，SOROA A.基于知识的词义消歧的随机行走[M]。剑桥：麻省理工学院出版社，2014年。 [11] MANNING C D，RAGHAVAN P，SCHUTZE H.信息检索导论[M]。王斌,译.北京:人民邮电出版社,2010年。 [12]吴军.数学之美第二版[M] ●●●●。北京:人民邮电出版社,2014年。 [13] WOODS A M.利用语言特征完成句子[C]‖计算语言学协会会议。2016:438-442。 [14] 刘涛，崔毅，尹清，等.零代词分辨率大规模伪训练数据的生成与利用[J].arXiv.org/abs/1606.01603。

相关文章15

[1]	孙晓寒, 张莉. 基于评分区域子空间的协同过滤推荐算法基于评级区域子空间的协同过滤推荐算法计算机科学, 2022, 49(7): 50-56.https://doi.org/10.11896/jsjkx.210600062
[2]	邱嘉作, 熊德意. 我觉得神经问题生成的前沿：文献综述计算机科学, 2021, 48(6): 159-167.https://doi.org/10.11896/jsjkx.201100013
[3]	舟，舟。基于深度学习的机器阅读理解综述基于深度学习的机器阅读理解研究计算机科学, 2019, 46(7): 7-12.https://doi.org/10.11896/j.issn.1002-137X.2019.07.002
[4]	刘飞龙,郝文宁,陈刚,靳大尉,宋佳星. 基于双线性函数注意力双-LSTM模型的机器阅读理解基于双线性函数的机器阅读理解Bi-LSTM模型的注意事项计算机科学, 2017年，44（Z6）：92-96。https://doi.org/10.11896/j.issn.1002-137X.2017.6A.019
[5]	齐飞,王宁,张丽方,孙伟娟. 基于列重合度的网络表格一致性扩展基于列重叠的一致Web表增强计算机科学, 2017, 44(9): 208-215.https://doi.org/10.11896/j.issn.1002-137X.2017.09.039
[6]	徐卫,李晓粉,刘端阳. 基于命题逻辑的关联规则挖掘算法L-埃克拉特基于命题逻辑的关联规则挖掘算法L-Eclat 计算机科学, 2017年，44（12）：211-215。https://doi.org/10.11896/j.issn.1002-137X.2017.12.038
[7]	徐本强,谭雪微,邹丽. 基于真值支持度的直觉模糊推理方法基于真值支持度的直觉模糊推理计算机科学, 2016, 43(3): 68-71.https://doi.org/10.11896/j.issn.1002-137X.2016.03.013
[8]	樊兵娇,徐伟华. 获取路线有序信息系统中基于粗糙集的证据获取与组合方法计算机科学, 2015, 42(6): 54-56.https://doi.org/10.11896/j.issn.1002-137X.2015.06.012
[9]	“”、“”、“”。一种基于逻辑的频繁序列模式挖掘算法基于逻辑的频繁序列模式挖掘算法计算机科学, 2015, 42(5): 260-264.https://doi.org/10.11896/j.issn.1002-137X.2015.05.052
[10]	杨泽民. 基于时序和兴趣度约束的加权关联规则挖掘算法研究基于时间和兴趣度约束的加权关联规则挖掘算法研究计算机科学, 2013, 40(3): 259-262.
[11]	关晓蔷钱宇华. 基于不完备信息系统的决策树生成算法基于不完备信息系统的决策树生成算法计算机科学, 2012, 39(1): 156-158.
[12]	谢福鼎,周晨光,张永,杨东巍. 应用主观逻辑的无线传感器网络信任更新算法无线传感器网络中基于主题逻辑的信任更新算法计算机科学, 2011, 38(9): 50-54.
[13]	刘东波，卢正鼎. 模糊喇叭子句规则挖掘算法研究模糊Horn子句规则挖掘算法研究在这种情况下，2011, 38(9): 142-145.
[14]	郭鑫，董坚峰,周清平. 动态数据库中的频繁子树挖掘算法从动态数据库中挖掘频繁子树计算机科学, 2011, 38(5): 138-141.
[15]	杜永萍何明. 基于多策略的单文档问答式信息检索技术基于多策略的单文档问答计算机科学, 2009, 36(7): 193-196.https://doi.org/10.11896/j.issn.1002-137X.2009.07.046

韵律学

已查看

全文

摘要

引用

共享

讨论