NLPCC/ICCPOL 2016:中国昆明
秦紫琳 , 念文雪 , 赵东燕 , 黄宣景 , 岩松峰 :
自然语言理解和智能应用——2016年NLPCC第五届CCF自然语言处理和中文计算会议,以及2016年第24届国际东方语言计算机处理会议,2016年ICCPOL,中国昆明,2016年12月2-6日,会议记录。 计算机科学课堂讲稿 10102, 施普林格 2016 ,国际标准图书编号 978-3-319-50495-7
语言计算基础
乾隆渡 , 宗成庆 , 苏克毅 :
整合结构语境和局部语境以消除词义歧义。 3-15 明华诺 , 从军论 , 刘慧丹 :
基于新闻语料库的藏语多词语识别框架。 16-26 于俊杰 , 陈文良 , 李振华 , 张敏(音) :
为资源贫乏语言构建强大的依赖关系分析器。 27-38 沈亚田 , 陈纪凡 , 黄宣景 :
双向长短时记忆与门控关联网络用于释义识别。 39-50 吴泰忠 , 刘健 , 徐日堂 , 闵古 , 顾燕辉 , 周俊生 , 威光区 :
汉语名词性复合词的句法分类和语义解释。 51-62 陈立伟(Liwei Chen) , 岩松峰 , 赵东燕 :
TDSS:一种新的信息检索词义表示框架。 63-75 杨杜 , 华远 , 于谦 :
基于词向量表示的海量文本新词发现方法。 76-88
机器翻译与多语言信息获取
李强 , 张东东 , 穆力 , 童晓 , 朱晶波 :
统计机器翻译中更好地解决单词删除问题。 91-102 黄国平 , 张佳军 , 于舟 , 宗成庆 :
SMT中一种简单、直接、有效的双语术语联合检测和单词对齐模型。 103-115 龙华钱 , 刘嘉欣 , 周国栋 , 朱乔明 :
中英文双语平行主动学习。 116-128 文和峰 , 易阳 , 李彦翠 , 夏丽 , 韩仁 :
汉语小句的英语对应单位研究。 129-140 金鹰(Jinying Kong) , 杨亚廷 , 西周 , 王磊(Lei Wang) , 小李 :
维汉神经机器翻译研究。 141-152 马青松 , 孟凡东 , 郑大齐 , 王明轩 , 伊维特·格雷厄姆 , 江文斌 , Qun Liu(刘群) :
MaxSD:通过最大相似距离优化的神经机器翻译评估度量。 153-161 邝绍辉 , 熊德义 :
用于神经机器翻译的长句自动分割。 162-174
NLP的机器学习
王亮 , 李素建 , Xinyan Xiao公司 , 柳亚娟 :
基于线索短语自动识别和BLSTM-CNN的Web文档主题分割。 177-188 王亮 , 齐丽 , 陈轩 , 李素建 :
中文微博上的性别和年龄预测多任务学习。 189-200 何志成 , 刘杰(音译) , 刘彩华 , 袁旺(音) , 艾露·尹 , 黄亚楼 :
用于独立特征学习的剔除非负矩阵分解。 201-212 廖轩义 , 广诚 :
基于词嵌入的语义变化分析。 213-223 齐丽 , 李天石 , 宝宝长 :
从词义定义中学习词义嵌入。 224-235
信息提取、问答和知识获取
川海洞 , 张佳军 , 宗成庆 , Masanori Hattori公司 , 慧迪 :
基于字符的LSTM-CRF,具有字根级特征,用于中文命名实体识别。 239-250 罗炳峰 , 岩松峰 , 郑旺(音) , 赵东燕 :
用不可靠数据改进一阶时间事实提取。 251-262 Tingming路 , 曼朱 , 高志强 :
基于集成学习和注释分类的命名实体语料库构建中减少人工工作量。 263-274 曾莹 , 杨红辉 , 岩松峰 , 郑旺(音) , 赵东燕 :
用于中文事件提取的卷积BiLSTM神经网络模型。 275至287 谢海华 , 卢晓青 , 芝糖 , 黄晓军 :
基于层次聚类的知识库实体混合检测。 288-299 谢志文 , 赵曾 , 广州 , 何婷婷 :
基于深度学习模型的知识库问题解答。 300-311 赵燕 , 南段 , 明州 , 李周军 , 建设周 :
一种用于答案选择的开放域主题预测模型。 312-323 张正宽 , 徐伟然 , 陈倩倩 :
基于跳窗卷积神经网络的联合事件提取。 324-334 Chao Lv公司 , 李丽瑶 , 岩松峰 , 赵东燕 :
用长短兴趣模型改进协同过滤。 335-346
语篇分析
小寒舍 , 平建 , 张鹏程 , 黄和彦 :
利用层次深层语义通过相互学习方法对隐含话语关系进行分类。 349-359 贾燕燕 , 岩松峰 , 罗炳峰 , 袁烨 , 刘天阳 , 赵东燕 :
基于转换的多层堆栈长短记忆语篇分析。 360-373 李浩然 , 张佳军 , 于舟 , 宗成庆 :
多视角建模和有效表征学习预测隐性话语关系。 374-386 方刚 , 王红玲 , 周国栋 :
CDT风格的端到端汉语语篇分析器。 387-398
社交媒体NLP
贾亚伟 , 景旭 , 徐忠虎 , Kai Xing公司 :
社交媒体中的事件检测和时间分析。 401-412 陶戈 , 崔磊 , 恒基 , 宝宝长 , 纸房穗 :
从文本流中发现概念级事件关联。 413-424 杨柳 , 陈宣 , 李素建 , 王亮 :
推特上追随者推荐的用户自适应模型。 425-436 顾蓓蓓 , 罗准晨 , 王欣(Xin Wang) :
谁会更多地发推? 在推特上查找信息馈送器。 437-448
短文
眉山张 , 南宇 , 傅国宏 :
汉语词性标注的离散和神经模型:比较和组合。 451-460 魏丽 , 吴云芳 , 吕雪强 :
利用语义词典中的先验知识改进词向量。 461-469 吴晶(音译) , 侯洪旭 , 沈志鹏 , 建都 , 李金亭 :
将基于注意的神经网络应用于低资源蒙古语-汉语机器翻译。 470-480 孟阳 , 李培峰 , 朱乔明 :
结构表征的句子相似性。 481-488 杨志卓 , 胡章 , 钱晨 , 红叶滩 :
使用上下文翻译进行词义消歧。 489-496 王伟华 , 飞龙包 , 高广来 :
具有丰富特征的西里尔蒙古语命名实体识别。 497-505 Chao Lv公司 , 岩松峰 , 赵东燕 :
移动商务中通过机器学习进行购买预测。 506-513 姚成贵 , 刘谦(音) , 曼朱 , 高志强 :
在远程监控关系提取中探索长尾数据。 514-522 徐波 , 林洪飞 , 赵明珍 , 杨志浩 , 王健(Jian Wang) , 张绍武 :
从健康相关的社交网络中检测潜在的药物不良反应。 523-530 特洛 , 张玉洁 , 济南旭 , 陈玉凤 :
中文依赖分析中无监督特征的迭代集成。 531-540 贡伯堂 , 高崎饶 , 董瑜(Dong Yu) , Endong Xun公司 :
单词嵌入中可以忽略虚词吗? 541-548年 邹银峰 , 纯平欧阳 , 刘永斌 , 杨晓华 , Ying Yu(英玉) :
一种基于单词共性和个性的相似度算法。 549-558 简鹏 , 杨晓华 , 春平欧阳 , 刘勇斌 :
一种改进的基于相对文档频率分布的信息增益算法。 559-567 Bin Hao先生 , 张敏(音) , 马伟志 , 孙嘉深 , 刘一群 , 马绍平 , 宣竺 , 罗恒良 :
寻找真正的人群:微博中的用户过滤。 568-574 李坤 , 柴玉梅 , 赵洪玲 , 南晓飞 , 赵月淑 :
使用递归神经网络学习识别电子健康记录中受保护的健康信息。 575-582 李俊杰 , 杨海通 , 宗成庆 :
考虑用户属性的社交媒体文本情感分类。 583-594 黄国平 , 张佳军 , 于舟 , 宗成庆 :
实时学习机器翻译的用户反馈。 595-607 李浩然 , 张佳军 , 于舟 , 宗成庆 :
GuideRank:一种用于多语言多文档摘要的引导排序图模型。 608-620 刘五英 , 王林(Lin Wang) :
基于快速语法匹配的日汉有限机器翻译。 621-630 王美嘉 , 张鹏(音译) , 宋大伟 , 王军 :
信息检索中风险评估的风险价值。 631-638 马骏(Jun Ma) , 张玉洁 , 济南旭 , 陈玉凤 :
基于随机行走N步的汉语短语获取。 639-647 薛凤喜 , 周国栋 :
基于主位-述位结构的共指解析微观模型。 648-656 张东旭 , 罗天一 , 董旺(Dong Wang) :
使用深度神经网络向LDA学习。 657-664 张东旭 , 王东 :
关系分类:CNN还是RNN? 665-675
共享任务
徐嘉明 , 郑孙聪 , 景实 , 姚一群 , 徐波 :
姿态检测的特征集和分类方法集成。 679-688 李乐 , 徐俊义 , 肖伟东 , 盛泽湖 , 海明通 :
利用外部知识和实体关系进行实体搜索。 689-700 科瑞敏 , 程浩东 , 蔡世元 , 陈建豪 :
一个灵活的实体搜索情感软件框架。 701-710 青蓉霞 , 李正华 , 赵嘉元 , 张敏(音) :
基于外部词汇和异构数据的微博客文本分词。 711-721 赖宇轩 , 杨林 , 陈嘉豪 , 岩松峰 , 赵东燕 :
基于知识库的开放领域问答系统。 722-733 周倩荣 , 龙马 , 郑振宇 , 王悦 , 王晓杰 :
带标记推理的递归神经分词。 734-743 郭少如 , 永冠 , 李茹 , 张琪(音译) :
基于组合策略的汉语单词相似度计算。 744-752 Liran Liu(刘丽然) , 石峰 , 王大玲(Daling Wang) , 张一飞 :
基于监督和半监督机器学习方法的中文微博姿态检测实证研究。 753-765 贝佳欢 , 聪章 , 黄德根(Degen Huang) , 马建军 :
结合词嵌入和语义词典进行汉语单词相似度计算。 766-777 唐仁军 , 柯章(Ke Zhang) , 沈若阳那 , 杨明浩 , 惠州 , 朱庆杰 , 詹永松 , 陶建华 :
根据中国网络直播脚本生成足球新闻。 778-789 简福 , 邱喜鹏 , 黄宣景 :
基于文档的问题解答的卷积深度神经网络。 790-797 朱丽娅 , 王文超 , 陈宇静(Yujing Chen) , 吕学强 , 周建社 :
面向体育直播文本的总结句提取研究。 798-807
短文
金晓波 , 广广庚 , 黄凯珠 , 闫志伟 :
基于领域知识的统计实体排名。 811-818 王腾(Teng Wang) , 吕雪强 , 荀马 , 孙鹏彦(Pengyan Sun) , 董志安 , 周建社 :
基于百度查询的精确实体搜索方法研究。 819-827 吴云芳 , 魏丽 :
NLPCC-ICPOL 2016共享任务概述:中文单词相似度测量。 828-839 孙庆英 , 王忠清 , 朱乔明 , 周国栋 :
探索姿态检测的各种语言特征。 840-847 柯森(Ke Sun) , 李婷婷 , 赵世奇 , 吕雅娟 , 岩松峰 , 王晓军 , 赵东燕 :
2016百度杯综述:实体搜索挑战。 848-853 亚宾冷 , 刘伟伟 , 王盛(Sheng Wang) , 王晓杰 :
针对中国微博的功能丰富的CRF细分工具。 854-861 马淑田 , 张晓勇 , 张成志 :
NLPCC 2016通过基于多种资源的集成学习共享任务汉语单词相似度测量。 862-869 王晓军 , 张建民 , 金戈瑶 , 王天明 :
2016年NLPCC-ICPOL共享任务概述:通过网络直播脚本生成体育新闻。 870-875年 刘茂福 , 乔松奇 , 胡慧君 , 韩仁 :
基于规则和模板的网络直播脚本生成体育新闻。 876-884 王林杰(Linjie Wang) , 于章 , 刘婷(Ting Liu) :
基于知识库的问题回答的深度学习方法。 885-892 南宇 , 大盘 , 眉山张 , 傅国宏 :
基于神经网络的中文微博姿态检测。 893-900 邱喜鹏 , 彭倩 , 詹氏 :
NLPCC-ICPOL 2016共享任务概述:微博客文本的中文分词。 901-906 徐瑞峰 , 于舟 , 吴东银 , 林贵 , 杜嘉晨 , 云雪 :
NLPCC共享任务4概述:中文微博中的姿态检测。 907-916 杨凤玉 , 梁干 , 李爱平 , 黄东川 , 周晓慧 , 刘红梅 :
将深度学习与信息检索结合起来进行问答。 917-925 吴方英 , 杨慕云 , 赵铁军 , 中原汉族 , 郑德全 , 赵珊珊 :
DBQA的混合方法。 926-933 王本友 , 牛佳宾 , 利群马 , 张玉华 , 张立鹏 , 李京飞 , 张鹏(音译) , 宋大伟 :
一种基于计数和嵌入特征的中文问答方法。 934-941 南区 :
NLPCC-ICPOL 2016共享任务概述:开放领域中文问答。 942-948