研究论文 在上共享 具有数学表达式结构的数学文档分类作者:时典 铃木和Atsushi公司 藤饭作者信息和声明JCDL’17:第17届ACM/IEEE数字图书馆联合会议记录2017年6月页119-128出版:2017年6月19日 出版历史 获取引文提醒新增引文提醒!此警报已成功添加,将发送到:只要您选择的记录被引用,您就会收到通知。新引文提醒!拜托登录到您的帐户 获取访问权限目录JCDL’17:第17届ACM/IEEE数字图书馆联合会议记录具有数学表达式结构的数学文档分类页119-128以前的文章基于合成数据集的文本提取软件基准测试上一个下一篇文章使用Apache Spark平台对短的非结构化数据进行分类下一步摘要工具书类信息和贡献者文献计量学和引文获取访问权限工具书类媒体桌子分享摘要数学文档用于数学交流,例如在线问答社区中的数学论文和讨论。数学文档分类(MDC)是将数学文档分类为数学类别的任务,例如概率论和集合论。这是最近广泛使用的数字图书馆和存档服务中支持用户搜索的一项重要任务。尽管数学表达式(ME)在文档中可以为分类提供基本信息,特别是在数学领域,尚未开发出使用ME进行MDC的方法。在本文中,我们提出了一种基于文本并结合小微结构的分类方法,假设小微结构反映了特定于类别的约定和规则。我们还介绍了为评估MDC系统而构建的文档集合,以及对类别设置及其统计信息的调查。我们展示了分类结果,并且我们提出的方法优于现有的基于F-测度的ME建模方法。工具书类[1]Akiko Aizawa和Michael Kohlhase。2013.NTCIR-10数学试点任务概述。在第十届NTCIR会议记录。654--661.谷歌学者[2]Akiko Aizawa、Michael Kohlhase和Iadh Ounis。NTCIR-11数学-2任务概述。在第11届NTCIR会议记录。88--98.谷歌学者[3]西蒙·巴瑟尔、萨沙·特尼斯和沃尔夫·蒂洛·巴尔克。2013年,数学文献分类大规模实验。在第十五届亚太数字图书馆国际会议论文集。83--92.数字图书馆谷歌学者[4]迈克尔·柯林斯和奈杰尔·达菲。2002年,用于解析和标记的新排名算法:离散结构上的核和投票感知器。在计算语言学协会第40届年会论文集。263--270.数字图书馆谷歌学者[5]彼得·格拉夫。替换树索引。技术报告。Max-Planck-Institut für Informatik公司。谷歌学者[6]Shahab Kamali和Frank Wm。汤帕。2010年,一个新的数学检索系统。在第19届ACM信息和知识管理国际会议记录。1413--1416.数字图书馆谷歌学者[7]Shahab Kamali和Frank Wm。汤帕。2013.检索包含数学内容的文档。在第36届ACM SIGIR信息检索研究与开发国际会议记录。353--362.数字图书馆谷歌学者[8]迈克尔·科尔哈斯和伊昂·苏坎。2006.数学公式搜索引擎。在第八届国际人工智能和符号计算会议记录。241--253.数字图书馆谷歌学者[9]巴凡·库马尔(Pavan P.Kumar)、阿伦·阿加瓦尔(Arun Agarwal)和查克拉瓦西·巴格瓦蒂(Chakravarthy Bhagvati)。2012.基于结构的数学表达式检索方法。在第六届人工智能多学科趋势国际研讨会论文集。23--34.谷歌学者[10]Ken Lang.1995年。NewsWeeder:学习过滤网络新闻。在第十二届国际机器学习会议记录。331--339.数字图书馆谷歌学者[11]大卫·D·刘易斯(David D.Lewis)、杨一鸣(Yiming Yang)、托尼·G·罗斯(Tony G.Rose)和范丽(Fan Li),2004年。RCV1:文本分类研究的新基准集合。机器学习研究杂志5 (2004), 361--397.数字图书馆谷歌学者[12]林晓燕、高良才、胡宣、唐志刚、肖英南和刘晓忠。2014.版面展示中公式的数学检索系统。在第37届ACM SIGIR信息检索研究与开发国际会议记录。697--706.数字图书馆谷歌学者[13]Martin Líška、Petr Sojka、Michal Růžička和Petr Mravec。2011.数学检索的Web界面和集合:WebMIaS和MREC。在2011年第四届DML数字数学图书馆研讨会论文集。77--84.谷歌学者[14]布鲁斯·米勒和阿卜杜·优素福。2003.数学函数数字图书馆的技术方面。数学与人工智能年鉴38, 1 (2003), 121--136.数字图书馆谷歌学者[15]Robert Miner和Rajesh Munavalli。2007.通过查询公式化和数据规范化进行数学搜索的方法。在第六届数学知识管理国际会议论文集。342--355.数字图书馆谷歌学者[16]亚历山德罗·莫希蒂(Alessandro Moschitti)。2006.依赖和组成语法树的高效卷积核。在第17届欧洲机器学习会议记录。318--329.数字图书馆谷歌学者[17]亚历山德罗·莫希蒂(Alessandro Moschitti)和罗伯托·巴西利(Roberto Basili)。文本分类的复杂语言特征:一项综合研究。在第26届欧洲红外研究会议记录。181--196.交叉引用谷歌学者[18]Tam T Nguyen、Kuiyu Chang和Siu Cheung Hui。2012.数学问答系统的数学软件搜索引擎。在第21届ACM信息和知识管理国际会议记录。724--733.数字图书馆谷歌学者[19]Tam T Nguyen、Siu Cheung Hui和Kuiyu Chang。2012.专家系统与应用使用形式概念分析进行数学搜索的基于格的方法。带应用程序的专家系统39, 5 (2012), 5820--5828.数字图书馆谷歌学者[20]Aliaksei Severyn和Alessandro Moschitti。2012.大规模学习答案重新分类类别和主题描述符的结构关系。在第35届ACM SIGIR信息检索研究与开发国际会议记录。741--750.数字图书馆谷歌学者[21]约翰·肖·泰勒和尼洛·克里斯蒂亚尼尼。2004模式分析的核心方法。剑桥大学出版社。数字图书馆谷歌学者[22]Yiannos Stathopoulos和Simone Tuefel。2015.检索研究级数学信息需求:测试集和技术术语实验。在计算语言学协会第53届年会和第7届国际自然语言处理联合会议记录。334--340.交叉引用谷歌学者[23]Goran Topic、Giovanni Yoko Kristianto和Minh Quoc Nghiem。2013年,NTCIR-10数学轨道的MCAT数学检索系统。在第十届NTCIR会议记录。680--685.谷歌学者[24]Radim Rehůek和Petr Sojka。2008.数学知识的自动分类和分类。在第七届数学知识管理国际会议论文集。543--557.数字图书馆谷歌学者[25]斯蒂芬·瓦特(Stephen M.Watt)。2008.通过符号频率分析进行数学文档分类。在数字数学图书馆研讨会论文集。29--40.谷歌学者[26]严熙凤和韩嘉伟。2002.gSpan:基于图的子结构模式挖掘。在IEEE数据挖掘国际会议论文集。721--724.数字图书馆谷歌学者[27]Richard Zanibbi、Akiko Aizawa、Michael Kohlhase、Iadh Ounis、Goran Topic和Kenny Davila。2016.NTCIR-12 MathIR任务概述。在第12届NTCIR会议记录。299--308.谷歌学者 索引术语 具有数学表达式结构的数学文档分类信息系统信息检索文件表示法内容分析和特征选择检索任务和目标聚类和分类专业信息检索结构和多语言文本搜索数学检索信息系统应用数字图书馆和档案馆 建议 数学文献的定量分析 为了开发数学和其他科学文档的实用OCR,从多个角度分析了数学文档。具体来说,四个观点是使用大规模数学文档数据库进行量化的。。。阅读更多信息从postscript文档中提取数学表达式ISSAC’04:2004年符号和代数计算国际研讨会论文集 包含数学的文档的全文索引不能被认为是完全成功的,除非数学符号被提取出来并以标准化的形式表示,允许搜索公式,并在…中重复使用这些信息。。。阅读更多信息灵活的文档分类AIKED’05:第四届WSEAS国际人工智能会议论文集,知识工程数据库 在自动文档分类的背景下,我们在本文中提出了一种新的灵活的电子文档分类方法,该方法位于知识工程和学习机方法的结合处。我们的方法分配一个HTML。。。阅读更多信息 评论 Please enable JavaScript to view thecomments powered by Disqus. 信息和贡献者问询处发布于 JCDL’17:第17届ACM/IEEE数字图书馆联合会议记录2017年6月383页国际标准图书编号:9781538638613总主席:麦睿博印第安纳大学布卢明顿分校,尼古拉斯·沃比多伦多大学图书馆,课程主席:亚当·贾托京都大学信息学院,凯西·马歇尔德克萨斯农工大学,伊恩·米利根滑铁卢大学 赞助商SIGWEB:ACM超文本、超媒体和网络特别兴趣小组SIGIR:ACM信息检索特别兴趣小组出版商IEEE出版社出版历史出版:2017年6月19日检查更新作者标记支持向量机文件分类数学文献结构内核限定符研究文章会议2017年JCDL主办单位:SIGWEB公司SIGIR公司JCDL’17:第17届ACM/IEEE-CS数字图书馆联合会议2017年6月19日至23日加拿大多伦多安大略省 接受率1482份提交文件中的总体接受率415份,28% 贡献者 其他指标查看文章指标文献计量学和引文文献计量学 文章指标 0引文总数38总下载次数下载次数(过去12个月)2下载次数(最近6周)0 其他指标查看作者指标引文视图选项获取访问权限 登录选项检查您是否可以通过登录凭据或您的机构访问本文。登录完全访问权限获取此出版物 查看选项 PDF格式以PDF文件查看或下载。PDF格式 电子阅读器使用联机查看电子阅读器.电子阅读器媒体数字其他桌子分享分享共享此出版物链接复制链接已复制!复制失败。在社交媒体上分享Linkedin公司重新编辑电子邮件附属公司时典 铃木东京理工大学,日本东京查看个人资料Atsushi公司 藤饭东京理工大学,日本东京查看个人资料