跳到主要内容
10.5555/3200334.3200348acm会议文章/章节视图摘要出版物页面jcdl公司会议记录会议集合
研究论文

具有数学表达式结构的数学文档分类

出版:2017年6月19日 出版历史
  • 获取引文提醒
  • 摘要

    数学文档用于数学交流,例如在线问答社区中的数学论文和讨论。数学文档分类(MDC)是将数学文档分类为数学类别的任务,例如概率论和集合论。这是最近广泛使用的数字图书馆和存档服务中支持用户搜索的一项重要任务。尽管数学表达式(ME)在文档中可以为分类提供基本信息,特别是在数学领域,尚未开发出使用ME进行MDC的方法。在本文中,我们提出了一种基于文本并结合小微结构的分类方法,假设小微结构反映了特定于类别的约定和规则。我们还介绍了为评估MDC系统而构建的文档集合,以及对类别设置及其统计信息的调查。我们展示了分类结果,并且我们提出的方法优于现有的基于F-测度的ME建模方法。

    工具书类

    [1]
    Akiko Aizawa和Michael Kohlhase。2013.NTCIR-10数学试点任务概述。第十届NTCIR会议记录。654--661.
    [2]
    Akiko Aizawa、Michael Kohlhase和Iadh Ounis。NTCIR-11数学-2任务概述。第11届NTCIR会议记录。88--98.
    [3]
    西蒙·巴瑟尔、萨沙·特尼斯和沃尔夫·蒂洛·巴尔克。2013年,数学文献分类大规模实验。第十五届亚太数字图书馆国际会议论文集。83--92.
    [4]
    迈克尔·柯林斯和奈杰尔·达菲。2002年,用于解析和标记的新排名算法:离散结构上的核和投票感知器。计算语言学协会第40届年会论文集。263--270.
    [5]
    彼得·格拉夫。替换树索引。技术报告。Max-Planck-Institut für Informatik公司。
    [6]
    Shahab Kamali和Frank Wm。汤帕。2010年,一个新的数学检索系统。第19届ACM信息和知识管理国际会议记录。1413--1416.
    [7]
    Shahab Kamali和Frank Wm。汤帕。2013.检索包含数学内容的文档。第36届ACM SIGIR信息检索研究与开发国际会议记录。353--362.
    [8]
    迈克尔·科尔哈斯和伊昂·苏坎。2006.数学公式搜索引擎。第八届国际人工智能和符号计算会议记录。241--253.
    [9]
    巴凡·库马尔(Pavan P.Kumar)、阿伦·阿加瓦尔(Arun Agarwal)和查克拉瓦西·巴格瓦蒂(Chakravarthy Bhagvati)。2012.基于结构的数学表达式检索方法。第六届人工智能多学科趋势国际研讨会论文集。23--34.
    [10]
    Ken Lang.1995年。NewsWeeder:学习过滤网络新闻。第十二届国际机器学习会议记录。331--339.
    [11]
    大卫·D·刘易斯(David D.Lewis)、杨一鸣(Yiming Yang)、托尼·G·罗斯(Tony G.Rose)和范丽(Fan Li),2004年。RCV1:文本分类研究的新基准集合。机器学习研究杂志5 (2004), 361--397.
    [12]
    林晓燕、高良才、胡宣、唐志刚、肖英南和刘晓忠。2014.版面展示中公式的数学检索系统。第37届ACM SIGIR信息检索研究与开发国际会议记录。697--706.
    [13]
    Martin Líška、Petr Sojka、Michal Růžička和Petr Mravec。2011.数学检索的Web界面和集合:WebMIaS和MREC。2011年第四届DML数字数学图书馆研讨会论文集。77--84.
    [14]
    布鲁斯·米勒和阿卜杜·优素福。2003.数学函数数字图书馆的技术方面。数学与人工智能年鉴38, 1 (2003), 121--136.
    [15]
    Robert Miner和Rajesh Munavalli。2007.通过查询公式化和数据规范化进行数学搜索的方法。第六届数学知识管理国际会议论文集。342--355.
    [16]
    亚历山德罗·莫希蒂(Alessandro Moschitti)。2006.依赖和组成语法树的高效卷积核。第17届欧洲机器学习会议记录。318--329.
    [17]
    亚历山德罗·莫希蒂(Alessandro Moschitti)和罗伯托·巴西利(Roberto Basili)。文本分类的复杂语言特征:一项综合研究。第26届欧洲红外研究会议记录。181--196.
    [18]
    Tam T Nguyen、Kuiyu Chang和Siu Cheung Hui。2012.数学问答系统的数学软件搜索引擎。第21届ACM信息和知识管理国际会议记录。724--733.
    [19]
    Tam T Nguyen、Siu Cheung Hui和Kuiyu Chang。2012.专家系统与应用使用形式概念分析进行数学搜索的基于格的方法。带应用程序的专家系统39, 5 (2012), 5820--5828.
    [20]
    Aliaksei Severyn和Alessandro Moschitti。2012.大规模学习答案重新分类类别和主题描述符的结构关系。第35届ACM SIGIR信息检索研究与开发国际会议记录。741--750.
    [21]
    约翰·肖·泰勒和尼洛·克里斯蒂亚尼尼。2004模式分析的核心方法。剑桥大学出版社。
    [22]
    Yiannos Stathopoulos和Simone Tuefel。2015.检索研究级数学信息需求:测试集和技术术语实验。计算语言学协会第53届年会和第7届国际自然语言处理联合会议记录。334--340.
    [23]
    Goran Topic、Giovanni Yoko Kristianto和Minh Quoc Nghiem。2013年,NTCIR-10数学轨道的MCAT数学检索系统。第十届NTCIR会议记录。680--685.
    [24]
    Radim Rehůek和Petr Sojka。2008.数学知识的自动分类和分类。第七届数学知识管理国际会议论文集。543--557.
    [25]
    斯蒂芬·瓦特(Stephen M.Watt)。2008.通过符号频率分析进行数学文档分类。数字数学图书馆研讨会论文集。29--40.
    [26]
    严熙凤和韩嘉伟。2002.gSpan:基于图的子结构模式挖掘。IEEE数据挖掘国际会议论文集。721--724.
    [27]
    Richard Zanibbi、Akiko Aizawa、Michael Kohlhase、Iadh Ounis、Goran Topic和Kenny Davila。2016.NTCIR-12 MathIR任务概述。第12届NTCIR会议记录。299--308.

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    JCDL’17:第17届ACM/IEEE数字图书馆联合会议记录
    2017年6月
    383页
    国际标准图书编号:9781538638613

    赞助商

    出版商

    IEEE出版社

    出版历史

    出版:2017年6月19日

    检查更新

    作者标记

    1. 支持向量机
    2. 文件分类
    3. 数学文献
    4. 结构内核

    限定符

    • 研究文章

    会议

    2017年JCDL
    JCDL’17:第17届ACM/IEEE-CS数字图书馆联合会议
    2017年6月19日至23日
    加拿大多伦多安大略省

    接受率

    1482份提交文件中的总体接受率415份,28%

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 0
      引文总数
    • 38
      总下载次数
    • 下载次数(过去12个月)2
    • 下载次数(最近6周)0

    其他指标

    引文

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享