论文摘要

标题 波斯尼亚塞族-克罗地亚语和英国英语中自发多方对话语料库
作者 埃米娜·库特克,比尔·威尔斯,盖伊·J·布朗,蒂莫西·坎普顿艾哈迈特·阿克
摘要 在本文中,我们提供了一个两种语言的自发面对面多方对话的音频和视频记录语料库。免费提供的世俗、非体制、多方对话的高质量录音仍然很少,本语料库旨在提供有价值的数据,适合研究口语互动的多个方面。特别是,它是波斯尼亚塞族-克罗地亚语口语的独特资源,这是一种资源不足的语言,目前没有可用的口语资源。语料库由三个多小时的自由对话组成,每种目标语言,BSC和英国英语(BE)。录音是使用头戴式麦克风在单独的频道上进行的,还使用了包含8个全向麦克风的麦克风阵列。这些数据已经使用从会话分析研究传统发展而来的分割概念和转录约定进行了分割和转录。此外,使用强制对齐的方法,笔录已在单词和电话级别自动与音频对齐。本文描述了语料库创建背后的过程,并介绍了用于会话研究的语料库的主要特征。
话题 语料库(创建、注释等),对话,其他
全文 波斯尼亚塞族-克罗地亚语和英国英语中自发多方对话语料库
Biptex公司 @诉讼中{KURTIC12.513,
author={Emina Kurtic、Bill Wells、Guy J.Brown、Timothy Kempton和Ahmet Aker},
title={波斯尼亚塞族-克罗地亚语和英国英语中的自发多方对话语料库},
booktitle={第八届国际语言资源与评价会议(LREC'12)会议记录},
年份={2012},
月={may},
日期={23-25},
address={土耳其伊斯坦布尔},
editor={尼科莱塔·卡尔佐拉里(会议主席)、哈立德·乔克里(Khalid Choukri)、蒂埃里·德克勒克(Thierry Declerck)、梅赫迈特·乌尔·多安(Mehmet Uur Doan)、本特·马加德(Bente Maegaard)、约瑟夫·马里亚尼(Joseph Mariani)、亚松森·莫,
publisher={欧洲语言资源协会(ELRA)},
isbn={978-2-9517408-7-7},
语言={英语}
 }
技术支持ELDA公司©2012 ELDA/ELRA版权所有