@进行中{bahar-etal-2023演讲,title=“带风格的语音翻译:2023年{A}pp{T}ek{'}提交给{IWSLT}字幕和形式轨道”,author={巴哈、帕尼亚和Wilken、Patrick和伊兰佐·桑切斯、哈维尔和迪甘吉、马蒂亚和马图索夫、叶夫根尼和T{\“u}ske、Zolt{\‘an}、,editor=“Salesky、Elizabeth和费德里科、马塞洛和Carpuat,海军陆战队”,booktitle=“第20届国际口语翻译大会论文集(IWSLT 2023)”,月=七月,年=“2023”,address=“加拿大多伦多(当面和在线)”,publisher=“计算语言学协会”,url=“https://aclcollectory.org/2023.iwslt-1.22”,doi=“10.18653/v1/2023.iwslt-1.22”,pages=“251--260”,抽象=“AppTek参与了IWSLT 2023评估的字幕和形式跟踪。本文详细描述了我们的字幕管道——语音分割、语音识别、标点预测和逆向文本规范化、文本机器翻译和直接语音到文本翻译、智能行分割和现在我们在训练和微调中使用提供的字幕特定数据。评估结果表明,我们的最终提交文件具有竞争力,特别是以SubER字幕质量指标衡量,比其他参与者提交的文件高出5{%}个绝对值。对于形式化轨道,我们参与了En-Ru和En-Pt生产模型,它们通过前缀令牌支持形式化控制。除非正式葡萄牙语外,我们在提供高质量的一般翻译的同时,还实现了近乎完美的形式级准确性。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“bahar-etal-2023-speech”><标题信息>风格演讲翻译:AppTek于2023年提交给IWSLT字幕和正式轨道</titleInfo><name type=“个人”><namePart type=“given”>帕尼亚</namePart>巴哈尔<角色>作者</角色></name><name type=“个人”>帕特里克威尔肯<角色>作者</角色></name><name type=“个人”>哈维尔伊兰佐·桑切斯<角色>作者</角色></name><name type=“个人”>马蒂亚迪甘吉<角色>作者</角色></name><name type=“个人”>Evgeny公司马图索夫<角色>作者</角色></name><name type=“个人”>佐尔坦蒂斯克<角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第20届国际口语翻译大会(IWSLT 2023)会议记录</titleInfo><name type=“个人”>伊丽莎白Salesky公司<角色>编辑器</角色></name><name type=“个人”>马塞洛费德里科<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>海洋</namePart><namePart type=“family”>卡普瓦特</namePart><角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多(同人和在线)</place></originInfo>会议出版物</relatedItem>AppTek参与了IWSLT 2023评估的字幕和形式跟踪。本文详细介绍了我们的字幕管道——语音分割、语音识别、标点预测和反向文本规范化、文本机器翻译和直接语音到文本翻译、智能行分割——以及我们如何在训练和微调中利用所提供的字幕特定数据。评估结果表明,我们的最终提交文件具有竞争力,特别是以SubER字幕质量指标衡量,比其他参与者提交的文件高出5%的绝对值。对于形式跟踪,我们使用En-Ru和En-Pt生产模型参与,这些模型通过前缀令牌支持形式控制。除非正式葡萄牙语外,我们在提供高质量的一般翻译的同时,还实现了近乎完美的形式级准确性</摘要>bahar-etal-2023语音10.18653/v1/2023.iwslt-1.22<位置><网址>https://aclantology.org/2023.iwslt-1.22</url></位置><部分>2023-07年<扩展单元=“page”><开始>251<end>260</范围></部分></mods></modsCollection>
%0会议记录%带风格的T语言翻译:AppTek于2023年提交给IWSLT字幕和正式轨道%巴哈尔,帕尼亚%帕特里克·A·威尔肯%A Iranzo-Sánchez,哈维尔%马蒂亚·A Di Gangi%叶夫根尼·马图索夫%佐尔坦,图斯克%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Carpuat,海军%第20届国际口语翻译会议(IWSLT 2023)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多(同人和在线)%F bahar-etal-2023演讲%X AppTek参与了IWSLT 2023评估的字幕和形式跟踪。本文详细介绍了我们的字幕管道——语音分割、语音识别、标点预测和反向文本规范化、文本机器翻译和直接语音到文本翻译、智能行分割——以及我们如何在训练和微调中利用所提供的字幕特定数据。评估结果表明,我们的最终提交文件具有竞争力,特别是以SubER字幕质量指标衡量,比其他参与者提交的文件高出5%的绝对值。对于形式跟踪,我们使用En-Ru和En-Pt生产模型参与,这些模型通过前缀令牌支持形式控制。除了非正式的葡萄牙语,我们实现了近乎完美的正式程度的准确性,同时提供了高的一般翻译质量。%R 10.18653/v1/2023.iwslt-1.22%U型https://aclantology.org/2023.iwslt-1.22%U型https://doi.org/10.18653/v1/2023.iwslt-1.22%电话251-260
降价(非正式)
【带风格的语音翻译:AppTek提交给IWSLT字幕和形式跟踪的2023年】(https://aclantology.org/2023.iwslt-1.22)(Bahar等人,IWSLT 2023)
国际计算语言学协会
- 帕尼娅·巴哈尔(Parnia Bahar)、帕特里克·威尔肯(Patrick Wilken)、哈维尔·伊兰佐·桑切斯(Javier Iranzo-Sánchez)、马蒂亚·迪甘吉(Mattia Di Gangi)、埃夫根尼·马图索夫(Evgeny Matusov)和佐尔。2023语言风格翻译:AppTek于2023年提交给IWSLT字幕和正式轨道.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第251-260页,加拿大多伦多(个人和在线)。计算语言学协会。