{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期部分”:[[2022,7,19]],“日期时间”:“2022-07-19T15:28:58Z”,“时间戳”:1658244538766},“参考计数”:20,“出版商”:“富士科技出版社”,“问题”:“5”,“内容域”:{“域”:[],“交叉标记限制”:false},”short-container-ti tle“:[“JACIII”,“J。高级计算。智力。智力。通知。“],”published-print“:{”date-parts“:[[2019,9,20]]},”抽象“:”本文提出了一种构建语料库以训练自然语言理解(NLU)模块的有效方法。传统的语料库创建方法涉及到一个共同的循环:给一个主题一个特定的场景,主题通过语音操作一个设备,然后主题说出一句话来执行任务。在这些方法中,为了构建大规模的语料库需要许多主题,这导致了交付周期和财务成本增加的问题。为了解决这个问题,我们建议将\u201cprobing问题\u201d合并到循环中。具体地说,在一个受试者说出一句话后,受试者被要求想出其他的话来执行相同的任务。通过这种方式,我们从少数主题中获得了许多话语。将该方法应用于基于访谈的语料库创建的评估表明,该方法在保持语料库中形态多样性和商业设备上用户话语的形态覆盖率的同时,减少了41%的主题数。与传统方法相比,该方法将采访对象的总时间减少了36%。我们的结论是,该方法可以用于构建有用的语料库,同时减少交付周期和财务成本<\/jats:p>“,”DOI“:”10.20965\/jacii.2019.p0947“,”type“:”journal-article“,”created“:{”date-parts“:[[2019,9,19]],”date-time“:”2019-09-19T15:05:30Z“,”timestamp“:1568905530000},”page“:“:”10.20965“,”卷“:”23“,”作者“:[{”给定“:”Kazuaki“,”家庭“:”Shima“,”sequence“:”first“,”affiliation“:[]},{”given“:”Takeshi“,”family“:”Homma“,“sequence”:“additional”,“affiliance”:[]{,“given,“sequence”:“additional”,“affiliation”:[]},{“given”:“Hiroaki“,”family“:”Kokubo“,”sequence“:”additional“,”affiliation“:[]},{”given“:”Yasunari“,”家庭“:”Obuchi“,“sequence”:“additional”,“affiliance”:[]{,“given”:“Jinhua”,“family”:“She”,“segment”:“additional”、“affidiation”:[]},”name“Clarion Co.,Ltd.7-2 Shintoshin,Chuo-ku,Saitama,Saidama 330-0081,Japan”,”segment““,”从属关系“:[]},{“name”:“日立研发集团1-280 Hitachi,Ltd.1-280 Eagashi-koigakubo,Kokubunji,Tokyo 185-8601,Japan”,“sequence”:“additional”,“affiliation”:“[]},{”name“:”东京理工大学1404-1 Katakura,Hachioji,东京192-0982“,sequence“:”additional“,”affiliance“:[]},”name“:”通讯作者“,”sequence,“affiliation”:[]}],“member”:“8550”,“published-online”:{“date-parts”:[[2019,9,20]]},“reference”:[{“key”:“key-10.20965\/jacii.2019.p0947-1”,“doi-asserted-by”:“crossref”,“unstructured”:“G.Tur,D.Hakkani-T\u00fcr,and L.Heck,\u201c ATIS中还有什么需要理解?,\u201d程序。2010年IEEE口语技术研讨会,第19-24页,2010年。“,“DOI”:“10.1109\/SLT.2010.5700816”},{“key”:“key-10.20965\/jacii.2019.p0947-2”,“DOI-asserted-by”:“crossref”,“unstructured”:“R.Sarikaya,G.E.Hinton,and A。Deoras,\u201C深度信任网络在自然语言理解中的应用,\u201d IEEE\/ACM Trans。《音频、语音和语言处理》,第22卷,第4期,第778-784页,2014年。“,“DOI”:“10.1109”,TASLP.2014.2303296“},{“key”:“key-10.20965”,jacii.2019.p0947-3”,“DOI-asserted-by”:“crossref”,“unstructured”:“Z.Yan和Y.Wu,\u201cA Neural N-Gram Network for Text Classification,\u201 d J.Advv。计算。智力。智力。通知。,第22卷,第3期,第380-386页,2018年。”,“DOI”:“10.20965\/jacii.2018.p0380”},{“key”:“key-10.20965\/jachii.2019.p0947-4”,“unstructured”:“Y.-B.Kim,D.Kim,A.Kumar,and R。Sarikaya,\u201c具有个性化注意力的高效大规模神经领域分类,\u201d Proc。计算语言学协会第56届年会,第1卷,第2214-2224页,2018年。“},{“key”:“key-10.20965\/jacii.2019.p0947-5”,“unstructured”:“G.Kurata,O.Ichikawa,and M。西村,《反映用户说话方式分析的汽车语音输入法》,IEICE Trans。《信息与系统》(日文版),第J93-D卷,第10期,第2107-2117页,2010年(日文)。“},{”key“:”key-10.20965\/jacii.2019.p0947-6“,”doi-asserted-by“:”crossref“,”unstructured“:”T.Homma,K.Shima,and T.Matsumoto,“在存在语音识别错误的情况下使用多分类器的稳健话语分类,2016 IEEE口语技术研讨会,第369-375页,2016。“,”doi“:”10.1109 \/SLT.2016.7846291“},{“key”:“key-10.20965 \/jacii.2019.p0947-7”,“非结构化”:“T.Homma,Y.Obuchi,K.Shima,R.Ikeshita,H.Kokubo,and T。Matsumoto,\u201cIn-Vehicle Voice Interface with Improved Utterance Classification Accuracy Using Off-the-Shelf Cloud Speech Recognizer,\u201 d IEICE Trans。《信息与系统》,第E101-D卷,第12期,第3123-3137页,2018年。Doddington,\u201cATIS口语系统试点语料库,\u201 d HLT\u201990 Proc。演讲和自然语言研讨会,第96-1011990页。”,“DOI”:“10.3115\/11650.116613”},{“key”:“key-10.20965\/jacii.2019.p0947-9”,“DOI断言”:“crossref”,“非结构化”:“L。Hirschman,\u201cMulti-site data collection for a speak language语料库,\u201 d HLT\u201991 Proc。演讲与自然语言研讨会,第7-14页,1992年。“,“DOI”:“10.3115\/1075527.1075531”},{“key”:“key-10.20965\/jacii.2019.p0947-10”,“unstructured”:“J.Goto,K.Komine,M.Miyazaki,Y.-B.Kim,and N。Uratani,基于使用WOZ方法收集的数据的电视操作口语对话接口,IEICE Trans。《信息与系统》,第E87-D卷,第6期,第1397-1404页,2004年。武田(编辑),《车内和移动系统的u201cDSP》,第47-64页,施普林格,2005年。“,“DOI”:“10.1007”,“0-387-22979-5_3”},{“键”:“key-10.20965”,jacii.2019.p0947-12“,“非结构化”:“K.Shima,T.Homma,R.Ikeshita,H.Kokubo,Y.Obuchi,and J。她,《基于访谈风格的汽车导航系统自发性语音语料库收集方法》,IEICE Trans。《信息与系统》(日语版),第J101-D卷,第2期,第446-455页,2018年(日语)。“},{”key“:”key-10.20965\/jacii.2019.p0947-13“,”unstructured“:”Y.Wang,J.Berant,and P.Liang,\u201cBuilding a Semantic Parser Overnight,\u201 d Proc.of the Association of the 53 Annual Meeting for Computational Linguistics and the 7th Int.Joint Confer.on Natural Language Processing,Vol.1,pp.1332-13422015“}”,{“key”:“key-10.20965 \/jacii.2019.p0947-14“,“doi-asserted-by”:“crossref”,“unstructured”:“G.Campagna,R.Ramesh,S.Xu,M.Fischer,and M.S.Lam,\u201cAlmond:开放、众包、隐私保护、可编程虚拟助手的体系结构,\u201 d Proc。第26届万维网国际会议(WWW\u201917),第341-350页,2017年。“,“DOI”:“10.1145”:“3038912.3052562”},{“key”:”key-10.20965“/jacii.2019.p0947-15”,“unstructured”:“A.Coucke,A.Saade,A.Ball,T.Bluche,A.Caulier,D.Leroy,C.Doumouro,T.Gisselbrecht,F.Caltagirone,T.Lavril,M.Primet,and J。Dureau,\u201cSnips语音平台:用于私有设计语音接口的嵌入式口语理解系统,\u201 d arXiv preprint,arXiv:1805.101902018。“},{“key”:“key-10.20965”\/jacii.2019.p0947-16“,“unstructured”:“K.Shima,T.Homma,M.Motohashi,R.Ikeshita,H.Kokubo,Y.Obuchi,and J。她,《自然语言理解主题数量减少的高效语料库创建》。第八国际交响乐团。计算智能与工业应用以及第十二届中日信息技术与控制应用国际研讨会(ISCIIA&ITCA 2018),2018年第3M1-3-5号,《SAGE定性研究方法百科全书》,第681-683页,SAGE出版社,2008年。“},{“key”:“key-10.20965\/jacii.2019.p0947-18”,“unstructured”:“MeCab,http://taku910.github.io\/MeCab \/[2019年2月10日访问]”},}“key”:“key-10.20965 \/jachii.2019.p,947-19”,“非结构化”:“Clarion Co.,Ltd.,\u201cIntelligent VOICE,\u201 d http:\/\/www.Clarion.com/jp\/ja\/products-personal\/service\/IntelligentVoice\/index.html[2019年2月10日访问]“},{“key”:“key-10.20965\/jacii.2019.p0947-20”,“unstructured”:“Clarion有限公司,http://www.Clarion.com\/top.html[2019-2-10日访问]”},“container-title”:[”《高级计算智能与智能信息学杂志》“],”original-title“:[],”language“:”en“,”link“:[{”URL“:”https:\/\/www.fujipres.jp\/main\/wp-content\/themes\/fujipress\/phyosetsu.php?ppno=JACIL002300050017“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”存放“:{”date-parts“:[[2019,9,19]],“date-time”:“2019-09-19T15:08:12Z”,“timestamp”:1568905692000},“score”:1,“resource”:{“primary”:{“URL”:“https:\/\/www.fujipress.jp\/jacii\/jc\/jaciai002300050947”}},”subtitle“:[],”shorttitle“:[],”issued“:{”date-part“:[2019,9,20]]}”,“references-count”:20,“新闻发布”:{“发布”:“5”,“在线发布”:}date-parts“:[[2019,9,20]]},”published-print“:{”date-part“:[[2019,9,20]]}},“URL”:“http://\/dx.doi.org\/10.20965\/jacii.2019.p0947”,“关系”:{},‘ISSN’:[“1883-8014”,“1343-0130”],‘ISSN-type’:[{”value“:”1883-8013“,”type“:“electronic”},{“value”:“1343-01-014”130“,”type“:”print“}],”subject“:[],”published“:{”date-parts“:[[2019,9,20]]}}