{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2023,10,19]],“日期-时间”:“2023-10-19T06:10:06Z”,“时间戳”:1697695806525},“引用-计数”:43,“发布者”:“威利”,“问题”:“7”,“许可证”:[{“开始”:{:“日期-零件”:[2006,3,21]],”日期-时间“:”2006-03-21 T00:00:00Z“,”时间戳“:1142899200000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://\/onlinelibrary.wiley.com/termsAndConditions#vor”}],“内容域”:{“域”:[],“crossmark-restriction”:false},“short-container-title”:[“J.Am.Soc.Inf.Sci.”],“published-print”:}“date-parts”:[[2006,5]},”abstract“:”摘要<\/jats:title>作者提出了一种基于双语语料库的日语\u2013英语双语主题词库自动生成方法。术语双语同义词库是指一组双语等价词及其同义词。目前提出的从双语语料库中提取双语等价词簇的方法大多依赖于词频,对于处理低频率的簇来说并不有效。这些2010年频率较低的双语簇值得提取,因为它们包含许多新创造的术语,这些术语在需求中,但没有在现有双语同义词库中列出。假设基于频率的单语言\u2010pair\u2010independent方法已经达到了其局限性,并且与其他方法结合使用的依赖于语言\u2010 pair\u 2010dependent方法表现出良好的前景,作者提出了以下方法:(a)基于音译模式提取翻译对;(b) 从候选词中删除配对词;(c) 基于单词频率从剩余的候选单词中提取翻译对;以及(d)使用图\u2010理论方法,基于提取的对生成双语聚类。发现该方法比其他方法更有效<\/jats:p>“,”DOI“:”10.1002\/asi.20351“,”type“:”journal-article“,”created“:{”date-parts“:[[2006,3,21]],”date-time“:”2006-03-21T17:16:29Z“,”timestamp“:1142961389000},”page“:,“卷“:”57“,”作者“:[{”给定“:”Keita“,”family“:”Tsuji“,”sequence“:”first“,”affiliation“:[]},{”给出“:”Kyo“,“family”:“Kageura”,“sequence”:“additional”,“affiliance”:[]2],“member”:“311”,“published-online”:{“date-parts”:[[2006,3,21]]}、“reference”:[{“key”:“e_1_2_7_2_1”,”doi-asserted-by“:”publisher“,”doi“:”10.1145\/956863.956890“},{”key“:”e_1_2_7_3_1“,“首页”:“29”,“卷时间”:“COLING\u2010ACL'98会议记录”,“作者”:“Ahrenberg L.”,“年份”:“1998”},{“键”:“e_1_i_7_4_1”,”非结构化“:”Aizawa A.N.&Kageura K.(1998)。自动生成多语言关键字簇的方法In D.Bourigault等人(编辑)第一届计算术语研讨会论文集(第8\u201314页)。“},{”key“:”e_1_2_7_5_1“,”doi断言“:”publisher“,”doi“:”10.1080\/08395199117270“},{”issue“:”2“,”key“:”e_1_2_7_6_1“,”首页“:”263“,”文章标题“:”统计机器翻译的数学:参数估计“,”卷“:”19“,”作者“:”Brown P.F.“,”年份“:”1993“,”期刊标题“:”计算语言学“},{”key“:”e_1_2_7_7_1“,”首页”:“449”,“卷标题”:“ACM数字图书馆/SIGIR多语言信息发现和访问联合研讨会论文集”,“作者”:“Chen A.”,“年份”:“1999”},{“密钥”:“e_1_2_7_8_1”,“非结构化”:“Collier N.Hirakawa H.&Kumano A.(1997).使用KATAKANA匹配从嘈杂的\u2010平行新闻专线文章中获取英语\u2013日语专有名词。1997年环太平洋自然语言处理研讨会论文集(第309\u2013314页)。“},{”key“:”e_1_2_7_9_1“,”首页“:”515“,”volume-title“:”COLING'94“,”author“:”Daille B.“,”year“:”1994“}”,{“key”:“e_1_i_7_10_1”,”first page“:,“首页”:“236”,“volume-title“:“COLING’95会议录”,“作者”:“Fung P.”,“年份”:“1995”},{“key”:“e_1_2_7_12_1”,“首页”:“81”,“volume-title”:“AMTA’94会议录:翻译技术合作伙伴关系”,“author”:“Feng P.“,“year”:“1994”}、{“key”:”e_1_i_7_13_1“,”doi-asserted-by“:”publisher“,{“键”:“e_1_2_7_14_1”,“第一页“:”444“,”volume-title“:”COLING\u2010ACL'98“,”author“:”Gaussier\u00c9.“,”year“:”1998“},{“key”:“e_1_2_7_15_1”,”unstructured“:”Hiemstra D.(1998).twenty\u2010one中的多语言领域建模:从并行语料库自动创建双向翻译词典。发票。A.Coppen H.van Halteran和L.Teunissen(编辑)《荷兰计算语言学》,1997年。第八届临床研究所会议论文选集(第41页\u201358)。阿姆斯特丹罗多比。“},{”key“:”e_1_2_7_16_1“,”unstructured“:”Hull D.A.(1998)。术语对齐的实用方法。InD.Bourigault et al.(Eds.)《计算术语第一次研讨会论文集》(pp.1_u20137)。“}”,{“key”:“e_1_i_7_17_1”,“doi-asserted-by”:“publisher”,”doi“:”10.5715\/jnlp.9.5_23“};{“,”DOI“:”10.1016\/S0306-4573(98)00055-7“},{“key”:“e_1_2_7_19_1”,“首页”:“397”,“volume-title”:“COLING’2000年会议记录”,“author”:“Kageura K.”,“year”:“2000”},}“key”:”e_1_I_7_20_1“,”首页“418”,“volume-titel”:“COLING’2000”会议记录”{“key”:“e_1_2_7_21_1”,“首页”:“563”,“卷时间”:“1998年IEEE亚太电路与系统会议论文集”,“作者”:“Kawtrakul A.”,“年份”:“1998”},{“问题”:“2”,“关键”:“e_1_2_7_22_1”,“首页”:“313”,“文章标题”:“基于类\u2010的单词对齐方法”,“卷”:“23”,“作家”:“Ker S.J.”,“年”:“1997”,“期刊标题”:《计算语言学》}e_1_2_7_23_1“,“首页”:“79”,“卷时间”:“第四期超大语料库研讨会论文集”,“作者”:“Kitamura M.”,“年份”:“1996”},{“key”:“e_1_i_7_24_1”,《首页》:“128”,“volume-title”:“COLING’97论文集”“内政部”:“10.3115\/1118693.1118712”},{“key”:“e_1_2_7_26_1”,“first-page”:“17”,“volume-title”:“ACL'93会议录”,“author”:“Kupiec J.”,《年份》:“1993”},{”key“:”e_1_i_7_27_1“,”first-page:“34”,“volume-title:“语言知识获取与表征研讨会录:自举注释语言数据”,“作者”:“Lopez A.”,“年份”:“2002”}、{“key”:“e_1_2_7_28_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1162\/089120100561683“},{“key”:“e_ 1_7_29_1”、“first page”:”460“,“volume-title”:“Proceedings of the COLING’96”,“author”:“Meyers A.”,“year”:“1996”},“key“:”e_1_ 2_7_30_1“,”volume-tite“:”Portable Nikkan Jiten[日语\u2013韩语词典]“,”author“:“Minshushorin\u2010henshukyoku”,“年份”:“2000”},{“key”:“e_1_2_7_31_1”,“unstructured”:“Omae H.Tsuji K.Kageura K.Imai M.&Anzai Y.(2003年7月)。从万维网上非2010年平行日语\u2013法语文本中提取复合词翻译。论文发表于日本札幌多语言词汇数据库研讨会PAPILLON\u20102003。”},“volume-title”:“Jinko chino daijiten[人工智能百科全书](S),“author”:“Shapiro S.C.”,“year”:“1991”},{“key”:“e_1_2_7_33_1”,“volum-title“:”使用大型语料库的双语词典构建(技术代表CS TR 3666,UMIACS TR 96\u201050,pp.1_201310)“,”author“:”Shen W._34_1“,“首页”:“1”,“文章标题”:“双语词汇搭配翻译:统计方法”,“卷”:“22”,“作者”:“Smadja F.”,“年份”:“1996年”,“期刊标题”:《计算语言学》},{“key”:“e_1_2_7_35_1”,”首页“:“110”,“volume-title”:“2000年SIGDAT自然语言处理和超大语料库经验方法联合会议论文集”,“author”:“Sun L.”,“year”:“2000”},{“issue”:“3”,“key”:“e_1_2_7_36_1”,《first page》:“49”,“article-title”:“on English\u2010 origined words in modern German Language”,“volume”:”85“author:”Tachibana Y.“,“year:”1984”,“journal-title”:“Kokugakuin Zasshi”},{“key”:“e_1_2_7_37_1”,“doi-asserted-by”:“publisher”,”doi“:”10.3115\/1118693.118705“},”{“key”:”e_1_i_7_38_1“,”doi-assert-by“:”publisher“,:“1996年COLING会议记录”,“作者”:“Vogel S.”,“年份”:“1996”},{“key”:“e_1_2_7_40_1”,“首页”:“1352”,“卷时间”:“COLING\u2010ACL'98会议记录”,“作者”:“Wan S.”,”年份“:“1998”},{“键”:“e_ 1_2_ 7_41_1”、“首页“:”906“,”卷时间“:”COLING'2000会议记录“,”作者“:”Watanabe H.“,”年“:”2000“},”{“密钥”:“d_2_7 _42_1”“,”第一页“:“244”,“volume-title”:“COLING’95会议录”,“作者”:“Wu D.”,“年份”:“1995”},{“key”:“e_1_2_7_43_1”,“首页”:“206”,”volume-title“:“美洲机器翻译协会会议记录”,“author”:“WuD.”,”year“:“1994”}、{“key”:”e_1_i_7_44_1“,”first page“:”933“,”volume-title“:”COLING’2000年会议记录“,”author“:”Yamamoto K.“,”year:“2000”}],“container-title”:[“美国信息科学与技术学会杂志”],“original-title”:[],“language”:“en”,“link”:[{“URL”:“https:\/\/api.wiley.com/onlinelibrary\/tdm\/v1\/articles\/10.1002%2Fasi.20351”,“content-type”:“unspecified”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\/\/onlinelibrary.wiley.com//doi\/pdf\/10.1002\/asi.20351”,“content-type”:“未指定”,“内容-版本”:“vor”,“intended-application”:“相似性检查”}],“存放”:{“日期-部件”:[[2023,10,18]],“日期-时间”:“2023-10-18T23:17:52Z”,“时间戳”:1697671072000},“分数”:1,“资源”:{-“主要”:{“URL”:“https:\/\/onlinelibrary.wiley.com/doi\/10.1002\/asi.20351”}},“副标题”:[],“短标题”:[],“已发布”:{“日期-部件”:[[2006,3,21]]},”引用计数“:43,”日志发布“:{”问题“:“7”,“发布-版本”:{“日期-部分”:[2006,5]}}URL“:”http://\/dx.doi.org\/10.1002\/asi.20351“,”存档“:[”Portico“],”关系“:{},“ISSN”:[“1532-2882”,“1532-2890”],“ISSN-type”:[{“value”:“1532-288”,“type”:“print”}