{“status”:“ok”,“message type”:“work”,“message version”:“1.0.0”,“message”:{“indexed”:{“date parts”:[[2024,5,8]],“date time”:“2024-05-08T07:13:00Z”,“timestamp”:1715152380277},“reference count”:26,“publisher”:“Oxford University Press(OUP)”,“issue”:“2”,“license”:[{“start”:{“date parts”:[[2022,23]],“date time”:“2022-02-23T00:00:00Z”,“时间戳”:1645574400000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“https:\/\/cademicial.oup.com/journals\/pages\/open_access\/funder_policies\/charsors\/standard_ppublication_model”}],“funder”:[{“name”:“The Russian Science Foundation”,“award”:[“20-11-20270”]}],”content-domain“:{”domain“域“:[],”crossmark-restriction“:false},”short集装箱舱位“:[],“published-print”:{“日期部分”:[[2023,3,30]]},“摘要”:“摘要<\/jats:title>主题建模是一种流行的无监督文本处理方法,可提供可解释的文档表示。最高级的方法之一是附加正则化主题模型(ARTM)。由于其灵活性和先进的正则化能力,该方法比其他方法具有更好的质量。然而,要找到一种最佳的学习策略来创建高质量的主题是很有挑战性的,因为用户需要用正则化器的值来选择正则化器,并确定应用的顺序。此外,它可能需要许多实际运行或模型训练,这使得此任务非常耗时。目前,缺乏对基于ARTM的模型参数优化的研究。我们的工作提出了一种方法,将学习策略形式化为参数向量,可以用进化方法求解。我们还提出了一种基于代理的修改方法,该方法利用机器学习方法,使参数搜索的方法更加高效。我们研究了不同的优化算法(进化算法和贝叶斯算法)及其在使用所提出的学习策略方法进行主题建模优化时使用代理进行的修改。对英语和俄语数据集进行的实验研究表明,所提出的方法能够为ARTM找到高质量的参数解,并大大缩短搜索的执行时间<\/jats:p>“,”DOI“:”10.1093\/jigpal\/jzac019“,”type“:”journal-article“,”created“:{”date-parts“:[[2022,1,25]],”date-time“:”2022-01-25T12:19:36Z“,”timestamp“:1643113176000},”page“:10.1093“,”卷“:”31“,”作者“:[{”给定“:”玛丽亚“,”家庭“:”霍多尔琴科“,”序列“:”第一“,”从属关系“:[[{“名称”:”ITMO大学,49 Kronverksky pr.,圣彼得堡,197101,俄罗斯“}]},{”给出“:”尼古拉“,”家人“:”布塔科夫“,”顺序“:”附加“,”附属关系“:[{”名称“ITMO大学,49 Kronverkskypr.,St Petersburg,197101,俄罗斯“}]},{“给定“:”帖木儿“,”家族“:”索金“,”序列“:”附加“,”从属“:[{“name”:“ITMO University,49 Kronverksky pr.,St Petersburg,197101,Russia”}]},{“given”:“Sergey”,“family”:“Teryoshkin”,“sequence”:“additional”,“affiliation”:[{'名称“:”ITMO大学,49 Kronverkskypr.,圣彼得堡,197101,俄罗斯“}]}],“成员”:“286”,“publish”在线“:{”date-parts“:[[2022,2,23]]},”reference“:[{“key”:“202303311514210200_”,“first page”:”733“,”article-title“:“基于模型的遗传算法用于算法配置”,“volume-title”:“Proceedings of the 24th International Conference on Artificial Intelligence”,“author”:“Ans\u00f3tegui”,“year”:“2015”},{“密钥”:“2020 3033115414200_”,”第一页“:”169“,”article-title“:“用户生成文本的社会学研究中主题建模的附加正则化”,“volume-title”:“墨西哥人工智能国际会议”,“author”:“Apishev”,“year”:“2017”},{“key”:“202303311514210200_”,“doi-asserted-by”:“crossref”,《first page》:“1”,“doi”:“10.1109\/ICAICT.2014.7035936”,“article-title”异构分布式环境下工作流调度的协同进化遗传算法”,“卷时间”:“2014 IEEE第八届信息与通信技术应用国际会议(AICT)”,“作者”:“Butakov”,“年份”:“2014},{“密钥”:“202303311514210200_”,“首页”:“1”,“文章时间”:用于收集和处理社交媒体数据的统一领域特定语言”,“作者”:“Butakov”,“年份”:“2018年”,“新闻标题”:“信息系统”},{“密钥”:“202303311514210200_”,“卷时间”:“人工智能应用与创新:第15届IFIP WG 12.5国际会议,AIAI 2019,赫索尼索斯,希腊克里特岛,2013年5月24日,2019年5月26日,会议记录,“作者”:“Dasari”,“年份”:“2019”},{“密钥”:“2023033115514210200_”,“doi断言”:“crossref”,“首页”:“687”,“doi”:“10.1016\/j.cor.2011.06.007”,“文章标题”:“一种改进的人工蜂群算法”,“体积”:“39”,“作者”:“高”,“年份”:“2012”,“期刊标题”:“计算机与运筹学”},{“关键字”:“202303311514210200_”,“首页”:“5937”,“文章标题”:”潜在狄里克莱分配模型中超参数的原则选择“,“数量”:“18”,“作家”:“乔治”,“年度”:“2017”,“杂志标题”:机器学习研究杂志“},{”key“:”202303311514210200_“,”first page“:“289”,”article-title“:”概率潜在语义分析“,”volume-title”:“第十五届人工智能不确定性会议论文集,UAI\u201999”,”author“:”Hofmann“,”year“:”1999“}crossref“,”first page“:”61“,”DOI“:”10.1016\/j.swevo.2011.05.001“,”article-title“:”Surrogate assisted evolutional computation:“最新进展和未来挑战”,“volume”:“1”,“author”:“Jin”,“year”:“2011”,“journal-title”:“Swarm and evolutionary computation”},{“key”:”2023033115514210200_“,”DOI-asserted-by“:”crossref.“,”首页“:“687”,“DOI”:“”10.1016\/j.asoc.2007.05.007“,”article-title“:“关于人工蜂群(abc)算法的性能”,“卷”:“8”,“作者”:“卡拉博加”,“年份”:“2008”,“日志标题”:“应用软计算”},{“密钥”:“2023033115514210200_”,“doi-asserted-by”:“crossref”,“首页”:“284”,“doi”:“10.1007\/978-3030-61705-9_24”,”,“article-title”:“”基于艺术的主题模型的学习策略优化”,“卷-时间”:“混合人工智能系统:第15届国际会议,HAIS 2020,Gij\u00f3n,西班牙,2020年11月11日至13日,会议记录”,“作者”:“Khodorchenko”,“年份”:“2020”},{“密钥”:“2023033115514210200_”,“doi-asserted-by”:“crossref”,“首页”:“331”,“doi”:“10.1016\/B978-1-55860-377-6.50048-7“,”article-title“:”Newsweeder:Learning to filter netnews“,”volume-title”:“Machine Learning Proceedings 1995”,“author”:“Lang”,“year”:“1995”},{“key”:“2023033115514210200_”,“first page”:”530“,”article-title“:”机器阅读茶叶:自动评估主题连贯性和主题模型质量“,”volume-title“:“In:ACL欧洲分会第十四届会议论文集”,“author”:“Lau”,“year”:“2014”},{“key”:“202303311514210200_”,“first page”:”43“,“article-title”:“irace package:自动算法配置的迭代竞速。运筹学”,“volume”:第3“,”author“L\u00f3pez-Ib\u00e1\u00f1ez”,“年份”:“2016”,“期刊标题:“Perspectives”},{“key”:“2023033115514210200_”,“doi asserted by”:“crossref”,“首页”:“897”,“doi”:“10.1145\/248388.2488466”,“文章标题”:“从业余爱好者到鉴赏家:通过在线评论模拟用户专业知识的演变”,“卷标题”:“第22届万维网国际会议论文集”,“作者”:“McAuley”,“年份”:“2013年”},{“key”:“202303311514210200_”,“首页”:“100”,“文章标题”:“主题连贯性的自动评估”,“卷标题”:《人类语言技术:计算语言学协会北美分会2010年年会》,“作者”:“Newman”,“年”:“2010”}首页“:”100“,”文章标题“:”主题连贯性的自动评估“,”卷标题“:“人类语言技术:ACL北美分会2010年年会”,“作者”:“纽曼”,“年份”:“2010”},{“键”:“202303311514210200_”,“首页”:“1029”,“文章标题”:“基于分布式单词表示的主题质量度量”,“volume-title”:“第39届国际ACM SIGIR会议论文集”,“author”:“Nikolenko”,“year”:“2016”},{“key”:“202303311514210200_”,“doi-asserted-by”:“crossref”,“first page”:”5645“,“doi”:“10.1016\/j.eswa.2015.02.055”,“article-title“:”主题建模中描述符的连贯性分析”,“volume”:“42”,“author”:“O\u2019Callaghan”,“year”:“2015”,“journal-title”:“Expert Systems with Applications”},{“key”:”202303311514210200_“,”doi-asserted-by“:”crossref“,”first page“:”1“,”doi“:”10.1155\/2018\/2497471“,”article-title“:”基于集合剪枝和优化主题建模的生物医学文本分类”,“卷”:“2018”,“作者”:“Onan”,“年份”:“2018”,“期刊标题”:“医学中的计算和数学方法”},{“关键字”:“202303311514210200_”,“doi-asserted-by”:“crossref”,“首页”:“11”,“doi”:“10.1007\/978-3-030-27455-92”,“文章标题”:主题建模搜索算法的系统比较\u2014a重复错误报告识别研究“,“volume-title”:“基于搜索的软件工程:第十一届国际研讨会,2019年SSBSE,爱沙尼亚塔林,2014年8月31日\u2019年9月1日,论文集”,“author”:“Panichella”,“year”:“2019”},{“key”:“202303311514210200_”,“volume-title“:“差异进化:一种实用的全局优化方法”,“author”:“Price”,“year”:“2005”},{“key”:“202303311514210200_”,“article-title”:“处理低频事件对基于共现的单词相似性度量的影响\u2014逐点互信息案例研究”,“作者”:“角色”,“年份”:“2011”}、{“密钥”:“202303311514210200_“,”first page“:”370“,”volume-title“:”Bigartm:大型馆藏正则化多模态主题建模的开源库“,”author“:”Vorontsov“,”year“:”2015“},{“key”:“202303315514210200__”,“doi-asserted-by”:“crossref”,“volume-title”:“主题选择和稀疏因子分解的主题模型的加正则化”,“author“:”Vorontsov“,”year“:”2015“,”DOI“:”10.1007\/978-3-319-17091-6_14“},{“key”:“202303311514210200_”,“volume-title”:“从lenta.ru收集的俄罗斯新闻文章语料库”,“author”:“Yutkin”}],“container-title“:[”IGPL的逻辑杂志“],“original-title(原文标题):[],“language”:“en”,“link”:[{“URL”:“https://academy.oup.com\/jigpal\/article pdf\/31\/2\/287\/49705918\/jzac019.pdf”,“内容类型”:“应用程序”,“内容版本”:“vor”,“预期应用程序”:“联合”},{“URL”:“https://academy.oup.com\/jigpal\/article pdf\/31\/2\/287\/49705918\/jzac019.pdf”,“内容类型”:“未指定”,“内容版本”:“vor”,“预期应用程序”:“相似性检查“}”,“存放”:{“date-parts”:[[2023,11,16]],“date-time”:“2023-11-16T07:23:45Z”,“timestamp”:1700119425000},“score”:1,“resource”:{“primary”:{“URL”:“https:\/\/cademicial.oup.com\/jigpal\/article\/31\/287\/6534494”}},”subtitle“:[],”shorttitle“:[],”issued“:{”date-partts“:[2022,2,23]]},“引用计数”:26,“日志发布”:{“issue“:”2“,”published-online“:{“date-parts”:[[2022,2,23]]},”publised-print“:{“date-parts”:[[2023,3,30]]}},“URL”:“http://\/dx.doi.org\/10.1093\/jigpal\/jzac019”,“relationship”:{}、“ISSN”:[“1367-0751”,“1368-9894”],“ISSN-type”:[{“value”:“1367-051”,“type”“打印”},{“值”:“1368-9894”,“类型”:“电子”}],“主题”:[],“发布-其他”:{日期部分“:[[2023,4]]},”发布“:{“日期部分”:[[2022,2,23]]}}}