{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2023,17]],“日期-时间”:“2023-01-17T05:27:39Z”,“时间戳”:1673933259616},“引用-计数”:0,“发布者”:“IGI Global”,“问题”:“4”,“许可证”:[{“开始”:{:“日期-零件”:[[2021,5,24]],”日期-时间“:”2021-01 5-24T00:00:00Z“,”时间戳“:1621814400000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://\/creativecommons.org\/licenses\/by\/3.0\/dode.en_US”},{“start”:{“date-parts”:[[2021,5,24]],“date-time”:“2021-05-24T00:00:00Z”,“timestamp”:1621814400000},“content-version”:“am”,“delay-in-days”:“0,”URL“http:\\/creative commons..org\/licessenses\/通过\/3.0\/dode.en_US“},{“start”:{“date-parts”用法:[2021,5,24]],“date-time”:“2021-05-24T00:00:00Z”,“timestamp”:1621814400000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“http://\/creativecommons.org\/licenses\/by\/3.0\/dode.en_US”}],“content-domain”:{“domain”:[],“crossmark-restriction”:false},”shortcontainer-title“:[],”published-print“:{”date-parts“:[[2021,5,24]]},“摘要”:“

本文解决了从一小部分类似文档中自动识别出超出主题的文档的问题,这些文档预计会涉及一些常见主题。目标是从集合中删除噪声文档。提出了一种基于主题模型的分类框架,用于发现非主题文档。本文引入了带注释的{\\it搜索引擎建议}的新概念,其中本文将搜索页面时使用的任何搜索查询作为该页面中内容的表示。本文采用词嵌入来创建单词和文档的分布式表示,并对搜索引擎建议进行相似性比较。结果表明,搜索引擎可以对文本内容进行高度准确的语义表示,并且与主题概率排序的基线技术相比,使用这种表示进行相关性度量的文档分析算法在主题内内容过滤方面具有令人满意的性能<\/p> “,”DOI“:”10.4018\/ijcini.20211001.oa42“,”type“:”journal-article“,”created“:{”date-parts“:[2021,5,24]],”date-time“:”2021-05-24T15:30:06Z“,”timestamp“:1621870206000},”page“:“1-15”,”source“:”Crossref“,”is-referenced-by-count“:0,”title“:[”使用搜索引擎建议和无监督次主题聚类识别主要文档的分类框架“],”前缀“:”10.4018“,”卷“:”15“,”作者“:[{”给定“:”陈“,”家庭“:”赵“,”序列“:”第一“,”隶属“:[}”名称“:”日本筑波大学“}]},{”给出“:”武彦宏“,”家族“:”Utsuro“,”顺序“:”附加“,”affiliation“:[{“name”:“日本筑波大学”}]},{“given”:“Yasuhide”,“family”:“Kawada”,“sequence”:“additional”,“affiliation:[{”name“:”Logworks Co.,Ltd.,Japan“}]}],“member”:“2432”,“container-title”:[“International Journal of Cognitical Informatics and Natural Intelligence”],“original title”:[],“language”:“ng”,“link”:[{URL“:”https:\/\/www.igi-global.com/viewtitle.aspx?TitleId=274541“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,1,16]],”date-time“:“2023-01-16T21:48:23Z”,”timestamp“:1673905703000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/services.igi-global.com\/resolvedoi\/resulte.aspx?doi=10.4018\/IJCINI.20211001.oa42“}},”subtitle“:[”“],”shorttitle“:[],”issued“:{”date-parts“:[2021,5,24]]},“references-count”:0,”journal-issue“:{“issue”:“4”,“published-print”:{.oa42“,”关系“:{},”ISSN“:[”1557-3958“,”1557-39“],”ISSN-type“:[{”value“:”1557-“3958”,“type“:”print“},{”value“:“1557-3966”,“type”:“electronic”}],“subject”:[],“published”:{“date-parts”:[2021,5,24]]}}}