{“status”:“ok”,“message type”:“work”,“message version”:“1.0.0”,“message”:{“indexed”:{“date parts”:[[2024,2,28],“date time”:“2024-02-28T14:21:39Z”,“timestamp”:1709130099582},“reference count”:24,“publisher”:“Wiley”,“issue”:“1”,“license”:[{“start”:{“date parts”:[[2020,11,24],“date time”:“2020-11-24T00:00:00Z”,“timestamp”:160 6176000000}中,“content-version”:“am”,“delay-in-days”:0,“URL”:“http://\/creativecommons.org\/licenses\/by\/4.0\/”},{“start”:{“date-parts”:[[2020,11,24]],“date-time”:“2020-11-24T00:00:00Z”,“timestamp”:1606176000000},“content-version”:“vor”,“delay-in-days”:“0,”URL:“http://\\/creative commons..org\/licencenses\/by\/4.0 \/“}],“出资人”:[{“DOI”:“10.13039\/10000161”,“名称”:“美国国家标准与技术研究所”,“doi-asserted-by”:“publisher”,“award”:[“70NANB15H176”],“id”:[{“id”:“10.13039\/10000161”,”id-type“:”doi“,”asserted-by“:”publisher“}]}],”content-domain“:{”domain“:[”onlinelibrary.wiley.com“],”crossmark-restriction“:true},”short-container-title“:[”统计分析“],“published-print”:{“日期部分”:[[2021,2]]},“摘要”:“摘要<\/jats:title>手写文件可以通过其内容或书写字符的形状来表征。我们关注的问题是,根据书写的形状,将一个人的笔迹与出处不明的文件进行比较,就像在法医应用中一样。为此,我们首先提出了一种处理扫描的手写文档的方法,将文字分解为小的图形结构,通常与字母对应。然后,我们介绍了受图形编辑距离启发的两个此类结构之间的距离度量,以及一组图形的中心度量。这些测量值是异常值容差的基础K<\/jats:italic>\u2010表示基于结构属性对图形进行聚类的算法,从而创建用于排序新文档的模板。最后,我们提出了一个贝叶斯层次模型来捕获作者生成分配给特定簇的图的倾向。我们使用计算机视觉实验室数据集中的文档来说明这些方法。我们显示了在集群分配下的识别任务的结果,并与相同的建模进行了比较,但使用的分组方法不够灵活,不能容忍偶然的笔划或异常值<\/jats:p>“,”DOI“:”10.1002\/sam.11488“,”type“:”journal-article“,”created“:{”date-parts“:[[2020,11,25]],”date-time“:”2020-11-25T04:52:05Z“,”timestamp“:1606279925000},”page“:7,“标题”:[“图形手写组件和统计作者分析的一种聚类方法“],”前缀“:”10.1002“,”卷“:”14“,”作者“:[{”ORCID“:”http://\/ORCID.org\/0000-0002-8411-0084“,”authenticated-ORCID“:false,”给定“:”Amy M.“爱荷华州立大学统计系美国爱荷华州立大学统计系ORCID“:”http://\/ORCID.org\/00000-0002-6428-9427“,”authenticated-ORCID“:false,”given“:“Alicia L.”,”family“:”Carriquiry“,”sequence“:”additional“,”affiliation“:[{”name“:”Department of Statistics Iowa State University Ames Iowa USA“}]}],”member“:”311“,”published-online“:{”date-parts“:[2020,11,24]},”reference“:[}”{“key”:“e_1_2_8_2_1”,“首页”:“1”article-title“:”表示法医文件审查员结论的标准术语“,”author“:”ASTM标准E1658\u201008“,”年份“:”2008“,”期刊标题“:”ASTMInt.“},{”key“:”e_1_2_8_3_1“,”doi-asserted-by“:”crossref“,“unstructured”:“A.Bhardwaj M.Reddy S.Setlur V.Govindaraju和S。《第九届IAPR文档分析系统国际研讨会论文集》(ACM 2010)第357\u2013362页“,”DOI“:”10.1145\/1815330.1815376“},{”key“:”e_1_2_8_4_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1109\/TPAMI.2007.1009”},“key”:“e_1_c_8_5_1”,“第一页“:“768”,“article-title”:“多元数据的聚类分析:效率与分类的可解释性”,“volume”:“21”,“author”:“Forgy E.”,“year”:“1965”,“journal-title“:“Biometrics”},{“key”:”E_1_2_8_6_1“,“unstructured”:“K.Franke L.Schomaker C.Veenhuis C.Taubenheim I.Guyon L.Vuurpijl M.vanErp和G。Zwarts Wanda:一个用于法庭笔迹分析和作者识别的通用框架,第九届国际笔迹分析与笔迹鉴别协会IEEE Computer Society 2004。“},{”key“:”e_1_2_8_7_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1016\/j.patrec.2017.03.008”},}“key”:“e_1_c_8_8_1”,“首页”:“197”,”volume-title“:”《2005年文档图像理解技术研讨会论文集》,“作者”:“Ganz D.”,“年份”:“2005”},{“密钥”:“e_1_2_8_9_1”,“doi-asserted-by”:“crossref”,《非结构化》:“F.Kleber S.Fiel M.Diem和R。Sablatnig CVL\u2010数据库:一个用于作家检索、作家识别和单词识别的离线数据库2013年第12届国际文件分析和识别会议2013年第560页\u2013564.“,”DOI“:”10.1109\/ICDAR.2013.117“},{”key“:”e_1_2_8_10_1“,”首页“:”707“,”文章标题“:”能够纠正删除、插入和反转的二进制代码”,“卷”:“10”,“作者”:“Levenshtein V.I.”,“年份”:“1966”,“期刊标题”:“Sov。物理学。多克。“},{”key“:”e_1_2_8_11_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1109“\/TIT.1982.1056489”},“key”:“e_1_i_8_12_1”,“doi-assert-by”:“publisher”,“doi”:“10.1109\/34.682179”}“key”:“e_1_2_8_14_1”,“首页”:“275”,“文章标题”:“作者问题中的推理”,“卷”:“68”,“作者”:“Mosteller F.”,“年份”:“1963年”,“新闻标题”:“J.Am.Stat.Assoc.”},{“密钥”:“e_1_2_8_15_1”,”非结构化“:”S.N.SrihariandZ.Shi法医学手写文档检索系统2004,第188\u2013194页。6“},{”key“:”e_1_2_8_17_1“,”unstructured“:”M.Rosen\u2010Zvi T.Griffiths M.Steyvers和P。Smyth The author \u2010topic model for authors and documents Proceedings of The 20th Conference on Understance in Artificial Intelligence UAI'04 2004第487\u2013494页。“},{”key“:”e_1_2_8_18_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1214\/10-AOAS379”},“key”:“e_1_c_8_19_1”,“unstructured”:“Y.Seroussi I.Zukerman和F。Bohnert作者归属与潜在的Dirichlet分配。2011年第十五届计算自然语言学习会议论文集,第181\u2013189页publisher“,”DOI“:”10.1111\/j.0006-341X.2005.031032.x“},{“key”:“e_1_2_8_23_1”,“DOI-asserted-by”:“publisher”,”DOI:“10.1145\/321796.321811”},“key“:”e_1_i_8_24_1“,“doiasserted-by。A.WalchandD。T.Gantz象形匹配:一种基于图形\u2010的方法,用于实现独立于语言的文档开发平台HDP’04 2004。”,“DOI”:“10.1145\/1031442.1031451”},{“key”:“e_1_2_8_25_1”,“DOI-asserted-by”:“publisher”,”DOI“:”10.1145\/357994.358023“}],“container-title”:[“统计分析和数据挖掘:ASA Data Science Journal”],“原标题“:[],”语言“:”en“,”链接“:[{”URL“:”https:\/\/onlinelibrary.wiley.com\/doi\/pdf\/10.1002\/sam.11488“,”内容类型“:”application\/pdf“,”内容版本“:”vor“,”预期应用程序“:”文本挖掘“},{”URL“:”https:\/\/onlinelibrary.wiley.com\/doi\/full-xml\/10.1002\/sam.11488“,”内容类型“:”application\/xml“,”内容版本“:”vor“,”intended-application“:”text-mining“},{“URL”:“https:\/\/onlinelibrary.wiley.com/doi\/pdf\/101002\/sam.11488”,“内容类型”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“syndication”},}“URL“:”https:\//onlinelibrary.wiley.com\/doi\/pdf\\10.1002\/sam.1148“,”内容类型“:”未指定“,”content-versiion“:”vor“,”预期应用程序”:“相似性检查”}],“存放”:{“日期部分”:[[2023,9,3]],“日期-时间”:“2023-09-03T12:16:01Z”,“时间戳”:1693743361000},“分数”:1,“资源”:{“主要”:{“URL”:“https:\/\/onlinelibrary.wiley.com\/doi\/10.1002\/sam.11488”},“副标题”:[],“短标题”:[],“发布”:{“日期部分”:[[2020,11,24]},“引用计数”:24,“新闻发布“:{”问题“:“1”,“published-print”:{“date-parts”:[[2021,2]}},“alternative-id”:[“10.1002\/sam.11488”],“URL”:“http://\/dx.doi.org\/10.1002\/sam.11488”,“archive”:[”Portico“],“relationship”:{},”ISSN“:[”1932-1864“,”1932-1872“],”ISSN-type“:[{”value“1932-1865”“,”类型“:”打印“},{”值“:”1932-1872“,”类别“:”电子“}],”主题“:[],”发布“:{”date-parts“:[[2020,11,24]]},”assertion“:[{”value“:”2020-01-16“,”order“:0,”name“:”received“,”label“:”received“,“group”:{“name”:“publication_history”,“label”:“publication history”}},{“value”:“2020-07-21”,“order”:1,“name”:“accepted”,“tabel”:”accepted“,”group“:{”name“:”publication_history“,”table“:”publication-history“}}}},{“值”:“2020-11-24”,“顺序“:2,”名称“:”发布“,”标签“:”已发布“,“组”:{“名称”:“publication_history”,“标签”:“publication history”}}]}