{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2024,9,10]],“日期-时间”:“2024-09-10T15:11:21Z”,“时间戳”:1725981081474},“参考-计数”:46,“出版商”:“Springer Science and Business Media LLC”,“发行”:“4”,“许可证”:[{“开始”:{“日期-零件”:[2021,6,3]],”日期-时间“:”2021-06-03T00:00:00Z“,“timestamp”:162267840000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/creativecommons.org\/licenses\/by\/4.0”},{“start”:{“date-parts”:[[2021,6,3]],“date-time”:“2021-06-03T00:00:00Z”,“timetamp”:1612678400000},”content-version:“vor”,“delay-in-days”:“0,”URL“https:\\/creativecommons.org\/licenses\/by\/4.0“}],”content-domain“用法:{“domain”:[“link.springer.com”],“crossmark-restriction”:false},“short-container-title”:[”Adv Data Anal Classif“],“published-print”:{”date-parts“:[2021,12]]},”abstract“:”摘要<\/jats:title>在本文中,我们重新讨论了在单样本场景中收集到的正数据和未标记数据的类先验概率估计问题。这项任务很重要,因为众所周知,在正未标记设置中,如果类先验可用,则可以成功学习分类器。我们证明,在没有附加假设的情况下,类先验概率是不可识别的,因此,如果不施加附加假设,现有的非参数估计通常必然有偏差。还研究了它们的偏差大小。当概率结构满足温和的半参数假设时,问题变得可识别。因此,我们提出了一种基于逻辑拟合及其(非凹陷)对数似然的凹面化的方法。在人工和基准数据集以及大型临床数据库MIMIC上进行的实验表明,所提出的方法的估计误差通常低于其竞争对手,并且它对偏离逻辑设置是稳健的<\/jats:p>“,”DOI“:”10.1007\/s11634-021-00444-9“,”type“:”journal-article“,”created“:{”date-parts“:[2021,6,3]],”date-time“:”2021-06-03T20:03:23Z“,”timestamp“:1622750603000},”page“:referenced-by-count“:6,”title“:[”通过逻辑回归“],”前缀“:”10.1007“,”卷“:”15“,”作者“:[{”给定“:”Ma\u0142gorzata“,”家族“:”u0141az\u0119cka“,”sequence“:”first“,”affiliation“:[]},{”given“:”Jan“,”family“:”Mielniczuk“,:“茶馆”,“sequence“:”additional“,”affiliation“:[]}],”member“:”297“,”published-online“:{”date-parts“:[2021,6,3]]},”reference“:[{”issue“:”1“,”key“:”444_CR1“,”doi-asserted-by“:”publisher“,“first page”:“61”,“doi”:“10.1017\/S0033291713000548”,“volume”:”44“,“author”:“AL Bahorik”,“year”:“2014”,“非结构化”:“Bahorik AL、Newhill CE、Queen CC、Eack SM(2014)精神分裂症患者药物使用报告不足:患病率和预测因素。《精神医学》44(1):61\u201369“,“journal-title”:“精神医学”},{“key”:“444_CR2”,“doi-asserted-by”:“crossref”,“unstructured”:“Bekker J,Davis J(2018)通过决策树归纳法估计正数据和未标记数据中的类优先级。in:第32届AAAI人工智能会议论文集”,“doi”:“10.1609\/aaaai.v32i1.11715”}、{“key“:”444_CR3“,”doi-asserted-by“:”publisher“,”unstructured“:”Bekker J,Davis J(2020)《从正面和未标记数据中学习:一项调查》。马赫学习109:719\u2013760。https:\/\/doi.org\/10.1007\/s10994-020-05877-5“,”doi“:”10.1007\/s10994-020-05877-5“},{“key”:“444_CR4”,“doi-asserted-by”:“publisher”,“first page”:”699“,“doi”:”10.1080\/01621459.1983.10478031“,”volume“78”,“author”:“H Bierens”,“year”:“1983”,“unstructured”:“Bierens H(1983)广义条件下回归函数核估计的一致一致性。J Am Stat Assoc 78:699\u2013707“,”journal-title“:”J Am State Assoc.“},{”key“:”444_CR5“,”volume-title”:“半监督学习”,“author”:“O Chapelle”,“year”:“2010”,“unstructured”:“Chapelleo O,Sch\u00f6lkopf B,Zien A(2010)半监督学习。麻省理工学院出版社,剑桥“}”,{“issue”:“12”,“key”:“444_CR 6”,“doi-asser”ted-by“:”publisher“,”首页“:”2304“,”DOI“:”10.1016\/j.addbeh.2006.02.015“,”volume“:”31“,”author“:”WJ Chen“,”year“:”2006“,”unstructured“:”Chen WJ,Fang CC,Shyu RS,Lin KC(2006)《两级尿液分析揭示的急诊患者非法药物使用漏报》。Addict Behav 31(12):2304\u20132308“,“journal-title”:“Addict Behav”},{“key”:“444_CR7”,“doi-asserted-by”:“crossref”,“unstructured”:“Couso-In\u00e9s,DD,H\u00fcllermier E(2017)最大似然估计和粗略数据。摘自:可扩展不确定性管理国际会议论文集,2017年SUM第10564卷,第3\u201316页。Springer”,“DOI”:“10.1007\/978-3-319-67582-4_1”},{“key”:“444_CR8”,“volume-title”:“信息理论要素(电信和信号处理中的威利系列)”,“author”:“TM Cover”,“year”:“2006”,“unstructured”:“Cover TM,Thomas JA(2006)Elements of information theory(通信和信号处理的威利序列).Wiley,New York“},{”issue“:”2“,”key“:”444_CR9“,”doi-asserted-by“:”publisher“,”first page“:“423”,”doi“:”10.1080\/03610929208830787“,”volume“::423\u2013450”,“期刊标题”:“Commun Stat Theory Methods”},{“issue”:“1”,“key”:“444_CR10”,“doi asserted by”:“publisher”,“first page”:“70”,“doi”:“10.1016\/j.tcs.2005.09.07”,“volume”:“348”,“author”:“F Denis”,“year”:“2005”,“nonstructured”:“Denis F,Gilleron R,Letouzey F(2005)从积极和未标记的例子中学习。Theor Comput Sci 348(1):70\u201383“,”journal-title“:”Theor Compute Sci“},{”issue“:”5“,”key“:”444_CR11“,”doi-asserted-by“:”publisher“,”first-page“:”1358“,”doi“:”10.1587\/transinf.E97.D.1358“”,“volume”:“E\u201397D”,“author”:“M du Plessis”,“year”:“2014”,“unstructured”:“du Ples M,Sugiyama M(2014)正数据和未标记数据的类先验估计。IEICE Trans-Inf Syst E\u201397D(5):1358\u20131372“,“journal-title”:“IEICE Trans-Inf Syst”},{“key”:“444_CR12”,“doi-asserted-by”:“crossref”,“unstructured”:“Elkan C,Noto K(2008)仅从正面和未标记的数据学习分类器。摘自:第十四届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD\u201908,pp 213\u2013220“,“DOI”:“10.1145\/1401890.1401920”},{“issue”:“5”,“key”:“444_CR13”,“DOI-asserted-by”:“publisher”,“first page”:非结构化“:”Frenay B,Verleysen M(2014)《标签噪声存在下的分类:一项调查》。IEEE Trans Neural Netw Learn Syst 25(5):845\u2013869“,”journal-title“:”IEEE Trans-Neural Netw学习系统“},{“issue”:“1”,“key”:“444_CR14”,“doi-asserted-by”:“publisher”,“first-page”:“6”,“doi”:“10.1109\/TKDE.2006.16”,”volume“18”,“author”:“GPC Fung”,“year”:“2006”,“unstructured”:“Fung GPC,Yu JX,Lu H,Yu PS(2006年)无负面示例的文本分类重新访问。IEEE Trans Knowl Data Eng 18(1):6\u201320“,”journal-title“:”IEEE Trans-Knowl-Data Eng“},{“key”:“444_CR15”,“doi-asserted-by”:“publisher”,“doi”:“10.1201\/b18401”,“volume-title”:“稀疏的统计学习:套索和泛化”,“author”:“T Hastie”,“year”:“2015”,“unstructured”:“Hastie T,Tibshirani R,Wainwright M(2015)”稀疏性统计学习:套索和概括。CRC Press,Boca Raton“},{“key”:“444_CR16”,“doi-asserted-by”:“publisher”,“first page”:”2244“,“doi”:“10.1214\/aos\/1176348396”,“volume”::“19”,“author”:“DF Heitjan”,“year”:“1991”,“unstructured”:“Heitjan-DF,Rubin DB(1991)Ignorable and crous data.Ann Stat 19:2244\u20132253”,“journal-title”:“Ann Stat.”},}“issue”:“1”,“key”:“444_CR17”,“doi-asserted-by“:”publisher“,”first-page“:”71“,”doi“:”10.1016\/0304-4076(93)90114-K“,”volume“:”58“,”author“:”H Ichimura“,”year“:”1993“,”unstructured“:”IchimuraH(1993)半参数最小二乘法(SLS)和单指数模型的加权SLS估计。J Econom 58(1):71\u2013120“,“journal-title”:“J Econom”},{“key”:“444_CR18”,“unstructured”:“Jain S,\u00a0White M,\u000a0Radivojac P(2016)从有噪声的正态数据和未标记数据估计类的先验和后验。In:第30届神经信息处理系统国际会议论文集,第2693\u20132701页”}、{“key”:444_CR19“,”doi-asserted-by“:”crossref“,”unstructured“:”Jaskie K,Elkan C,Spanias A(2020)积极学习和未标记学习的修正逻辑回归。收录:第53届Asilomar信号、系统和计算机会议,第2007\u20132011页,“DOI”:“10.1109\/IEEECONF44664.2019.9048765”},{“key”:“444_CR20”,“DOI-asserted-by”:“crossref”,“unstructured”:“Jaskie K,Spanias A(2019)学习算法和应用:调查。收录:IEEE IISA,Patras,希腊,2019年7月。,第1\u20138页”,“DOI:”10.1109\/IISA.2019.8900698“},{“key”:“444_CR21”,“doi-asserted-by”:“publisher”,“first page”::“1”,“doi”:“10.1038\/sdata.2016.35”,“volume”:”3“,“author”:“AEW Johnson”,“year”:“2016”,“unstructured”:“Johnson AEW,Pollard TJ,Shen L,Lehman L-WH,Feng M,Ghassemi M,Moody B,Szolovits P,Anthony CL,Mark RG(2016)MIMIC-III是一个免费访问的危重病护理数据库。Sci Data 3:1\u20139“,“journal-title”:“Sci Data”},{“key”:“444_CR22”,“unstructured”:“Kiryo R,Niu G,du\u00a0Plessis MC,Sugiyama M(2017)《使用非负风险估计器的积极无标记学习》。摘自:第31届神经信息处理系统国际会议论文集,NIPS\u201917,pp 1674\u20131684”}、{“key”:《444_CR2》,“doi-asserted-by“:”publisher“,”first-pages“:”50“,”doi“:”10.1016\/j.neucom.2016.03.080“,”volume“:”206“,“author”:“W Lan”,“year”:“2016”,“unstructured”:“Lan W,Wang j,Li M,Liu j,Liu Y,Wu F,Pan Y(2016)使用积极-非标记学习预测药物-靶点相互作用。Neurocomputing 206:50\u201357“,”journal-title“:”Neurocumputing“},{”issue“:”1“,”key“:”444_CR24“,”doi-asserted-by“:”publisher“,”first-page“:”145“,“doi”:“10.1016\/0304-4076(94)01698-4”,“volume”:“71”,“author”:“T Lancaster”,“year”:“1996”,“unstructured”:“Lancaster T,Imbens G(1996)污染对照的病例对照研究。经济杂志71(1):145\u2013160“,”journal-title“:”J Econom“},{“key”:“444_CR25”,“doi-asserted-by”:“publisher”,“doi”:“10.1007\/978-1-4419-5945-4”,“volume-title”:“统计学家数值分析”,“author”:“K Lange”,“year”:“2010”,“unstructured”:“Lange K(2010)统计学家数字分析。Springer Verlag,New-York”},“issue”:“3”,“key“444”_CR26“,”首页“:”1009“,”卷“:”17“,”作者“:”K Li“,”年份“:”1989“,”非结构化“:”李K,段N(1989)链接违规下的回归分析。Ann Stat 17(3):1009\u20131052”,“期刊标题”:“Ann Stat”},{“key”:“444_CR27”,“非结构化”:“Li X,Liu B(2003)学习使用阳性和未标记数据对文本进行分类。在:第18届人工智能国际联合会议论文集,第587\u2013592页”},{“key”:“444_CR28”,“非结构化”:“Liu B,Dai Y,Li X,Lee WS,Yu PS(2003)使用正面示例和未标记示例构建文本分类器。收录:第三届IEEE数据挖掘国际会议论文集,ICDM\u201903,pp 179\u2013“},{“key”:“444_CR29”,“unstructured”:“Menon A,Rooyen B,Ong C,Williamson R(2015)《通过类概率估计从损坏的二进制标签中学习》。收录:《第32届国际机器学习会议论文集》,pp 1\u201310“}”,{key“:”444_CR30“,”第一页“:”271“,”volume-title“:”当我们出错时,我们选择什么?重新审视了错误指定逻辑回归的模型选择和测试。计算智能研究”,“作者”:“J Mielniczuk”,“年份”:“2016年”,“非结构化”:“Mielniczuk J,Teisseyre P(2016)当我们犯错时,我们选择什么?重新审视了错误指定逻辑回归的模型选择和测试。计算智能研究,第605卷。柏林施普林格,pp 271\u2013296“},{“key”:“444_CR31”,“unstructured”:“Natarajan N,Dhillon IS,Ravikumar P,Tewari A(2013)《使用噪音标签学习》。摘自:第26届神经信息处理系统国际会议论文集,NIPS\u201913,pp.1196\u20131204,美国纽约州Red Hook。Curran Associates Inc”},}“issue”:“3”,“key“:”444_CR32“,”doi asserted by“:”publisher“,”first page“:”405“,”doi“:”10.1111\/j.1365-2664.200501112.x“,”volume“:”43“,”author“:”JL Pearce“,”year“:”2006“,”nonstructured“:”Pearce JL,Boyce MS(2006)仅使用存在数据建模分布和丰度。J Appl Ecol 43(3):405\u2013412“,”journal-title“:”J Appl Ecol“},{”issue“:”4“,”key“:”444_CR33“,”doi-asserted-by“:”publisher“,”first page“:“463”,“doi”:“10.1007\/s10994-016-5604-6”,“volume”:“106”,“author”:“MC Plessis”,“year”:“2017”,“unstructured”:“Plessis MC,Niu G,Sugiyama M(2017)从正面和未标记数据中学习的类前验估计。Mach Learn 106(4):463\u2013492”,“新闻标题”:“Mach Learning”},{“key”:“444_CR34”,“unstructured”:“Prokhorov D(2001)IJCNN 2001神经网络竞赛。IJCNN\u201901,福特研究实验室”}中的幻灯片演示,{《key》:“444-CR35”,“非结构化”:“Ramaswamy H,Scott C,Tewari A(2016)基于分布核嵌入的混合比例估计。摘自:第33届机器学习国际会议论文集,vol\u00a048,pp 2052\u20132060“},{“key”:“444_CR36”,“unstructured”:“Scott C(2015)混合比例估计的收敛速度,应用于从噪声标签中学习。摘自:第十八届人工智能和统计国际会议记录。PMLR,vol 38,pp 838\u2013846“},{“key”:“444_CR37”,“unstructured”:“Scott C,Blanchard G,Handy G(2013)非对称标签噪声分类:一致性和最大去噪。In:学习理论会议(COLT),JMLR会议记录第30卷,pp 489\u2013511”},“key“:”444_CR 38“,“doi-asserted-by”:“publisher”,“first page”:”159“,“doi”:“10.1016\/j.ijar.2017.04.002“,“volume”:“85”,“author”:“K Sechidis”,“year”:“2017”,“unstructured”:“塞希迪斯K,Sperrin M,Petherick ES,Luj\u00e1n M,Brown G(2017)《处理未报告变量:信息理论解决方案》。Int J Approx Reason 85:159\u2013177“,”journal-title“:”Int J Abrox Reas“},{“issue”:“529”,“key”:“444_CR39”,“doi-asserted-by”:“publisher”,“first page”:”334“,”doi“:”10.1080\/01621459.2018.1546587“,”volume“115”,“author”:“H Song”,“year”:“2020”,“unstructured”:“Song H,Raskutti G(2020)PUlasso:具有仅存在数据的高维变量选择。J Am Stat Assoc 115(529):334\u2013347“,“journal-title”:“J Am State Assoc.”},{“key”:“444_CR40”,“unstructured”:“Teisseyre P(2020)使用矩阵正则化学习分类器链:在多发病率预测中的应用。In:欧洲人工智能会议论文集,ECAI\u201920”}crossref”,“非结构化”:“Teisseyre P,Mielniczuk J,\u0141azecka M(2020)正数据和未标记数据拟合逻辑回归的不同策略。摘自:国际计算科学会议论文集,ICCS\u201920“,”DOI“:”10.1007\/978-3-030-50423-6_1“},{”key“:”444_CR42“,”DOI-asserted-by“:”publisher“,”first page“:“290”,”DOI:“10.1016\/j.patcog.2018.09.012”,“volume”:“86”,“author”:“P Teisseyre”,“year”:“2019”,“unstructured”:“Teissey P,Zufferey D,S\u0142 mka M(2019年)成本敏感分类器链:在多标签分类中选择低成本特征。Pattern Recogn 86:290\u2013319“,”journal-title“:”Pattern Reign“},{”issue“:”1“,”key“:”444_CR43“,”doi-asserted-by“:”publisher“,”first page“:“1”,”doi“:”10.1186\/s12913-018-3458-2“,“volume”:“18”,“author”:“NM Walley”,“year”:“2018”,“unstructured”:“Walley NM et al(2018)未确诊疾病网络申请人的特征:对转诊提供者的影响。BMC Health Serv Res 18(1):1\u20138“,”journal-title“:”BMC Hearth Serv Res“},{”key“:”444_CR44“,”doi-asserted-by“:”publisher“,”first page“:“554”,“doi”:“10.1111\/j.1541-0420.2008.0116.x”,“volume”:“65”,“author”:“G Ward”,“year”:“2009”,“unstructured”:“Ward G,Hastie T,Barry S,Elith j,Leathwick j(2009))仅存在数据和EM算法。生物统计学65:554\u2013563“,”journal-title“:”Biometrics“},{”issue“:”5“,”key“:”444_CR45“,”first page“:“1”,“volume”:“9”,“author”:“P Yang”,“year”:“2014”,“unstructured”:“Yang P,Li X,Chua HN,Kwoh CK,Ng SK(2014)集合阳性未标记学习用于疾病基因识别。PLoS ONE 9(5):1\u201311”,“journal-title”:“PLoS ONE”},{“密钥”:“444_CR46“,”doi-asserted-by“:”publisher“,”first page“:”34“,”doi“:”10.1016\/j.compbiomed.2015.07.017“,”volume“:“65”,”author“:”D Zufferey“,”year“:”2015“,”unstructured“:”Zuffered D,Hofer T,Hennebert j,Schumacher M,Ingold R,Bromuri S(2015)多标签学习算法对慢性病临床数据的性能比较。Comput Biol Med 65:34\u201343“,”journal-title“:”Comput Biol Med“}],”container-title”:[“数据分析和分类的进展”],“原始标题”:[],“语言”:“en”,“链接”:[{“URL”:“https:\/\/link.springer.com\/content\/pdf\/10007\/s11634-021-00444-9.pdf”,“内容类型”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“”text-mining“},{“URL”:“https:\/\/link.springer.com/article\/10.1007\/s11634-021-00444-9\/fulltext.html”,“内容类型”:“text\/html”,“content-version”:“vor”,“intended-application”:“text-mining”},}“URL“https:\\/link.stringer.com/content\/pdf\/10.10007\/s11634.021-00444-9.pdf”,“content-type”:“application\/pdf”、“content-vers”离子“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2022,12,29]],”date-time“:”2022-12-29T18:26:24Z“,”timestamp“:16723384000},”score“:1,”resource“:{primary”:{“URL”:“https:\/\/link.springer.com\/10007\/s11634-021-00444-9”}},“subtitle”:[],“shorttitle”:[],“issued”:{“date-part”:[[2021,6,3]]},“引用计数”:46,“日志问题“:{”问题“:“4”,“published-print”:{“date-parts”:[[2021,12]]}},“alternative-id”:[“444”],“URL”:“http://\/dx.doi.org\/10.1007\/s11634-021-00444-9”,“relationship”:{},”ISSN“:[”1862-5347“,”1862-555“],”ISSN-type“:[{”value“:”1862-6347“,“type”:“print”},{“value“:“1862-5355”,“type”:“electronic”}],“subject”:[],“published”:{“date-parts”:[2021,6,3]]},“断言“:[{”value“:”2020年7月23日“,”order“:1,”name“:”received“,”label“:”received“,“group”:{“name”:”ArticleHistory“,”tabel“:“Article History”}},{“value”:“2021年2月3日”,“order”:2,“name”:“revised”,“label”:“revised”,”group“:“,”label“:”接受“,”group“:{”name“:”ArticleHistory“,”label“:”Article History