{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2024,5,10]],“日期-时间”:“2024-05-10T19:03:07Z”,“时间戳”:1715367787993},“引用-计数”:9,“出版商”:“麻省理工学院出版社-期刊”,“问题”:“1”,“内容-域”:{-“域”:[],“交叉标记限制”:false},”short-container-title“:[“神经计算”],“published-print”:{“date-parts”:[[1993,1]]},“abstract”:“本文阐述了学习曲线的一个普遍性质,它表明泛化误差、训练误差和潜在随机机器的复杂性是如何相关的,以及随机机器的行为是如何随着训练示例数量的增加而改进的。误差由熵损失来衡量。证明了推广误差收敛于H0<\/jats:sub>,真实机器的条件分布的熵,如H0<\/jats:sub>+m*<\/jats:sup>\/(2t),而训练误差收敛为H0<\/jats:sub>-m*<\/jats:sup>\/(2t),其中t是示例数,m*<\/jats:sup>显示了网络的复杂性。当模型可信时,表示真正的机器在模型中,m*<\/jats:sup>减少到m,即可修改参数的数量。这是一个普遍定律,因为它适用于任何正则机器,而不考虑其在最大似然估计下的结构。贝叶斯和吉布斯学习算法也得到了相似的关系。这些学习曲线显示了学习的准确性、模型的复杂性和训练示例数量之间的关系<\/jats:p>“,”DOI“:”10.1162\/neco.1993.5.1.140“,”type“:”journal-article“,”created“:{”date-parts“:[[2008,4,4]],”date-time“:”2008-04-04T19:30:18Z“,”timestamp“:1207337418000},”page“:卷“:”5“,”author“:[{”given“:”Shun-ichi“,”family“:”Amari“,”sequence“:”first“,”affiliation“:”东京大学数学工程和信息物理系,日本东京113区文京区“}]},{”given“:”Noboru“,“family”:“Murata”,“sequence”:“additional”,“affiliation:”[{“name”:“日本东京大学数学工程与信息物理系“}]}],“成员”:“281”,“参考”:[{“key”:“p_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/TAC.1974.1100705“},{“key”:”p_4“,”doi-assert-by“:”publisher“,”doi:“10.1016\/0893-6080(91)90040-C”},“key“:”p-6“,”doi-asserted serted-by“:”publisher“,”DOI“:”10.1162\/neco.1992.4.4.605“},{“key”:“p_7”,“DOI-asserted-by”:“publisher”,“DOI”:“10.1162\/neco.1989.1.1151”},“key“:”p_11“,”DOI-assert-by“:”publisher“,”DOI“:”10.1209\/0295-5075\/11\/7\/018 sRevA.44.2718“},{“key”:“p_13”,“DOI-asserted-by”:“publisher”,“DOI”:“10.1109\/5.58339”}key“:”p_17“,”doi-asserted-by“:”publisher“,”doi“:”10.1214\/aos\/1176350051“},{“key”:“p_21”,“doi-assert-by”:“publisher”,“doi”:“10.1145\/1968.1972”}],“container-title”:[“Neural Computation”],“original-title“:[],”language“:”en“,”link“:[{”URL“:”https:\\/www.mitpressjournals.org\/doi\/pdf\/10.1162\/neco.1993.5.1.140“,”内容类型“:”未指定“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2021,3,12]],”date-time“:”2021-03-12T21:31:57Z“,”timestamp“:1615584717000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/direct.mit.edu\/neco\/article\/5\/140-153\/5695”},“字幕”:[],“short”标题“:[],”已发布“:{“日期部分”:[[1993,1]]},”references-count“:9,”journal-issue“:{”issue“:“1”,“published-print”:{“date-parts”:[[1993,1]]}},“alternative-id”:[“10.1162\/neco.1993.5.1.140”],“URL”:“http://\/dx.doi.org\/10.1162\/neco.1993.5.1.40”,“relation”:{},”ISSN“:[”0899-7667“,”1530-888X“],”ISSN-type“:[{”value“:”0899-7667“,”类型“:”打印“},{”值“:”1530-888X“,”型号“:”电子“}],”主题“:[],“已发布”:{“日期部分”:[[1993,1]]}}}