{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期部分”:[[2023,11,15]],“日期时间”:“2023-11-15T00:14:38Z”,“时间戳”:1700007278054},“发布者位置”:“Cham”,“引用计数”:23,“发布商”:“Springer Nature Switzerland”,“isbn-type”:[{“值”:“9783031451690”,“类型”:”打印“},{“值”:“9783031451706”,“type”:“electronic”}],“license”:[{“start”:{“date-parts”:[[2023,1,1]],“date-time”:“2023-01-01T00:00:00Z”,“timestamp”:1672531200000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/www.springernature.com\/gp\/researters\/text-and-data-mining”},{“开始”:{“date-ports”:[2023,1,1],“日期-时间”:“2023-01-01T00:00:00Z”,“时间戳”:1672531200000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“https://www.springernature.com//gp\/researters\/text-and-data-mining”}],“content-domain”:{“domain”:[“link.springer.com”],“crossmark-restriction”:false},”short-container-title“:[],”published-print“:{”date-parts“:[2023]]}”,“DOI”:“10.1007\/978-3-03”31-45170-6_19“,”类型“:”书壳“,“created”:{“date-parts”:[[2023,11,14]],“date-time”:“2023-11-14T13:03:03Z”,“timestamp”:1699966982000},“page”:“179-188”,“update-policy”:”http:\\/dx.doi.org\/10.1007\/springer_crossmark_policy“,”source“:”Crossref“,“is-referenced-by-count”:0,“title”:[“带u00a0Constraint Recovery的反向强化学习”],“prefix”:“10.10 007“,”作者“:[{”给定“:“Nirjhar”,“family”:“Das”,“sequence”:“first”,“affiliation”:[]},{“given”:“Arpan”,“family”:“Chattopadhyay”,“sequence”:“additional”,“affiliation”:[]}],“member”:“297”,“在线发布”:{“日期部分”:[[2023,12,4]]},“reference”:[{“key”:“19_CR1”,“doi asserted by”:“crossref”,“nonstructured”:“Abbeel,P.,Ng,A.Y.:通过反向强化学习进行学徒学习。摘自:《第二十届第一届机器学习国际会议论文集》,第1页。ICML 2004,计算机械协会,纽约,纽约,美国(2004)“,”DOI“:”10.1145\/1015330.1015430“},{”key“:”19_CR2“,”volume-title“:”约束马尔可夫决策过程“,”author“:”E Altman“,”year“:”1999“,”unstructured“:”Altman,E.:约束马尔可夫决策过程。Chapman and Hall,London(1999)“}”,{“issue”:“5”,“key”:“19_CR3”,“doi-asserted-by“:”publisher“,”first page“:”469“,”doi“:”10.1016\/j.robot.2008.10.024“,”volume“:“57”,”author“:”BD Argall“,”year“:”2009“,”unstructured“:”Argall,B.D.,Chernova,S.,Veloso,M.,Browning,B.:机器人演示学习调查。机器人。汽车。系统。57(5),469\u2013483(2009)“,“新闻标题”:“机器人。自动。系统。“},{”key“:”19_CR4“,”series-title“:”Springer Proceedings in Advanced Robotics“,”doi-asserted-by“:”publisher“,”first page“:“228”,“doi”:“10.1007\/978-3-030-44051-0_14”,“volume-title”:“机器人算法基础XIII”,“author”:“G Chou”,“year”:“2020”,“unstructured”:“Chou,G.,Berenson,D.,Ozay,N.:从演示中学习约束。收录人:Morales,M.、Tapia,L.、S\u00e1nchez-Ate,G.、Hutchinson,S.(编辑)《2018年世界金融报告》。SPAR,第14卷,第228\u2013245页。查姆施普林格(2020)。https:\/\/doi.org\/10.1007\/978-3-030-44051-0_14“},{“key”:“19_CR5”,“unstructured”:“Chou,G.,Berenson,D.,Ozay,N.:演示自适应安全运动规划的不确定性感知约束学习。摘自:机器人学习会议,第1612\u20131639页。PMLR(2021)“},{“key”:“19_CR6”,“unstructured”:“Ding,F.,Xue,Y.:X-men:保最大熵约束反向强化学习。In:Cussens,J.,Zhang,K.(eds.)《第三十八届人工智能不确定性会议论文集》。《机器学习研究论文集》,第180卷,第589页\u2013598。PMLR(2022)“},{”issue“:”13\u201314“,”key“:”19_CR7“,”doi-asserted-by“:”publisher“,”first page“:“1474”,“doi”:“10.1177\/0278364917745980”,“volume”:“36”,“author”:“P Englert”,“year”:“2017”,“unstructured”:“Englert,P.,Vien,N.A.,Toussaint,M.:反向KKKKTT:从演示中学习操纵任务的成本函数。国际期刊。机器人。第36号决议(13\u201314),第1474\u20131488号决议(2017)。https:\/\/doi.org\/10.1177\/0278364917745980“,”journal-title“:”Int.J.Robot。Res.“},{”key“:”19_CR8“,”unstructured“:”Finn,C.,Levine,S.,Abbeel,P.:引导成本学习:通过策略优化实现深度逆最优控制。摘自:机器学习国际会议,第49\u201358页。PMLR(2016)“},{“key”:“19_CR9”,“unstructured”:“Gaurav,A.,Rezaee,K.,Liu,G.,Poupart,P.:从约束专家演示中学习软约束(2022)”},},“key“:”19_CR10“,”doi-asserted-by“:”crossref“,”unstructure“:”Hazan,E.等人:在线凸优化简介。发现。趋势\u00ae Optim.2(3\u20134),157\u2013325(2016)“,”DOI“:”10.1561\/240000013“},{“key”:“19_CR11”,“unstructured”:“Ho,J.,Ermon,S.:生成性对抗性模仿学习。In:Advances In Neural Information Processing Systems,vol.29(2016)”},“key“:”19_CR12“,”DOI-asserted-by“:”publisher“,”first page“:,“非结构化”:“Kaelbling,L.P.,Littman,M.L.,Moore,A.W.:强化学习:一项调查。J.阿蒂夫。智力。第4号决议,237\u2013285(1996)“,“期刊标题”:“J.Artif。智力。研究“},{“key”:“19_CR13”,“首页”:“14291”,“卷”:“33”,“作者”:“G Kalweit”,“年份”:“2020”,“非结构化”:“Kalweit,G.,Huegle,M.,Werling,“非结构化”:“Malik,S.,Anwar,U.,Aghasi,A.,Ahmed,A.:反向约束强化学习。收录:Meila,M.,Zhang,T.(编辑)第38届机器学习国际会议论文集。机器学习研究论文集,第139卷,第7390\u20137399页。PMLR(2021)“},{“key”:“19_CR15”,“unstructured”:“Ng,A.Y.,Russell,S.J.:逆强化学习算法。摘自:第十七届国际机器学习会议论文集,第663\u2013670页。ICML 2000,Morgan Kaufmann Publishers Inc.,San Francisco,CA,USA(2000)“},{“key”:“19_CR16”,“unstructured”:“Papadimitriou,D.,Anwar,U.,Brown,D.S.:贝叶斯逆约束强化学习。In:不确定系统安全稳健控制研讨会(NeurIPS)(2021)”}Park,D.、Noseworthy,M.、Paul,R.、Roy,S.和Roy,N.:使用贝叶斯非参数反向强化学习推断任务目标和约束。收录:Kaelbling,L.P.、Kragic,D.、Sugiura,K.(编辑)机器人学习会议记录。机器学习研究论文集,第100卷,第1005\u20131014页。PMLR(2020)“},{“key”:“19_CR18”,“doi-asserted-by”:“crossref”,“unstructured”:“Ratliff,N.D.,Bagnell,J.A.,Zinkevich,M.A.:最大利润规划。摘自:《第23届国际机器学习会议论文集》,pp.729\u2013736(2006)”,“doi”:“10.1145\/1143844.143936”},},“key“:”“19_CR19”,“非结构化”:“Schaal,S.:从示范中学习。In:Advances In Neural Information Processing Systems,vol.9(1996)“},{“key”:“19_CR20”,“unstructured”:“Scobee,D.R.,Sastry,S.S.:逆强化学习的最大似然约束推理。In:International Conference on learning Representations(2020)”},“key“:”19_CR21“,“volume-title”:“强化学习:简介”,“作者“:”RS Sutton“,”year“:”2018“,”unstructured“:”Sutton,R.S.,Barto,A.G.:强化学习:简介。麻省理工学院出版社,剑桥(2018)“},{“key”:“19_CR22”,“unstructured”:“Wulfmeier,M.,Ondruska,P.,Posner,I.:深度反向强化学习。CoRR abs\/1507.04888(2015)”},},“key“:”19_CR23“,“unsructured“:”Ziebart,B.D.,Maas,A.L.,Bagnell,J.A.,Dey,A.K.等人:最大熵逆强化学习。收录于:AAAI,第8卷,第1433\u20131438页。芝加哥,伊利诺伊州,美国(2008)“}”,“container-title”:[“计算机科学课堂讲稿”,“模式识别和机器智能”],“原始标题”:[],“链接”:[{“URL”:“https:\/\/link.springer.com/content\/pdf\/10.1007\/978-3-031-45170-6_19”,“内容类型”:“未指定”,“content-version”:“vor”,“intended-application”:“相似性检查”}],“存放“:{“date-parts”:[[2023,11,14]],“date-time”:“2023-11-14T13:05:27Z”,“timestamp”:1699967127000},“score”:1,“resource”:{(主要):{”URL“:”https:\/\/link.springer.com\/10.1007\/978-3-031-45170-6_19“},”副标题“:[],”短标题“:[],“issued”:{“date-parts”:[2023]]},《ISBN》:[“97830”31451690“,”9783031451706“],”references-count“:23,”URL“:”http:\/\/dx.doi.org\/10.1007\/978-3-031-45170-6_19“,”关系“:{},”ISSN“:[”0302-9743“,”1611-3349“],”ISSN-type“:[{”value“:”03029743“,”type“:”print“},{”value“:”1611-33049“,”类型“:”electronic“}],”subject“:【】,”published“:{”date-parts“:【2023】】},“assertion”:【{”值“:”2023年12月4日“,”订单“:1,”名称“:”first_online“,”标签“:”first online“,“group”:{“name“:”ChapterHistory“,”label“:”Chapter History”}},{“value”:“PReMI”,“order”:1,“name”:“conference_acrombit”,“label”:“conference缩写”,“group”:{“name”:“ConferenceInfo”,“标签”:“会议信息”}}}group“:{”name“:”ConferenceInfo“,”label“:”会议信息“}},{”value“:”加尔各答“,”order“:3,”name“:”Conference_city“,”标签“:”conferency city“,”group“,“group”:{“name”:“ConferenceInformation”,”label:“Conferency Information”},“value”:“India”,“order”:4,“name”:“Conference_country”,“label”:“conferencyCountry”,标签“:”会议信息“}},{”value“:”2023“,”order“:5,”name“:”Conference_year“,”label“:”Conference_year“,“group”:{“name”:“ConferenceInfo”,“label”:“会议信息”}}、{“value”:“2023年12月12日”,“order”:7,“name”:“Conference_start_date”,:“2023年12月15日“,”order“:8,”name“:”conference_end_date“,”label“:”会议结束日期“,”group“:“:”conference_id“,”label“:”会议id“,”group“:{”name“:”ConferenceInfo“,”label“:“会议信息”}},{”value“:”https:\/\/www.isical.ac.in\/~premi23\/“,”order“:11,“name”:“conferenceurl”,“label”:“会议url”,“group”:{“name”:“ConferenceInformo”,“table”:“ConferencieInfo”},“value”:“Double-blind”,“order”:1,“name“:”type“,”label“:”type“,”group“:{”name“:”ConfEventPeerReviewInformation“,”label“:”同行评审信息(由会议组织者提供)“}},{”value“:”EquinOCS“,”order“:2,”name“:”conference_management_system“,”标签“:”会议管理系统“,”group“同行评审信息(由会议组织者提供)“}},{”value“:”311“,”order“:3,”name“:”number_of_submissions_sent_for-Review“,”label“:”发送供评审的提交数量“,”group“:{”name“:”ConfEventPeerReviewInformation“,”label“:”同行评审信息(由会议组织者提供)“}},{”value“:”91“,”order“:4,”name“:”number_of_full_papers_accepted“,”label“:”接受的全文数“,”group“:{”name“:”ConfEventPeerReviewInformation“,”标签“:”同行评审信息(由会议组织者提供)“}},{”value“:”0“,”order“:5,”name“:”number_ of_short_papers_Accepteded“,”table“:”已接受的短文数“,“group”:{“name”:“”ConfEventPeerReviewInformation“,”label“:”同行评审信息(由会议组织者提供)“}},{”value“:”29%-该值由等式“接受的全文数”/“发送供评审的提交数*100”计算,然后四舍五入为整数。“,”order“:6,”name“:”acceptance_rate_of_Full_Papers“,”标签“:”全文接受率“,”group“:{”name“:”ConfEventPeerReviewInformation“,”label“:”Peer Review Information(由会议组织者提供)“}},{”value“:”3“,”order“:7,”name“:”average_number_of_reviews_per_paper“,”标签“:”每篇论文的平均评论数“,”google“:同行评议信息(由会议组织者提供)“}},{“value”:“3”,“order”:8,“name”:“average_number_of_papers_per_reviewer”,“label”:“每个审阅者的平均论文数”,“group”:{“name”:“ConfEventPeerReviewInformation”,“table”:“同行评审信息(由大会组织者提供)”}}external_reviewers_involved“,”label“:”涉及外部审阅者“,”group“:{”name“:”ConfEventPeerReviewInformation“,”标签“:”同行审阅信息(由会议组织者提供)“}}]}}