{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期部分”：[[2023,11,15]]，“日期时间”：“2023-11-15T00:14:38Z”，“时间戳”：1700007278054}，“发布者位置”：“Cham”，“引用计数”：23，“发布商”：“Springer Nature Switzerland”，“isbn-type”：[{“值”：“9783031451690”，“类型”：”打印“}，{“值”：“9783031451706”，“type”：“electronic”}]，“license”：[{“start”：{“date-parts”：[[2023,1,1]]，“date-time”：“2023-01-01T00:00:00Z”，“timestamp”：1672531200000}，“content-version”：“tdm”，“delay-in-days”：0，“URL”：“https:\/\/www.springernature.com\/gp\/researters\/text-and-data-mining”}，{“开始”：{“date-ports”：[2023,1,1]，“日期-时间”：“2023-01-01T00:00:00Z”，“时间戳”：1672531200000}，“content-version”：“vor”，“delay-in-days”：0，“URL”：“https://www.springernature.com//gp\/researters\/text-and-data-mining”}]，“content-domain”：{“domain”:[“link.springer.com”]，“crossmark-restriction”：false}，”short-container-title“：[]，”published-print“：{”date-parts“：[2023]]}”，“DOI”：“10.1007\/978-3-03”31-45170-6_19“，”类型“：”书壳“，“created”：{“date-parts”：[[2023,11,14]]，“date-time”：“2023-11-14T13:03:03Z”，“timestamp”：1699966982000}，“page”：“179-188”，“update-policy”：”http:\\/dx.doi.org\/10.1007\/springer_crossmark_policy“，”source“：”Crossref“，“is-referenced-by-count”：0，“title”：[“带u00a0Constraint Recovery的反向强化学习”]，“prefix”：“10.10 007“，”作者“：[{”给定“：“Nirjhar”，“family”：“Das”，“sequence”：“first”，“affiliation”：[]｝，｛“given”：“Arpan”，“family”：“Chattopadhyay”，“sequence”：“additional”，“affiliation”：[]｝]，“member”：“297”，“在线发布”：｛“日期部分”：[[2023,12,4]]｝，“reference”：[｛“key”：“19_CR1”，“doi asserted by”：“crossref”，“nonstructured”：“Abbeel，P.，Ng，A.Y.：通过反向强化学习进行学徒学习。摘自：《第二十届第一届机器学习国际会议论文集》，第1页。ICML 2004，计算机械协会，纽约，纽约，美国（2004）“，”DOI“：”10.1145\/1015330.1015430“}，{”key“：”19_CR2“，”volume-title“：”约束马尔可夫决策过程“，”author“：”E Altman“，”year“：”1999“，”unstructured“：”Altman，E.：约束马尔可夫决策过程。Chapman and Hall，London（1999）“}”，{“issue”：“5”，“key”：“19_CR3”，“doi-asserted-by“：”publisher“，”first page“：”469“，”doi“：”10.1016\/j.robot.2008.10.024“，”volume“：“57”，”author“：”BD Argall“，”year“：”2009“，”unstructured“：”Argall，B.D.，Chernova，S.，Veloso，M.，Browning，B.：机器人演示学习调查。机器人。汽车。系统。57（5），469\u2013483（2009）“，“新闻标题”：“机器人。自动。系统。“}，{”key“：”19_CR4“，”series-title“：”Springer Proceedings in Advanced Robotics“，”doi-asserted-by“：”publisher“，”first page“：“228”，“doi”：“10.1007\/978-3-030-44051-0_14”，“volume-title”：“机器人算法基础XIII”，“author”：“G Chou”，“year”：“2020”，“unstructured”：“Chou，G.，Berenson，D.，Ozay，N.：从演示中学习约束。收录人：Morales，M.、Tapia，L.、S\u00e1nchez-Ate，G.、Hutchinson，S.（编辑）《2018年世界金融报告》。SPAR，第14卷，第228\u2013245页。查姆施普林格（2020）。https:\/\/doi.org\/10.1007\/978-3-030-44051-0_14“}，{“key”：“19_CR5”，“unstructured”：“Chou，G.，Berenson，D.，Ozay，N.：演示自适应安全运动规划的不确定性感知约束学习。摘自：机器人学习会议，第1612\u20131639页。PMLR（2021）“}，{“key”：“19_CR6”，“unstructured”：“Ding，F.，Xue，Y.：X-men:保最大熵约束反向强化学习。In:Cussens，J.，Zhang，K.（eds.）《第三十八届人工智能不确定性会议论文集》。《机器学习研究论文集》，第180卷，第589页\u2013598。PMLR（2022）“}，{”issue“：”13\u201314“，”key“：”19_CR7“，”doi-asserted-by“：”publisher“，”first page“：“1474”，“doi”：“10.1177\/0278364917745980”，“volume”：“36”，“author”：“P Englert”，“year”：“2017”，“unstructured”：“Englert，P.，Vien，N.A.，Toussaint，M.：反向KKKKTT：从演示中学习操纵任务的成本函数。国际期刊。机器人。第36号决议（13\u201314），第1474\u20131488号决议（2017）。https:\/\/doi.org\/10.1177\/0278364917745980“，”journal-title“：”Int.J.Robot。Res.“}，{”key“：”19_CR8“，”unstructured“：”Finn，C.，Levine，S.，Abbeel，P.：引导成本学习：通过策略优化实现深度逆最优控制。摘自：机器学习国际会议，第49\u201358页。PMLR（2016）“}，{“key”：“19_CR9”，“unstructured”：“Gaurav，A.，Rezaee，K.，Liu，G.，Poupart，P.：从约束专家演示中学习软约束（2022）”}，}，“key“：”19_CR10“，”doi-asserted-by“：”crossref“，”unstructure“：”Hazan，E.等人：在线凸优化简介。发现。趋势\u00ae Optim.2（3\u20134），157\u2013325（2016）“，”DOI“：”10.1561\/240000013“}，{“key”：“19_CR11”，“unstructured”：“Ho，J.，Ermon，S.：生成性对抗性模仿学习。In:Advances In Neural Information Processing Systems，vol.29（2016）”}，“key“：”19_CR12“，”DOI-asserted-by“：”publisher“，”first page“：，“非结构化”：“Kaelbling，L.P.，Littman，M.L.，Moore，A.W.：强化学习：一项调查。J.阿蒂夫。智力。第4号决议，237\u2013285（1996）“，“期刊标题”：“J.Artif。智力。研究“}，{“key”：“19_CR13”，“首页”：“14291”，“卷”：“33”，“作者”：“G Kalweit”，“年份”：“2020”，“非结构化”：“Kalweit，G.，Huegle，M.，Werling，“非结构化”：“Malik，S.，Anwar，U.，Aghasi，A.，Ahmed，A.：反向约束强化学习。收录：Meila，M.，Zhang，T.（编辑）第38届机器学习国际会议论文集。机器学习研究论文集，第139卷，第7390\u20137399页。PMLR（2021）“}，{“key”：“19_CR15”，“unstructured”：“Ng，A.Y.，Russell，S.J.：逆强化学习算法。摘自：第十七届国际机器学习会议论文集，第663\u2013670页。ICML 2000，Morgan Kaufmann Publishers Inc.，San Francisco，CA，USA（2000）“}，{“key”：“19_CR16”，“unstructured”：“Papadimitriou，D.，Anwar，U.，Brown，D.S.：贝叶斯逆约束强化学习。In:不确定系统安全稳健控制研讨会（NeurIPS）（2021）”}Park，D.、Noseworthy，M.、Paul，R.、Roy，S.和Roy，N.：使用贝叶斯非参数反向强化学习推断任务目标和约束。收录：Kaelbling，L.P.、Kragic，D.、Sugiura，K.（编辑）机器人学习会议记录。机器学习研究论文集，第100卷，第1005\u20131014页。PMLR（2020）“}，{“key”：“19_CR18”，“doi-asserted-by”：“crossref”，“unstructured”：“Ratliff，N.D.，Bagnell，J.A.，Zinkevich，M.A.：最大利润规划。摘自：《第23届国际机器学习会议论文集》，pp.729\u2013736（2006）”，“doi”：“10.1145\/1143844.143936”}，}，“key“：”“19_CR19”，“非结构化”：“Schaal，S.：从示范中学习。In:Advances In Neural Information Processing Systems，vol.9（1996）“}，{“key”：“19_CR20”，“unstructured”：“Scobee，D.R.，Sastry，S.S.：逆强化学习的最大似然约束推理。In:International Conference on learning Representations（2020）”}，“key“：”19_CR21“，“volume-title”：“强化学习：简介”，“作者“：”RS Sutton“，”year“：”2018“，”unstructured“：”Sutton，R.S.，Barto，A.G.：强化学习：简介。麻省理工学院出版社，剑桥（2018）“}，{“key”：“19_CR22”，“unstructured”：“Wulfmeier，M.，Ondruska，P.，Posner，I.：深度反向强化学习。CoRR abs\/1507.04888（2015）”}，}，“key“：”19_CR23“，“unsructured“：”Ziebart，B.D.，Maas，A.L.，Bagnell，J.A.，Dey，A.K.等人：最大熵逆强化学习。收录于：AAAI，第8卷，第1433\u20131438页。芝加哥，伊利诺伊州，美国（2008）“}”，“container-title”：[“计算机科学课堂讲稿”，“模式识别和机器智能”]，“原始标题”：[]，“链接”：[{“URL”：“https:\/\/link.springer.com/content\/pdf\/10.1007\/978-3-031-45170-6_19”，“内容类型”：“未指定”，“content-version”：“vor”，“intended-application”：“相似性检查”}]，“存放“：{“date-parts”：[[2023,11,14]]，“date-time”：“2023-11-14T13:05:27Z”，“timestamp”：1699967127000}，“score”：1，“resource”：{（主要）：{”URL“：”https:\/\/link.springer.com\/10.1007\/978-3-031-45170-6_19“}，”副标题“：[]，”短标题“：[]，“issued”：{“date-parts”：[2023]]}，《ISBN》：[“97830”31451690“，”9783031451706“]，”references-count“：23，”URL“：”http:\/\/dx.doi.org\/10.1007\/978-3-031-45170-6_19“，”关系“：{}，”ISSN“：[”0302-9743“，”1611-3349“]，”ISSN-type“：[{”value“：”03029743“，”type“:”print“}，{”value“：”1611-33049“，”类型“：”electronic“}]，”subject“：【】，”published“：{”date-parts“：【2023】】}，“assertion”：【{”值“：”2023年12月4日“，”订单“：1，”名称“：”first_online“，”标签“：”first online“，“group”：{“name“：”ChapterHistory“，”label“：”Chapter History”}}，{“value”：“PReMI”，“order”：1，“name”：“conference_acrombit”，“label”：“conference缩写”，“group”：{“name”:“ConferenceInfo”，“标签”：“会议信息”}}}group“：{”name“：”ConferenceInfo“，”label“：”会议信息“}}，{”value“：”加尔各答“，”order“：3，”name“:”Conference_city“，”标签“：”conferency city“，”group“，“group”：{“name”：“ConferenceInformation”，”label:“Conferency Information”}，“value”：“India”，“order”：4，“name”:“Conference_country”，“label”：“conferencyCountry”，标签“：”会议信息“}}，{”value“：”2023“，”order“：5，”name“：”Conference_year“，”label“：”Conference_year“，“group”：{“name”：“ConferenceInfo”，“label”：“会议信息”}}、{“value”：“2023年12月12日”，“order”：7，“name”:“Conference_start_date”，：“2023年12月15日“，”order“：8，”name“：”conference_end_date“，”label“：”会议结束日期“，”group“：“：”conference_id“，”label“：”会议id“，”group“：{”name“：”ConferenceInfo“，”label“：“会议信息”}}，{”value“：”https:\/\/www.isical.ac.in\/~premi23\/“，”order“：11，“name”：“conferenceurl”，“label”：“会议url”，“group”：{“name”:“ConferenceInformo”，“table”：“ConferencieInfo”}，“value”：“Double-blind”，“order”：1，“name“：”type“，”label“：”type“，”group“：{”name“：”ConfEventPeerReviewInformation“，”label“：”同行评审信息（由会议组织者提供）“}}，{”value“：”EquinOCS“，”order“：2，”name“:”conference_management_system“，”标签“：”会议管理系统“，”group“同行评审信息（由会议组织者提供）“｝｝，｛”value“：”311“，”order“：3，”name“：”number_of_submissions_sent_for-Review“，”label“：”发送供评审的提交数量“，”group“：｛”name“：”ConfEventPeerReviewInformation“，”label“：”同行评审信息（由会议组织者提供）“｝｝，｛”value“：”91“，”order“：4，”name“：”number_of_full_papers_accepted“，”label“：”接受的全文数“，”group“：{”name“：”ConfEventPeerReviewInformation“，”标签“：”同行评审信息（由会议组织者提供）“}}，{”value“：”0“，”order“：5，”name“:”number_ of_short_papers_Accepteded“，”table“：”已接受的短文数“，“group”：{“name”：“”ConfEventPeerReviewInformation“，”label“：”同行评审信息（由会议组织者提供）“}}，{”value“：”29%-该值由等式“接受的全文数”/“发送供评审的提交数*100”计算，然后四舍五入为整数。“，”order“：6，”name“：”acceptance_rate_of_Full_Papers“，”标签“：”全文接受率“，”group“：{”name“：”ConfEventPeerReviewInformation“，”label“：”Peer Review Information（由会议组织者提供）“}}，{”value“：”3“，”order“：7，”name“:”average_number_of_reviews_per_paper“，”标签“：”每篇论文的平均评论数“，”google“：同行评议信息（由会议组织者提供）“}}，{“value”：“3”，“order”：8，“name”：“average_number_of_papers_per_reviewer”，“label”：“每个审阅者的平均论文数”，“group”：{“name”:“ConfEventPeerReviewInformation”，“table”：“同行评审信息（由大会组织者提供）”}}external_reviewers_involved“，”label“：”涉及外部审阅者“，”group“：{”name“：”ConfEventPeerReviewInformation“，”标签“：”同行审阅信息（由会议组织者提供）“}}]}}