{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,6,30]],“日期-时间”:“2024-06-30T02:54:51Z”,“时间戳”:1719716091783},“出版商位置”:“美国纽约州纽约市”,“参考-计数”:52,“出版者”:“ACM”,“许可证”:[{“开始”:{-“日期-零件”:[2023,12,8]],“date-time”:“2023-12-08T00:00:00Z”,“时间戳”:1701993600000},“content-version”:“vor”,“delay-in-days”:394,“URL”:“http://www.acm.org\/publications\/policys\/corpyright_policy#Background”}],“funder”:[{“DOI”:“10.13039\/100000001”,“name”:“NSF(National Science Foundation)”,“DOI-asserted-by”:“publisher”,“award”:[“1834701,2038853”]}“name”:“美国能源部。能源部“,”doi-asserted-by“:”publisher“,”award“:[”DE-EE0009150“]}],”content-domain“:{”domain“:[”dl.acm.org“],”crossmark-restriction“:true},”short-container-title“:[],”published-print“:{”date-parts“:[2022,11,9]]},“doi”:“10.1145\/3563357.3564064”,“type”:“proceedings-article”,“created”:{“date-part”:[[2022,12,8]],“日期时间”:“2022-12-08T18:31:36Z“,”timestamp“:1670524296000},”update-policy“:”http://\/dx.doi.org\/10.1145\/crossmark-policy“,”source“:“Crossref”,“is-referenced-by-count”:5,“title”:[“使用异构专家指南加速建筑暖通空调控制的在线强化学习”],“prefix”:“10.1145”,”author“:[{”given“”:“Shichao”,“family”:“Xu”,“sequence”:“”第一”,“隶属关系”:[{“名称”:“西北大学”}]},{“给定”:“洋洋”,“家族”:“福”,“序列”:“附加”,“隶属关系”:[{“名称”:“得克萨斯农工大学”}]},{“给定”:“一轩”,“家族”:“王”,“序列”:“附加”,“隶属关系”:[{“名称”:“西北大学”}]},{“给定”:“卓然”,“家族”:“杨”,“序列”:“附加”affiliation“:[{”name“:”Yale University“}]},{”given“:”Zheng“,”family“:”O'Neill“,”sequence“:”additional“,”affiliation:[{“name”:“Texas A&M University”}]}.,{“given”:“Zhaoran”,“family”:“Wang”,“sequence”:“additional”,“affiliance”:[{“名称”:“西北大学“}]}],“成员”:“320”,“在线发布”:{“日期部分”:[[2022,12,8]]},“参考”:[{“密钥”:“e_1_3_2_1_1_1”,“卷时间”:“艾哈迈德·帕瓦雷什、阿曼·法托拉希、梅萨姆·盖萨内贾德和穆罕默德·哈桑·霍本。”,“作者”:“阿布拉齐·萨伯”,“年份”:“2022”,“非结构化”:“Saber Abrazeh、Saeid-Reza Mohseni、Meisam Jahanshahi Zeitouni、Ahmad Parvaresh、Arman Fathollahi、Meysam Ghesarnejad和Mohammad-Hassan Khooban。2022 . 用于暖通空调(HVAC)系统的基于虚拟硬件在回路FMU协同仿真的数字双胞胎。IEEE计算智能新兴主题汇刊(2022年)。Saber Abrazeh、Saeid-Reza Mohseni、Meisam Jahanshahi Zeitouni、Ahmad Parvaresh、Arman Fathollahi、Meysam Ghesarnejad和Mohammad-Hassan Khooban。2022.用于暖通空调(HVAC)系统的基于虚拟硬件在回路FMU协同仿真的数字双胞胎。IEEE计算智能新兴主题汇刊(2022年)。},{“key”:“e_1_3_2_1_2_1”,“非结构化”:“Rishabh Agarwal Dale Schuurmans和Mohammad Norouzi.2020。对离线强化学习持乐观态度。在ICML中。PMLR公司。Rishabh Agarwal Dale Schuurmans和Mohammad Norouzi。2020年,对离线强化学习持乐观态度。在ICML中。PMLR公司。“},{”key“:”e_1_3_2_1_3_1“,”volume-title“:”Openai健身房。arXiv预印本arXiv:1606.01540“,”author“:”Brockman Greg“,”year“:”2016“,”unstructured“:”Greg Brockman、Vicki Cheung、Ludwig Pettersson、Jonas Schneider、John Schulman、Jie Tang和Wojciech Zaremba。2016。Openai健身房。arXiv预印arXiv:1606.01540(2016)。Greg Brockman、Vicki Cheung、Ludwig Pettersson、Jonas Schneider、John Schulman、Jie Tang和Wojciech Zaremba。2016年。Openai健身房。arXiv预印arXiv:1606.01540(2016)。“},{”key“:”e_1_3_2_1_4_1“,”首页“:”18353“,”article-title“:”BAIL:“批量深度强化学习的最佳动作模仿学习”,“卷”:“33”,“作者”:“陈新跃”,“年份”:“2020”,“非结构化”:“陈新跃、周子建、王郑、王车、吴彦秋和基思·罗斯。2020 . BAIL:用于批量深度强化学习的最佳动作模仿学习。神经信息处理系统进展33(2020),18353-18363。陈新跃、周子建、王郑、王车、吴彦秋和基思·罗斯。2020.BAIL:批量深度强化学习的最佳动作模仿学习。《神经信息处理系统的进展》33(2020),18353-18363。”,“日记标题”:“神经信息处理体系的进展”},{“key”:“e_1_3_2_1_5_1”,“volume-title”:“启发式强化学习。NeurIPS”,“author”:“程庆安”,“year”:“2021”,“unstructured”:“程庆安、安德烈·科洛波夫和阿迪思·斯瓦米纳坦。2021.启发式强化学习。NeurIPS(2021)。程庆安、安德烈·科洛波夫和阿迪思·斯瓦米纳坦。2021.启发式强化学习。NeurIPS(2021)。“},{”key“:”e_1_3_2_1_6_1“,”首页“:”49“,”article-title“:”Energy plus:能源模拟程序“,”volume“:“42”,”author“:”Crawley Drury B“,”year“:”2000“,”unstructured“:”Drury B-Crawley,Linda K Lawrie,Curtis O Pedersen,and Frederick C Winkelmann.2000.Energy plus:Energy simulation program.ASHRAE journal 42,4(2000), 49 -- 56 . Drury B Crawley、Linda K Lawrie、Curtis O Pedersen和Frederick C Winkelmann。2000年。能源+:能源模拟计划。ASHRAE journal 42,4(2000),49-56.“,”journal-title“:”ASHRAE-journal“},{”key“:”e_1_3_2_1_7_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145 \/3486611.3492412”},}“key”:“e_1_3_2_1_8_1”,“volume-title”:“标杆批深度强化学习算法。arXiv预印本arXiv:1910.01708”,“作者”:“Fujimoto Scott”,“年份”:“2019”,“非结构化“:”Scott Fujimoto、Edoardo Conti、Mohammad Ghavamzadeh和Joelle Pineau。2019.对批量深度强化学习算法进行基准测试。arXiv预印arXiv:1910.01708(2019)。Scott Fujimoto、Edoardo Conti、Mohammad Ghavamzadeh和Joelle Pineau。2019.对批量深度强化学习算法进行基准测试。arXiv预印arXiv:1910.01708(2019)。“},{”key“:”e_1_3_2_1_9_1“,”volume-title“:”离线强化学习的极简方法。NeurIPS“,”author“:”Fujimoto Scott“,”year“:”2021“,”unstructured“:”Scott Fujimoton and Shixiang Shane Gu.2021。离线强化学习的最低限度方法。NeurIPS(2021)。Scott Fujimoto和Shixiang Shane Gu.2021。离线强化学习的最低限度方法。NeurIPS(2021)。“},{”key“:”e_1_3_2_10_1“,”volume-title“:”机器学习国际会议.PMLR“,“author”:“Fujimoto Scott”,“year”:“2019”,“unstructured”:“Scott Fujimoton,David Meger,and Doina Precup.2019.非政策性深层强化学习,无探索。在国际机器学习会议上。PMLR,2052-2062。Scott Fujimoto、David Meger和Doina Precup。2019.非政策性深度强化学习,无需探索。在机器学习国际会议上。PMLR,2052--2062.“},{”key“:”e_1_3_2_11_1“,”volume-title“:”通过深度强化学习实现智能建筑的节能热舒适控制。arXiv预印本arXiv:1901.04693“,”author“:”Gao Guanyu“,”year“:”2019“,”unstructured“:”GuanyuGao,Jie Li,and Yongang Wen.2019。通过深度强化学习实现智能建筑中的节能热舒适控制。arXiv预印本arXiv:1901.04693(2019)。高冠宇、李杰和温永刚。2019.通过深度强化学习在智能建筑中实现节能热舒适控制。arXiv预印本arXiv:1901.04693(2019)。“},{”key“:”e_1_3_2_12_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1109\/JIOT.2020.2992117“}”,{“key”:“e_1_ 3_2_13_1”,“volume-title”:“国际学习代表大会”,“author”:“Guo Yijie”,“year”:“2020”,“unstructured”:“郭一杰(Yijie Guo)、冯胜瑜(Shengyu Feng)、尼古拉斯·勒鲁(Nicolas Le Roux)、埃德·池(Ed Chi)、李洪拉克(Honglak Lee)和陈敏敏(Minmin Chen)。2020 . 通过连续法进行批量强化学习。在学习代表国际会议上。郭一杰、冯胜宇、Nicolas Le Roux、Ed Chi、Honglak Lee和Minmin Chen。2020年。通过连续法进行批量强化学习。在学习代表国际会议上。“},{”key“:”e_1_3_2_14_1“,”volume-title“:”高斯误差线性单位(gelus)。arXiv预印本arXiv:1606.08415“,”author“:”Hendrycks Dan“,“year”:“2016”,“unstructured”:“Dan Hendryck and Kevin Gimpel。2016。高斯误差线性单位(gelus)。arXiv预印arXiv:1606.08415(2016)。丹·亨德里克斯和凯文·金佩尔。2016.高斯误差线性单位(gelus)。arXiv预印arXiv:1606.08415(2016)。“},{”key“:”e_1_3_2_15_1“,”unstructured“:”杰弗里·辛顿黄鹂葡萄酒Jeff Dean等人,2015年。在神经网络中提取知识。arXiv预印本arXiv:1503.02531 2 7(2015)。Geoffrey Hinton Oriol Vinyals Jeff Dean等人,2015年。在神经网络中提取知识。arXiv预印本arXiv:1503.02531 2 7(2015)。“},{”key“:”e_1_3_2_16_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1007 \/s10489-021-02239-z”},“key”:“e_1_ 3_2_1_17_1”,“volume-title”:“Craig Ferguson,Agata Lapedriza,Noah Jones,Shixiang Gu,and Rosalind Picard.”,“作者”:“Jaques Natasha”,“年份”:“2019”,“非结构化”:“娜塔莎·贾克斯(Natasha Jaques)、阿斯玛·甘德哈里翁(Asma Ghandharioun)、朱迪·汉文·沈(Judy Hanwen Shen)、克雷格·弗格森(Craig Ferguson)、阿加塔·拉佩德里扎(Agata Lapedriza)、诺亚·琼斯(Noah。2019 . f-policy批量深度强化学习对话中隐含的人类偏好。arXiv预印本arXiv:1907.00456(2019)。娜塔莎·贾克斯(Natasha Jaques)、阿斯玛·甘德哈里翁(Asma Ghandharioun)、朱迪·汉文·沈(Judy Hanwen Shen)、克雷格·弗格森(Craig Ferguson)、阿加塔·拉佩德里扎(Agata Lapedriza)、诺亚·琼斯(Noah Jones)、顾世祥(Shixiang Gu)和罗莎琳德·皮卡德(Rosalind Picard)。2019.非政策性批量深入强化对话中隐含人类偏好的学习。arXiv预印本arXiv:1907.00456(2019)。“},{”key“:”e_1_3_2_18_1“,”doi-asserted-by“:”publisher“,“doi”:“10.2172\/90674”},“key”:“e_1_ 3_2_19_1”,“volume-title”:“Adam:一种随机优化方法。arXiv预印本arXiv:1412.6980”,“author”:“Kingma Diederik P”,“年份”:“2014”,“非结构化”:”Diederik P Kingma和Jimmy Ba。2014 . 亚当:一种随机优化方法。arXiv预印arXiv:1412.6980(2014)。Diederik P Kingma和Jimmy Ba.2014年。亚当:一种随机优化方法。arXiv预印arXiv:1412.6980(2014)。“},{”key“:”e_1_3_2_1_20_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1038\/sj.jea.7500165”},“key”:“e_1_ 3_2_1_2 1_1”,“首页”:“1179”,“文章标题”:“离线强化学习的保守q学习”,“卷”:“33”,“作者”:“Kumar Aviral”,“年份”:“2020”,“非结构化”:“阿维拉尔·库马尔(Aviral Kumar)、奥里克·周(Aurick Zhou)、乔治·塔克(George Tucker)和谢尔盖·莱文(Sergey Levine)。2020 . 离线强化学习的保守q学习。《神经信息处理系统进展》33(2020),1179--1191。阿维拉尔·库马尔(Aviral Kumar)、奥里克·周(Aurick Zhou)、乔治·塔克(George Tucker)和谢尔盖·莱文(Sergey Levine)。2020.线下强化学习的保守q学习。《神经信息处理系统的进展》33(2020),1179--1191。”,“期刊标题”:“神经信息处理体系的进展”},{“关键”:“e_1_3_2_1_22_1”,“卷-时间”:“离线强化学习:开放问题的教程、回顾和观点。arXiv预印本arXiv:2005.01643”,“作者”:“Levine Sergey”,“年份”:“2020”,“非结构化”:谢尔盖·莱文、阿维拉尔·库马尔、乔治·塔克和贾斯汀·傅。2020年。离线强化学习:关于开放性问题的教程、回顾和观点。arXiv预印arXiv:2005.01643(2020)。谢尔盖·莱文、阿维拉尔·库马尔、乔治·塔克和贾斯汀·傅。2020年。离线强化学习:关于开放性问题的教程、回顾和观点。arXiv预印本arXiv:2005.01643(2020)。“},{”key“:”e_1_3_2_1_23_1“,”doi-asserted-by“:”publisher“,\/TCST.2011.2124461“},{”key“:”e_1_3_2_1_26_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1115\/DSCC2011-6078“},{”key“:”e_1_3_2_1_27_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1016\/j.enbuild.2014.03.057”},“key”:“e_1_3_1_28_1”,“doi-assert-by”:“publisher”,”doi“:”10.1016\/S0967-0661(98)00047-1“}”,{“,”doi“:”10.5555\/2600239.2600241“},{”key“:”e_1_3_2_1_30_1“,”volume-title“:”利用离线数据集加快在线强化学习。arXiv预印本arXiv:2006.09359“,”作者“:”奈尔·阿什文“,”年份“:”2020“,”非结构化“:”阿什文·奈尔、穆塔扎·达拉尔、阿比舍克·古普塔和谢尔盖·莱文。2020年。利用离线数据集加快在线强化学习。arXiv预印本arXiv:2006.09359(2020)。阿什文·奈尔(Ashvin Nair)、穆尔塔扎·达拉(Murtaza Dalal)、阿比谢克·古普塔(Abhishek Gupta)和谢尔盖·莱文(Sergey Levine)。2020年。利用离线数据集加快在线强化学习。arXiv预印本arXiv:2006.09359(2020)。},{“key”:“e_1_3_2_1_31_1”,“volume-title”:“使用深度强化学习的商业建筑在线能源管理。2019年IEEE SMARTCOMP”,“author”:“Naug Aviek”,“unstructured”:“Aviek Naug,Ibrahim Ahmed,and Gautam Biswas.2019。商业建筑中使用深度强化学习的在线能源管理。2019年IEEE SMARTCOMP。IEEE,249--257。阿维埃克·瑙格(Aviek Naug)、易卜拉欣·艾哈迈德(Ibrahim Ahmed)和乔塔姆·比斯瓦斯(Gautam Biswas)。2019.使用深度强化学习在商业建筑中进行在线能源管理。2019年IEEE SMARTCOMP。IEEE,249--257.“},{”key“:”e_1_3_2_1_32_1“,”非结构化“:”美国能源部,2011年。建筑能源数据手册。美国能源部,2011年。建筑能源数据手册。},{“key”:“e_1_3_2_1_33_1”,“unstructured”:“美国劳工部,2021年。OSHA技术手册(OTM)第三节:第2章。美国劳工部。2021.OSHA技术手册(OTM)第三节:第2章。“},{“key”:“e_1_3_2_1_34_1”,“unstructured”:“Bjarne W Olesen和Gail S Brager,2004。预测舒适度的更好方法:新的ASHRAE标准55-2004。(2004). Bjarne W Olesen和Gail S Brager。2004年。预测舒适度的更好方法:新的ASHRAE标准55-2004。(2004).“},{”key“:”e_1_3_2_1_35_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1016\/j.enbuild.2016.09.044”},},“key”:“e_1_ 3_2_1_1_36_1”,“volume-title”:“使用离线强化学习的自动建筑控制。在P2P、并行、网格、云和互联网计算国际会议上。Springer,246-255”,”author“:”Schepers-Jorren“,”“年份:”2021“,”非结构化“:”Jorren Schepers、Reinout Eyckerman、Furkan Elmaz、Wim Casteels、Steven Latr\u00e9和Peter Hellinckx。2021 . 使用离线强化学习的自主建筑控制。参加P2P、并行、网格、云和互联网计算国际会议。施普林格,246-255。Jorren Schepers、Reinout Eyckerman、Furkan Elmaz、Wim Casteels、Steven Latr\u00e9和Peter Hellinckx。2021.使用离线强化学习的自动建筑控制。参加P2P、并行、网格、云和互联网计算国际会议。Springer,246--255.“},{”key“:”e_1_3_2_1_37_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1016\/j.enconman.2019.111924”},“key”:“e_1_a_2_1_38_1”,“unstructured”:“Ikechukwu Uchendu Ted Xiao Yao Lu Banghua Zhu Mengyuan Yan Jos\u00e9phine Simon Matthew Bennice Chuyuan Fu Cong Ma Jiantao Jiao etal 2022。跳跃式强化学习。arXiv预打印arXiv:2204.02372(2022)。Ikechukwu Uchendu Ted Xiao Yao Lu Banghua Zhu Mengyuan Yan Jos\u00e9phine Simon Matthew Bennice Chuyuan Fu Cong Ma Jian等人,2022年。快速启动强化学习。arXiv预打印arXiv:2204.02372(2022)。“},{”key“:”e_1_3_2_1_39_1“,”doi-asserted-by“:”publisher“,“doi”:“10.5555\/3016100.3016191”},“key”:“e_1_ 3_2_1_40_1”,“首页”:“7768”,“文章标题”:“批评家正则回归”,“数量”:“33”,“作者”:“王子玉”,“年份”:“2020”,“非结构化”:“王子瑜、亚历山大·诺维科夫、康拉德·佐尔纳、乔什·梅雷尔、乔斯特·托比亚斯·斯普林伯格、斯科特·里德、博巴克·沙赫里亚里、诺亚·西格尔、卡格拉·古尔塞里、尼古拉·海斯,2020年。评论家规范了回归。神经信息处理系统进展33(2020),7768-7778。Ziyu Wang、Alexander Novikov、Konrad Zolna、Josh S Merel、Jost Tobias Springenberg、Scott E Reed、Bobak Shahriari、Noah Siegel、Caglar Gulcehre、Nicolas Heess等,2020年。评论家规范了回归。《神经信息处理系统的进展》33(2020),7768-7778.“,”期刊标题“:“神经信息处理系统的进展”},{“key”:“e_1_3_2_41_1”,“doi断言”:“publisher”,“doi”:“10.1145\/30616393.062224”},{“key”:“e_1_3_2_42_1”,“doi断言”:“publisher”,“doi”:“10.1109\/TC.2015.2495244”},{“key”:“e_1_3_2_1_43_1”,“doi-asserted-by“:”crossref“,”unstructured“:”Stephen Wilcox和William Marion。2008年。TMY3数据集用户手册。(2008). 斯蒂芬·威尔科克斯和威廉·马里恩。2008年。TMY3数据集用户手册。(2008).“,”DOI“:”10.2172\/928611“},{”key“:”e_1_3_2_1_44_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1016\/j.compchemeng.2017.02.023”},“key”:“发布者”,“DOI”:“10.1145\/3408308.3427617”},{“密钥”:“e_1_3_2_1_47_1”,“DOI-asserted-by”:“publisher“,”DOI“:”10.1109\/TSG.2020.3011739“},”{“key”:“e_1_3_2_1_48_1”,”DOI-asserted-by“:”publisher”,“DOI”:“10.1109\/JIOT.2019.2957289”},{“密钥”:“e_1_3_2_1_49_1”、“DOI-assert-by”:“crossref”、”unstructured“:”Kyungtae Yun Rogelio Luck Pedro J Mago and Heejin Cho.2012。使用索引ARX模型进行逐时热负荷预测。能源和建筑。Kyungtae Yun Rogelio Luck Pedro J Mago和Heejin Cho。2012年。使用索引ARX模型进行逐时热负荷预测。能源和建筑。“,”DOI“:”10.1016\/j.enbuild.2012.08.007“},{”key“:”e_1_3_2_1_50_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1145\/3427773.3427865”},“key”:“e_1_s2_51_1”,“DOI-assert-by”:“publisher”,”DOI:“10.1016\/j.enbuild.2019.07.029”}title“:“2018年建筑性能分析会议与SimBuild”,“卷”:“3”,“作者”:“张志昂”,“年份”:“2018年”,“非结构化”:“张志昂、张亚德里、潘玉琪、张晨露、吕思良和林桂波。2018 . 使用整栋建筑能量模型进行暖通空调优化控制的深度强化学习方法。2018年建筑性能分析会议和SimBuild,第3卷。22--23. 张志昂(Ziang Zhang)、张志安(Adrian Chong)、潘玉琪(Yuqi Pan)、张晨露(Chenlu Zhang,Siliang Lu)和林开波(Khee Poh Lam)。2018年。使用整栋建筑能量模型进行暖通空调优化控制的深度强化学习方法。在2018年建筑性能分析会议和SimBuild,第3卷。22--23.“}”,“event”:{“name”:“BuildSys'22:第九届ACM国际节能建筑、城市和交通系统会议”,“location”:“Boston Massachusetts”,“缩写词”:“BuildSys'22”,“赞助商”:[“SIGEnergy ACM能源系统和信息学特别兴趣小组”]},“container-title”:[”第九届ACM国际节能建筑、城市和交通系统会议记录“],“original-title”:[],“link”:[{“URL”:“https:\/\/dl.ACM.org\/doi\/pdf\/10.1145\/3563357.3564064”,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“syndication”},{“URL”:“https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3563357.3564064“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2023,11,9]],”date-time“:“2023-11-09T11:26:05Z”,”timestamp“:1699529165000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3563357.3564064“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[2022,11,9]]},“引用计数”:52,“alternative-id”:[“10.1145\/3563557.3564.064”,“10.1145\/3563357”],“URL”:“http://\/dx.doi.org\/10.1145 \/35633.56.4064”,“关系”:{},“主题”:[],“已发布”:{“日期部分”:[2022,11,9]]},”断言“:[{”value“:”2022-12-08“,”order“:2,”name“:”published“,”label“:”published“,”group“:{”name“:”publication_history“,”标签“:”publication history“}}]}}