志旭 0001
人员信息
从属关系(博士2021): 美国马萨诸塞州坎布里奇市麻省理工学院信息与决策系统实验室
其他同名人员
优化列表
2020年–今天
2022 [j3] 德瓦夫拉特·沙阿 , 谢巧敏 , 志旭 :
蒙特卡罗树搜索的非渐近分析。 操作。 物件。 70 ( 6 ) : 3234-3260 ( 2022 ) 2021 【b1】 志旭 :
数据高效强化学习。 美国麻省理工学院, 2021 [注2] 约翰·齐齐克利斯 , 匡旭 , 志旭 :
私人连续学习。 操作。 物件。 69 ( 5 ) : 1575-1590 ( 2021 ) [第12条] 阿尼什·阿加瓦尔 , 阿卜杜拉·阿洛马尔 , 瓦基氧化铝 , 德瓦夫拉特·沙阿 , 丹尼斯·沈 , 志旭 , 杨欣怡 :
PerSim:通过个性化模拟器使用异构代理进行数据高效的离线强化学习。 NeurIPS公司 2021 : 18564-18576 [i10] 阿尼什·阿加瓦尔 , 阿卜杜拉·阿洛马尔 , 瓦基氧化铝 , 德瓦夫拉特·沙阿 , 丹尼斯·沈 , 志旭 , 杨欣怡 :
PerSim:通过个性化模拟器使用异构代理进行数据高效的离线强化学习。 CoRR公司 abs/2102.06961 ( 2021 ) 2020 [第11条] 德瓦夫拉特·沙阿 , 瓦伦·索马尼 , 谢巧敏 , 志旭 :
基于Turn-based零和Markov对策的强化学习。 食品和药物管理局 2020 : 139-148 [第10条] 杨宇哲 , 郭章 , 志旭 , 狄娜·卡塔碧 :
利用结构进行基于价值的规划和强化学习。 ICLR公司 2020 【c9】 德瓦夫拉特·沙阿 , 谢巧敏 , 志旭 :
状态空间无限的稳定强化学习。 L4DC(L4DC) 2020 : 581 【c8】 德瓦夫拉特·沙阿 , 多吉翁之歌 , 志旭 , 杨宇哲 :
通过低秩矩阵估计的样本高效强化学习。 NeurIPS公司 2020 【c7】 杨宇哲 , 志旭 :
重新思考标签对改善课堂不平衡学习的价值。 NeurIPS公司 2020 【c6】 德瓦夫拉特·沙阿 , 谢巧敏 , 志旭 :
蒙特卡罗树搜索的非渐近分析。 SIGMETRICS(摘要) 2020 : 31-32 [第九章] 德瓦夫拉特·沙阿 , 瓦伦·索马尼 , 谢巧敏 , 志旭 :
基于回合的零和马尔可夫对策的强化学习。 CoRR公司 abs/2002.10620 ( 2020 ) [i8] 德瓦夫拉特·沙阿 , 谢巧敏 , 志旭 :
状态空间无限的稳定强化学习。 CoRR公司 abs/2006.04353 ( 2020 ) [i7] 德瓦夫拉特·沙阿 , 多吉翁之歌 , 志旭 , 杨宇哲 :
通过低秩矩阵估计的样本高效强化学习。 CoRR公司 abs/2006.06135 ( 2020 ) [i6] 杨宇哲 , 志旭 :
重新思考标签对改善课堂不平衡学习的价值。 CoRR公司 abs/2006.07529 ( 2020 )
2010 – 2019
2019 【c5】 杨宇哲 , 郭章 , 志旭 , 狄娜·卡塔碧 :
ME-Net:利用矩阵估计实现有效的对抗稳健。 ICML公司 2019 : 7025-7034 [i5] 德瓦夫拉特·沙阿 , 谢巧敏 , 志旭 :
利用蒙特卡罗树搜索和监督学习进行强化学习:非症状分析。 CoRR公司 abs/1902.05213 ( 2019 ) [i4] 杨宇哲 , 郭章 , 狄娜·卡塔碧 , 志旭 :
ME-Net:利用矩阵估计实现有效的对抗稳健。 CoRR公司 腹肌/1905.11971 ( 2019 ) [i3] 杨宇哲 , 郭章 , 志旭 , 狄娜·卡塔碧 :
利用结构进行基于价值的规划和强化学习。 CoRR公司 abs/1909.12255 ( 2019 ) 2018 [c4] 约翰·齐齐克利斯 , 匡旭 , 志旭 :
私人连续学习。 COLT公司 2018 : 721-727 [i2] 约翰·齐齐克利斯 , 匡旭 , 志旭 :
私人连续学习。 CoRR公司 abs/1805.02136 ( 2018 ) 2017 [j1] 陈旭东 , 吉柳(Ji Liu) , 穆罕默德·阿利·贝尔阿巴斯 , 志旭 , 塔梅尔·巴萨尔 :
社交网络中自我评估的分布式评估和收敛性。 IEEE传输。 自动。 控制。 62 ( 1 ) : 291-304 ( 2017 ) 2015 【c3】 志旭 , 吉柳(Ji Liu) , 塔梅尔·巴萨尔 :
意见动力学的修正DeGroot-Freedkin模型。 行政协调会 2015 : 1047-1052 【c2】 志旭 , 阿里·哈纳费尔 , 塔梅尔·巴萨尔 :
流行网络的竞争:纳什和斯塔克伯格游戏。 行政协调会 2015 : 2063-2068 【c1】 陈旭东 , 吉柳(Ji Liu) , 志旭 , 塔梅尔·巴萨尔 :
社交网络中自我评价的分布式评估和融合。 疾病预防控制中心 2015 : 2895-2900 [i1] 陈旭东 , 吉柳(Ji Liu) , 志旭 , 塔梅尔·巴萨尔 :
社交网络中自我评价的分布式评价与融合。 CoRR公司 腹肌/1503.08175 ( 2015 )