芮松 0006
人员信息
附属: 美国北卡罗来纳州罗利市北卡罗莱纳州立大学 从属关系(2006年博士): 威斯康星大学麦迪逊分校,威斯康星州,美国
其他同名人员
优化列表
2020年–今天
2024 [公元25年] 于柳 , 润泽丸 , 詹姆斯·麦奎因 , 道格·海恩斯 , 顾金祥 , 芮松 以下为:
在线实验中推荐持续时间的影响大小估计:利用层次模型和客观效用方法。 AAAI公司 2024 以下为: 14044-14051 [i39] 蔡恒瑞 , 刘圣杰 , 芮松 以下为:
因果推理需要所有大型语言模型的知识吗? CoRR公司 abs/2401.00139 ( 2024 ) 2023 [公元12年] 蔡恒瑞 , 石成春 , 芮松 , 文宾路 以下为:
用于连续治疗的个性化决策的跳跃区间学习。 J.马赫。 学习。 物件。 24 以下为: 140:1-140:92 ( 2023 ) [公元24年] 润哲丸 , 林戈 , 芮松 以下为:
走向可扩展和稳健的结构化强盗:一个元学习框架。 AISTATS公司 2023 以下为: 1144-1173 【c23】 林戈 , 王季涛 , 石成春 , 吴振科 , 芮松 以下为:
动态中介分析的强化学习框架。 ICML公司 2023 以下为: 11050-11097 [公元22年] 润泽丸 , 郝玉伟 , 布拉尼斯拉夫·克韦顿 , 芮松 以下为:
基于乘数引导的探索。 ICML公司 2023 以下为: 35444-35490 【c21】 理查德·A·沃森 , 蔡恒瑞 , 新明安 , 塞缪尔·麦克林 , 芮松 以下为:
非齐次因果图中的非齐次处理效应。 ICML公司 2023 以下为: 36714-36747 [公元20年] 杨旭 , 金珠 , 石成春 , 罗世凯 , 芮松 以下为:
混乱的非政策评估的工具变量方法。 ICML公司 2023 以下为: 38848-38880 [第19条] 润泽丸 , 于柳 , 詹姆斯·麦奎因 , 道格·海恩斯 , 芮松 以下为:
实验平台满足强化学习:持续监测的贝叶斯顺序决策。 KDD公司 2023 以下为: 第5016-5027页 [第18条] 秦志伟(Tony) , 芮松 , 叶洁平 , 朱宏图 , 迈克尔·乔丹 以下为:
KDD-2023在线市场决策智能和分析研讨会。 KDD公司 2023 以下为: 5878-5879 [第17条] 蔡恒瑞 , 王一新(Yixin Wang) , 迈克尔·乔丹 , 芮松 以下为:
关于学习充要因果图。 NeurIPS公司 2023 [i38] 于赫高 , 石成春 , 芮松 以下为:
深谱Q学习及其在移动健康中的应用。 CoRR公司 abs/2301.00927 ( 2023 ) [i37] 理查德·沃森 , 蔡恒瑞 , 新明安 , 塞缪尔·麦克林 , 芮松 以下为:
非齐次因果图中的非齐次处理效应。 CoRR公司 腹肌/23012383 ( 2023 ) [公元36年] 蔡恒瑞 , 王一新(Yixin Wang) , 迈克尔·乔丹 , 芮松 以下为:
关于学习充要因果图。 CoRR公司 abs/2301.12389 ( 2023 ) [i35] 林戈 , 王季涛 , 石成春 , 吴振科 , 芮松 以下为:
动态中介分析的强化学习框架。 CoRR公司 abs/2301.13348 ( 2023 ) [i34] 润哲丸 , 郝玉伟 , 布拉尼斯拉夫·克韦顿 , 芮松 以下为:
基于乘数引导的探索。 CoRR公司 abs/2302.01543 ( 2023 ) [i33] 润哲丸 , 于柳 , 詹姆斯·麦奎因 , 道格·海恩斯 , 芮松 以下为:
实验平台满足强化学习:持续监测的贝叶斯顺序决策。 CoRR公司 abs/2304.00420 ( 2023 ) [i32] 于柳 , 润泽丸 , 詹姆斯·麦奎因 , 道格·海恩斯 , 顾金祥 , 芮松 以下为:
在线实验中推荐持续时间的影响大小估计:利用层次模型和客观效用方法。 CoRR公司 abs/2312.12871 ( 2023 ) [i31] 郝玉伟 , 润泽丸 , 雷氏 , 芮松 以下为:
零膨胀匪徒。 CoRR公司 abs/2312.15595 ( 2023 ) [i30] 江海涛 , 林戈 , 于赫高 , 王建安 , 芮松 以下为:
因果决策的大型语言模型。 CoRR公司 abs/2312.17122 ( 2023 ) 2022 [公元11年] 叶柳 , 芮松 , 文宾路 , 杨华晓 以下为:
关系学习的Probit张量因子分解模型。 J.计算。 图表。 斯达。 31 ( 三 ) 以下为: 846-855 ( 2022 ) [公元10年] 李汉·陈 , 蒋思航(Sihang Jiang) , 刘京平 , 王超(Chao Wang) , Sheng Zhang先生 , 谢晨浩 , 梁嘉庆 , 杨华晓 , 芮松 以下为:
基于强化学习的知识图规则挖掘。 知识。 基于系统。 242 以下为: 108371 ( 2022 ) [公元9年] 文博铺 , 京沪 , 王欣(Xin Wang) , 李月尊 , 舒虎 , 朱斌(Bin Zhu) , 芮松 , 齐松 , 西武 , 李思伟(Siwei Lyu) 以下为:
学习深度双层网络,以实现强大的DeepFake检测。 模式识别。 130 以下为: 108832 ( 2022 ) [j8] 秦志伟(Tony) , 洪良杰 , 芮松 , 朱宏图 , 穆罕默德·科拉耶姆 , 罗海燕 , 迈克尔·乔丹 以下为:
KDD 2022在线市场决策智能和分析研讨会:工作、骑乘共享、零售及其他。 SIGKDD探索者。 24 ( 2 ) 以下为: 78至80 ( 2022 ) [第16条] 李汉·陈 , 刘京平 , 蒋思航(Sihang Jiang) , 王超(Chao Wang) , 梁嘉庆 , 杨华晓 , Sheng Zhang先生 , 芮松 以下为:
通过蒙特卡罗树搜索解决纵横字谜。 ICAPS公司 2022 以下为: 35-43 [第15条] 润泽丸 , 布拉尼斯拉夫·克韦顿 , 芮松 以下为:
有效政策评估和比较的安全探索。 ICML公司 2022 以下为: 22491-22511 [第14条] 秦志伟(Tony) , 洪良杰 , 芮松 , 朱宏图 , 穆罕默德·科拉耶姆 , 罗海燕 , 迈克尔·乔丹 以下为:
在线市场的决策智能和分析:工作、骑乘共享、零售及其他。 KDD公司 2022 以下为: 4898-4899 [i29] Elynn Y.Chen先生 , 芮松 , 迈克尔·乔丹 以下为:
异质数据强化学习:估计和推断。 CoRR公司 abs/2202.00088 ( 2022 ) [第28条] 李汉·陈 , 蒋思航(Sihang Jiang) , 刘京平 , 王超(Chao Wang) , Sheng Zhang先生 , 谢晨浩 , 梁嘉庆 , 杨华晓 , 芮松 以下为:
基于强化学习的知识图规则挖掘。 CoRR公司 腹肌/2202.10381 ( 2022 ) [i27] 石成春 , 润泽丸 , 葛松 , 罗世凯 , 芮松 , 朱宏图 以下为:
双边市场非政策评估的多代理强化学习框架。 CoRR公司 abs/2202.10574 ( 2022 ) [i26] 石成春 , 金珠 , 叶申 , 罗世凯 , 朱宏图 , 芮松 以下为:
混乱马尔可夫决策过程的非政策置信区间估计。 CoRR公司 abs/2202.10589 ( 2022 ) [i25] 陈浩宇(Haoyu Chen) , 文宾路 , 芮松 , Pulak Ghosh公司 以下为:
通过数据预处理学习和测试反事实公平性。 CoRR公司 abs/2202.12440 ( 2022 ) 【i24】 石成春 , 罗世凯 , 朱宏图 , 芮松 以下为:
无限视野下离线强化学习的统计高效优势学习。 CoRR公司 腹肌/2202.13163 ( 2022 ) [第23条] 润泽丸 , 林戈 , 芮松 以下为:
走向可扩展和稳健的结构化强盗:一个元学习框架。 CoRR公司 abs/2202.13227 ( 2022 ) [i22] 润泽丸 , 布拉尼斯拉夫·克韦顿 , 芮松 以下为:
有效政策评估和比较的安全探索。 CoRR公司 abs/2202.13234 ( 2022 ) 【i21】 润泽丸 , 李英英 , 文宾路 , 芮松 以下为:
挖掘因子动物园:具有足够代理的潜在因子模型的估计。 CoRR公司 腹肌/2212.12845 ( 2022 ) [i20] 杨旭 , 石成春 , 罗世凯 , 王岚(Lan Wang) , 芮松 以下为:
通过深度条件生成学习进行分位数非政策评估。 CoRR公司 abs/2212.14466 ( 2022 ) [i19] 杨旭 , 金珠 , 石成春 , 罗世凯 , 芮松 以下为:
混乱的非政策评估的工具变量方法。 CoRR公司 abs/2212.14468 ( 2022 ) [i18] 叶申 , 润泽丸 , 蔡恒瑞 , 芮松 以下为:
针对面板数据的异构合成学习者。 CoRR公司 abs/2212.14580 ( 2022 ) 2021 [j7] 石成春 , 罗世凯 , 朱宏图 , 芮松 以下为:
定性治疗效果的在线序列测试。 J.马赫。 学习。 物件。 22 以下为: 286:1-286:51 ( 2021 ) [第13条] 苗玉 , 文宾路 , 芮松 以下为:
基于价值差异的亚组治疗效果在线测试。 ICDM公司 2021 以下为: 1463-1468 [c12] 蔡恒瑞 , 芮松 , 文宾路 以下为:
ANOCE:通过约束结构学习分析多重中介的因果效应。 ICLR公司 2021 [第11条] 石成春 , 润泽丸 , 威克特·切诺祝可夫 , 芮松 以下为:
深度偏差非政策区间估计。 ICML公司 2021 以下为: 9580-9591 [第10条] 润泽丸 , 张新余 , 芮松 以下为:
基于多目标模型的强化学习在传染病控制中的应用。 KDD公司 2021 以下为: 1634-1644 【c9】 蔡恒瑞 , 石成春 , 芮松 , 文宾路 以下为:
连续治疗环境下非政策评估的深度跳跃学习。 NeurIPS公司 2021 以下为: 15285-15300 【c8】 润泽丸 , 林戈 , 芮松 以下为:
基于元数据的贝叶斯层次模型多任务带宽。 NeurIPS公司 2021 以下为: 29655-29668 [i17] 石成春 , 润泽丸 , 威克特·切诺祝可夫 , 芮松 以下为:
深度偏差非政策区间估计。 CoRR公司 abs/2105.04646 ( 2021 ) [i16] 润泽丸 , Sheng Zhang先生 , 石成春 , 罗世凯 , 芮松 以下为:
订单调度中强化学习的模式转移学习。 CoRR公司 abs/2105.13218 ( 2021 ) 【i15】 蔡恒瑞 , 岑志浩 , 凌冷 , 芮松 以下为:
周期GP:用高斯过程带宽学习周期世界。 CoRR公司 abs/2105.14422 ( 2021 ) [第14条] 润泽丸 , 林戈 , 芮松 以下为:
基于元数据的贝叶斯层次模型多任务带宽。 CoRR公司 abs/2108.06422 ( 2021 ) [i13] 蔡恒瑞 , 叶申 , 芮松 以下为:
在线学习中最优策略评估的双稳健区间估计。 CoRR公司 abs/2110.15501 ( 2021 ) [i12] 叶柳 , 芮松 , 文宾路 , 肖阳华 以下为:
关系学习的Probit张量因子分解模型。 CoRR公司 abs/2111.03943 ( 2021 ) [i11] 蔡恒瑞 , 石成春 , 芮松 , 文宾路 以下为:
跳转间隔-学习个性化决策。 CoRR公司 abs/2111.08885 ( 2021 ) [i10] 王建安 , Sheng Zhang先生 , 杨华晓 , 芮松 以下为:
金融应用中的图形神经网络方法综述。 CoRR公司 abs/2111.15367 ( 2021 ) 2020 [j6] 石成春 , 文宾路 , 芮松 以下为:
通过分类打破非规律性的诅咒-在最佳治疗方案下推断平均结果。 J.马赫。 学习。 物件。 21 以下为: 176:1-176:67 ( 2020 ) [j5] 勐海盘 , 黄伟孝 , 李燕华 , 周迅 , 刘振明 , 芮松 , 慧露 , 田志宏 , Jun Luo先生 以下为:
DHPA:动态人类偏好分析框架:出租车司机学习曲线分析案例研究。 ACM变速器。 智力。 系统。 Technol公司。 11 ( 1 ) 以下为: 8:1-8:19 ( 2020 ) 【c7】 苗玉 , 文宾路 , 芮松 以下为:
在线测试非均质处理效果的新框架。 AAAI公司 2020 以下为: 10310-10317 【c6】 叶柳 , Sheng Zhang先生 , 芮松 , 索峰 , 杨华晓 以下为:
基于强化学习的知识引导开放属性值提取。 EMNLP(1) 2020 以下为: 8595-8604 【c5】 蔡恒瑞 , 文宾路 , 芮松 以下为:
最优决策规则的验证和规划及其在医疗研究中的应用。 ICML公司 2020 以下为: 1262-1270 【c4】 石成春 , 润泽丸 , 芮松 , 文宾路 , 凌冷 以下为:
马尔可夫决策过程是否符合数据:顺序决策中马尔可夫属性的测试。 ICML公司 2020 以下为: 8807-8817 【c3】 梁玉柱 , 文宾路 , 芮松 以下为:
移动健康中的因果关系估计和最佳剂量建议。 ICML公司 2020 以下为: 11588-11598 [c2] 梁玉柱 , 文宾路 , 迈克尔·科索罗克 , 芮松 以下为:
用于个性化剂量查找的内核辅助学习。 KDD公司 2020 以下为: 56-65 [i9] 石成春 , Sheng Zhang先生 , 文宾路 , 芮松 以下为:
无限视界环境下强化学习值函数的统计推断。 CoRR公司 abs/2001.04515 ( 2020 ) [i8] 石成春 , 王晓宇(音译) , 罗世凯 , 芮松 , 朱宏图 , 叶洁平 以下为:
A/B测试中时间相关因果关系评估的强化学习框架。 CoRR公司 abs/2002.01711 ( 2020 ) [i7] 石成春 , 润泽丸 , 芮松 , 文宾路 , 凌冷 以下为:
马尔可夫决策过程是否符合数据:顺序决策中马尔可夫属性的测试。 CoRR公司 abs/2002.01751 ( 2020 ) [i6] 润泽丸 , 张新余 , 芮松 以下为:
传染病控制的多目标强化学习及其在新冠肺炎传播中的应用。 CoRR公司 abs/2009.04607 ( 2020 ) [i5] 陈浩宇(Haoyu Chen) , 文宾路 , 芮松 以下为:
在线决策的统计推断:在背景强盗背景下。 CoRR公司 腹肌/2010.07283 ( 2020 ) [i4] 陈浩宇(Haoyu Chen) , 文宾路 , 芮松 以下为:
基于随机梯度下降的在线决策统计推断。 CoRR公司 腹肌/2010.07341 ( 2020 ) [i3] 叶柳 , Sheng Zhang先生 , 芮松 , 索峰 , 杨华晓 以下为:
基于强化学习的知识引导开放属性值提取。 CoRR公司 abs/2010.09189 ( 2020 ) [i2] 蔡恒瑞 , 石成春 , 芮松 , 文宾路 以下为:
连续行动空间离线政策评估的深度跳跃Q-评估。 CoRR公司 abs/2010.15963 ( 2020 )
2010 – 2019
2019 [j4] 石成春 , 文宾路 , 芮松 以下为:
统计多元相关学习中潜在因素数量的确定。 J.马赫。 学习。 物件。 20 以下为: 23:1-23:38 ( 2019 ) 【c1】 勐海盘 , 李燕华 , 周迅 , 刘振明 , 芮松 , 慧露 , Jun Luo先生 以下为:
剖析出租车司机的学习曲线:一种数据驱动方法。 传感和诊断模块 2019 以下为: 783-791 2017 [j3] 刘仲恺 , 芮松 , 曾东林 , 张佳佳 以下为:
主成分调整变量筛选。 计算。 统计数据分析。 110 以下为: 134-144 ( 2017 ) [注2] 梁淑涵(Shuhan Liang) , 文宾路 , 芮松 , 王岚(Lan Wang) 以下为:
稀疏一致性辅助学习用于最佳治疗决策。 J.马赫。 学习。 物件。 18 以下为: 202:1-202:26 ( 2017 ) 2014 [i1] 罗世凯 , 芮松 , 丹妮拉·维滕 以下为:
高斯图形模型的确定筛选。 CoRR公司 腹肌/1407.7819 ( 2014 ) 2012 [j1] 芮松 , 黄健 , 双鸽马 以下为:
多肿瘤基因组研究分析中的综合预筛选。 BMC生物信息。 13 以下为: 168 ( 2012 )