小城汤
人员信息
优化列表
2020年–今天
2024 [j4] 魏洪浩 , 杨紫仙 , 刘欣(Xin Liu) , 秦志伟(Tony) , 小城汤 , 雷英 :
在线骑乘系统中车辆重新定位的强化学习和基于预测的前瞻策略。 IEEE传输。 智力。 运输。 系统。 25 ( 2 ) : 1846-1856 ( 2024 ) 2023 [j3] 永新通 , 定远市 , 易旭 , 吕伟峰 , 秦志伟 , 小城汤 :
组合优化满足强化学习:大规模有效的出租车订单调度。 IEEE传输。 知识。 数据工程。 35 ( 10 ) : 9812-9823 ( 2023 ) 2022 [第16条] Soheil Sadeghi Eshkevari公司 , 小城汤 , 秦志伟 , 金汉梅 , Cheng Zhang(张成) , 孟千英 , 贾旭 :
野外强化学习:可扩展RL调度算法在搭乘市场中的应用。 KDD公司 2022 : 3838-3848 [第14条] Soheil Sadeghi Eshkevari公司 , 小城汤 , 秦志伟 , 金汉梅 , Cheng Zhang(张成) , 孟千英 , 贾旭 :
野外强化学习:可扩展RL调度算法在搭乘市场中的应用。 CoRR公司 abs/2202.05118 ( 2022 ) [i13] 小城汤 , Soheil Sadeghi Eshkevari公司 , 陈浩宇(Haoyu Chen) , 吴伟丹 , 魏谦 , 王晓明 :
高尔夫球运动员:用掩蔽目标条件MnM网络进行轨迹预测。 CoRR公司 abs/2207.00738 ( 2022 ) 2021 [第15条] 王若晨 , 陈香凝 , 程敏浩 , 小城汤 , 谢秋菊 :
等级NOSH:通过非均匀连续一半进行高效的基于预测的体系结构搜索。 ICCV公司 2021 : 10357-10366 [第14条] 范周 , 陈凡路 , 小城汤 , 范张(音译) , 秦志伟(Tony) , 叶洁平 , 朱宏图 :
面向大规模订单调度的多目标分布式强化学习。 ICDM公司 2021 : 1541-1546 [第13条] 陈香凝 , 王若晨 , 程敏浩 , 小城汤 , 谢秋菊 :
DrNAS:Dirichlet神经架构搜索。 ICLR公司 2021 [第12条] 王若晨 , 程敏浩 , 陈香凝 , 小城汤 , 赵瑞谢 :
重新思考不同NAS中的体系结构选择。 ICLR公司 2021 [第11条] 小城汤 , 范张(音译) , 秦志伟(Tony) , 王燕生(Yansheng Wang) , 定远市 , 宋炳辰 , 永新通 , 朱宏图 , 叶洁平 :
价值功能就是你所需要的:一个统一的游乐平台学习框架。 KDD公司 2021 : 3605-3615 [i12] 燕郊 , 小城汤 , 秦志伟(Tony) , 李帅记 , 范张(音译) , 朱宏图 , 叶洁平 :
使用深度强化学习重新定位现实世界中的骑乘车辆。 CoRR公司 腹肌/2103.04555 ( 2021 ) [i11] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , 迪帕姆·查克拉博蒂 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·古斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 CoRR公司 abs/2103.15332 ( 2021 ) [i10] 小城汤 , 范张(音译) , 秦志伟(Tony) , 王燕生(Yansheng Wang) , 定远石 , 宋炳辰 , 永新通 , 朱宏图 , 叶洁平 :
价值功能就是你所需要的:一个统一的游乐平台学习框架。 CoRR公司 abs/2105.08791 ( 2021 ) [第九章] 小城汤 , 秦志伟(Tony) , 范张(音译) , 王兆东 , 徐哲(Zhe Xu) , 马银泰 , 朱宏图 , 叶阶平 :
基于深度值网络的多河流订单调度方法。 CoRR公司 abs/2106.04493 ( 2021 ) [i8] 王若晨 , 程敏浩 , 陈香凝 , 小城汤 , 谢秋菊 :
重新思考不同NAS中的体系结构选择。 CoRR公司 腹肌/2108.04392 ( 2021 ) [i7] 王若晨 , 陈香凝 , 程敏浩 , 小城汤 , 谢秋菊 :
等级NOSH:通过非均匀连续一半进行高效的基于预测的体系结构搜索。 CoRR公司 abs/2108.08019 ( 2021 ) 2020 [注2] 秦志伟(Tony) , 小城汤 , 燕郊 , 范张(音译) , 徐哲(Zhe Xu) , 朱宏图 , 叶洁平 :
通过强化学习在DiDi进行骑行指令调度。 信息J.应用。 分析。 50 ( 5 ) : 272-286 ( 2020 ) [第10条] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , 迪帕姆·查克拉博蒂 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·古斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 NeurIPS(竞争和演示) 2020 : 361-395 [i6] 陈向宁 , 王若晨 , 程敏浩 , 小城汤 , 谢秋菊 :
DrNAS:Dirichlet神经架构搜索。 CoRR公司 abs/2006.10355 ( 2020 )
2010 – 2019
2019 【c9】 金嘉瑞 , 明州 , 张卫南(Weinan Zhang) , 李敏妮(Minne Li) , 郭子龙 , 秦志伟(Tony) , 燕郊 , 小城汤 , 王晨曦 , 王军(Jun Wang) , 吴国斌 , 叶阶平 :
CoRide:多规模骑乘平台的联合订单调度和车队管理。 CIKM公司 2019 : 1983-1992 【c8】 陈海鹏 , 燕郊 , 秦志伟(Tony) , 小城汤 , 郝丽 , 保安 , 朱宏图 , 叶洁平 :
InBEDE:将情境盗贼与TD学习相结合,用于搭乘平台的联合定价和调度。 ICDM公司 2019 : 61-70 【c7】 约翰·霍勒 , 里斯托·武奥里奥 , 秦志伟(Tony) , 小城汤 , 燕郊 , 天津 , 萨汀德·辛格 , 王晨曦 , 叶洁平 :
多驱动车辆调度和重新定位问题的深度强化学习。 ICDM公司 2019 : 1090-1095 【c6】 秦志伟(Tony) , 小城汤 , 燕郊 , 范张(音译) , 王晨曦 , 群(特蕾西)李 :
针对分乘调度和重新定位的深度强化学习。 国际JCAI 2019 : 6566-6568 【c5】 小城汤 , 秦志伟(Tony) , 范张(音译) , 王兆东 , 徐哲(Zhe Xu) , 马银泰 , 朱宏图 , 叶洁平 :
基于深度值网络的多河流订单调度方法。 KDD公司 2019 : 1780-1790 [i5] 金嘉瑞 , 明州 , 张伟南 , 李敏妮(Minne Li) , 郭子龙 , 秦志伟(Tony) , 燕郊 , 小城汤 , 王晨曦 , 王军(Jun Wang) , 吴国斌 , 叶洁平 :
CoRide:多规模骑乘平台的联合订单调度和车队管理。 CoRR公司 abs/1905.11353 ( 2019 ) [i4] 约翰·霍勒 , 里斯托·武里奥 , 秦志伟(Tony) , 小城汤 , 燕郊 , 天津 , 萨汀德·辛格 , 王晨曦 , 叶洁平 :
多驾驶员车辆调度和重新定位问题的深度强化学习。 CoRR公司 abs/1911.11260 ( 2019 ) 2018 【c4】 王兆东 , 秦志伟(Tony) , 小城汤 , 叶洁平 , 朱宏图 :
在线骑乘订单调度的深度强化学习与知识转移。 ICDM公司 2018 : 617-626 2016 [j1] 卡蒂亚·申伯格 , 小城汤 :
具有全局复杂性分析的实用非精确近似拟Newton方法。 数学。 程序。 160 ( 1-2 ) : 495-529 ( 2016 ) 2014 【c3】 秦志伟(Tony) , 小城汤 , Ioannis Akrotirianakis公司 , Amit Chakraborty公司 :
HIPAD-一种用于基于知识的SVM和特征选择的混合内点交替方向算法。 狮子 2014 : 324-340 [i3] 秦志伟(Tony) , 小城汤 , Ioannis Akrotirianakis公司 , Amit Chakraborty公司 :
HIPAD-一种用于基于知识的SVM和特征选择的混合内点交替方向算法。 CoRR公司 abs/1411.4286 ( 2014 ) 2013 【c2】 何斌(Bin He) , 王志鹏 , 小城汤 , 羌路 :
基于多传感器集成的双足机器人行走平衡控制。 ROBIO公司 2013 : 425-430 [i2] 小城汤 , 卡蒂亚·申伯格 :
在大型l1正则化问题中有效地使用二阶信息。 CoRR公司 abs/1303.6935 ( 2013 ) [i1] 卡蒂亚·谢因伯格 , 小城汤 :
非精确近似牛顿方法的复杂性。 CoRR公司 abs/1311.6547 ( 2013 )