内森·卡卢斯;Masatoshi Uehara公司 通过双重强化学习,有效打破非政策评估中的视野诅咒。 (英语) Zbl 1510.90285号 操作。物件。 70,第6号,3282-3302(2022).MSC公司:90立方厘米 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{N.Kallus}和\textit{M.Uehara},Oper。第70号决议,第6号,3282--3302(2022年;Zbl 1510.90285) 全文: 内政部 arXiv公司
阿尼尔·阿斯瓦尼;沈左军Max;奥扬·西迪克 含噪数据的逆优化。 (英语) Zbl 1455.90111号 操作。物件。 66,第3期,870-892(2018).MSC公司:90立方厘米 90C25型 PDF格式BibTeX公司 XML格式引用 \textit{A.Aswani}等人,作品。第66号决议,第3号,870--892(2018;Zbl 1455.90111) 全文: 内政部 arXiv公司
冯桂云;李晓波;王子卓 技术说明:关于几个离散选择模型之间的关系。 (英语) Zbl 1405.91164号 操作。物件。 65,第6期,1516-1525(2017).MSC公司:91B14号机组 91B06型 第91页第16页 PDF格式BibTeX公司 XML格式引用 \textit{G.Feng}等人,Oper。第65号决议,第6号,1516--1525(2017年;Zbl 1405.91164) 全文: 内政部
切拉齐,纳维德;托马斯·A·韦伯。 决策问题的单调逼近。 (英语) Zbl 1228.90115号 操作。物件。 58,第4号,第2部分,1158-1177(2010).MSC公司:90立方 90 C90 PDF格式BibTeX公司 XML格式引用 \textit{N.Chehrazi}和\textit{T.A.Weber},Oper。第58号决议,第4号,第2部分,1158--1177(2010年;Zbl 1228.90115) 全文: 内政部 链接