彼得·大雁;杰弗里·辛顿(Geoffrey E.Hinton)。 使用期望最大化进行强化学习。 (英语) Zbl 0876.68090号 神经计算。 9,第271-278号(1997年).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{P.Dayan}和\textit{G.E.Hinton},神经计算。9,第2号,271--278(1997;Zbl 0876.68090) 全文: 内政部
彼得·大雁;杰弗里·辛顿(Geoffrey E.Hinton)。 各种亥姆霍兹机器。 (英语) 兹比尔0862.68093 神经网络。 9,第8期,1385-1403(1996).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{P.Dayan}和\textit{G.E.Hinton},神经网络。9,第8号,1385--1403(1996;Zbl 0862.68093) 全文: 内政部