×

隐马尔可夫模型:逆滤波、信念估计和隐私保护。 (英语) Zbl 1480.93425号

小结:A隐马尔可夫模型(HMM)包含一个只有通过噪声传感器才能观察到的马尔科夫动力学状态。本文考虑了与HMM相关的三个问题,即反向过滤、基于行为的信念估计和在此背景下的隐私强制。首先,作者讨论了如何从HMM滤波器的后验分布重建HMM参数和传感器测量值。接下来,作者考虑一个理性的决策者,通过过滤私人信息,形成对世界状况的私人信念(后验分布)。作者展示了如何从观察到的代理人采取的最佳行动中估计这种后验分布。在对抗系统的设置中,作者最后展示了决策者如何通过使用稍微次优的行动混淆对手来保护其私人信念。应用范围从金融投资组合到生命科学决策系统。

MSC公司:

93E11号机组 随机控制理论中的滤波
2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
91G10型 投资组合理论
91磅06 决策理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Wahlberg B、Hjalmarsson H和Annergren M,《控制系统识别中的最优输入设计》,第49届IEEE决策与控制会议(CDC),2010年,第5548-5553页。内政部:DOI:10.1109/CDC.2010.5717863。
[2] Annergren,M。;Larsson,C.A。;Hjalmarsson,H.,系统识别中面向应用的输入设计:控制的最佳输入设计[控制应用],IEEE control Systems Magazine,37,2,31-56(2017)·doi:10.1109/MCS.2016.2643243
[3] Kalman,R.E.,线性控制系统何时是最优的?,基础工程杂志,86,1,51-60(1964)·数字对象标识代码:10.1115/1.3653115
[4] 张,H。;乌门伯格,J。;Hu,X.,离散时间有限时域线性二次调节器的逆最优控制,Automatica,110,108593(2019)·Zbl 1429.93217号 ·doi:10.1016/j.automatica.2019.108593
[5] 张华,李毅,胡旭,噪声输出测量下有限时间域上的离散逆线性二次型最优控制,控制理论与技术,2021·Zbl 1491.49024号
[6] 李毅。;姚明,Y。;胡,X.,连续时间逆二次型最优控制问题,Automatica,117108977(2020)·Zbl 1442.49041号 ·doi:10.1016/j.automatica.2020.108977
[7] Ng,A.Y。;Russell,S.J.,反向强化学习算法,国际机器学习会议(ICML),1,2(2000)
[8] Abbeel P和Ng A Y,通过反向强化学习进行学徒制学习,第二十届机器学习国际会议论文集,2004年1月。
[9] Mattila R、Rojas C、Krishnamurthy V等,隐马尔可夫模型的逆滤波,神经信息处理系统(NIPS)进展2017,2017,30。
[10] Mattila R、Rojas C R、Krishnamurthy V等,《隐藏马尔可夫模型的逆滤波及其在逆向自治系统中的应用》,《IEEE信号处理学报》,2020年,DOI:DOI:10.1109/TSP.2020.3019177·Zbl 07591084号
[11] Mattila R、Rojas C R、Krishnamurthy V等人,线性高斯状态空间模型的逆滤波,2018年IEEE决策与控制会议(CDC),第5556-5561页。IEEE,2018年。
[12] 马蒂拉·R。;Lourenço,I。;Rojas,C.R.,基于观察到的决策估计贝叶斯代理的私人信念,IEEE控制系统快报,3,3,523-528(2019)·doi:10.1109/LCSYS.2019.2911802
[13] Lourenço I、Mattila R、Rojas C R等,如何保护您的隐私?对抗性决策框架,第59届IEEE决策与控制会议论文集,2020,1785-1791。
[14] Mattila R、Lourenço I、Krishnamurthy V等,你的对手相信什么?逆向自治系统中的最优滤波和平滑,IEEE声学、语音和信号处理国际会议(ICASSP)论文集,2020年,5495-5499。
[15] Norris,J.R.,Markov Chains(1998),剑桥:剑桥大学出版社,剑桥·Zbl 0938.60058号
[16] Krishnamurthy,V.,《部分观测的马尔可夫决策过程:从过滤到控制感知》(2016),剑桥:剑桥大学出版社,剑桥·Zbl 1334.90002号 ·doi:10.1017/CBO9781316471104
[17] 安德森,B.D.O。;Moore,J.B.,《最佳过滤》(1979),新泽西州上鞍河:普伦蒂斯·霍尔,上鞍河,新泽西·Zbl 0688.93058号
[18] O·卡佩。;Moulines,E。;Rydén,T.,《隐马尔可夫模型中的推断》(2005),纽约:施普林格出版社,纽约·Zbl 1080.62065号 ·doi:10.1007/0-387-28982-8
[19] 徐,D。;卡卡德,S.M。;Zhang,T.,用于学习隐马尔可夫模型的谱算法,《计算机与系统科学杂志》,78,5,1460-1480(2012)·Zbl 1244.68065号 ·doi:10.1016/j.jss.2011.12.025
[20] 布赫塔,C。;科伯,M。;Feinerer,I.,《球形k-means聚类》,《统计软件杂志》,50,10,1-22(2012)
[21] 克里希纳穆提,V。;Rangaswamy,M.,如何校准对手的能力?反自治系统的逆滤波,IEEE信号处理汇刊,67,24,6511-6525(2019)·Zbl 07160308号 ·doi:10.1109/TSP.2019.2956676
[22] Kuptel A,《反无人自主系统(CUAxS):优先事项、政策、未来能力》,多国能力发展运动(MCDC),社会科学电子出版,2017年,15-16。
[23] Mas-Colell,A。;Whinston,医学博士。;Green,J.R.,《微观经济理论》(1995),纽约:牛津大学出版社,纽约·Zbl 1256.91002号
[24] Luenberger,D.G.,《微观经济理论》(1995年),纽约:麦克劳希尔学院,纽约
[25] 《不确定性下的选择:已解决和未解决的问题》,《经济展望杂志》,第1期,第121-154页(1987年)·doi:10.1257/jep.1.1.121号文件
[26] 瓦里安·H·R,《揭示的偏好》,《萨缪尔森经济学与二十一世纪》,2006年,第99-115页。
[27] 瓦里安,H.R.,《微观经济分析》(1992),纽约:诺顿,纽约
[28] Ahuja,R.K。;Orlin,J.B.,《逆向优化》,运筹学,49,5,771-783(2001)·Zbl 1163.90764号 ·数字对象标识代码:10.1287/opre.49.5.771.10607
[29] 艾扬格。;Kang,W.,《反圆锥规划及其应用》,《运筹学快报》,33319-330(2005)·Zbl 1140.90465号 ·doi:10.1016/j.orl.2004.04.007
[30] 张,J。;Xu,C.,线性约束凸可分离规划问题的逆优化,欧洲运筹学杂志,200,3671-679(2010)·Zbl 1177.90321号 ·doi:10.1016/j.ejor.2009.01.043
[31] Keshavarz A、Wang Y和Boyd S,计算凸目标函数,IEEE智能控制国际研讨会,2011年,613-619。
[32] 博伊德,S。;Vandenberghe,L.,凸优化(2004),剑桥:剑桥大学出版社,剑桥·Zbl 1058.90049号 ·doi:10.1017/CBO9780511804441
[33] Rockafellar,R.T.,凸分析(1970),普林斯顿:普林斯顿大学出版社,普林斯顿·Zbl 0932.90001号 ·doi:10.1515/9781400873173
[34] 尹,G.G。;Zhou,X.Y.,Markowitz的带制度转换的均值-方差投资组合选择:从离散时间模型到其连续时间极限,IEEE自动控制交易,49,3,349-360(2004)·Zbl 1366.91148号 ·doi:10.10109/TAC.2004.824479
[35] Elliott,R.J。;Siu,T.K。;Badescu,A.,《隐藏马尔可夫区域转换模型下的均值-方差投资组合选择》,《经济建模》,27,3,678-686(2010)·doi:10.1016/j.econmod.2010.01.007
[36] Nystrup,P。;马德森,H。;Lindstrm,E.,《跨隐性市场机制的动态投资组合优化》,《定量金融》,18,1,83-95(2018)·Zbl 1400.91560号 ·网址:10.1080/14697688.2017.1342857
[37] Puterman M L,《马尔可夫决策过程:离散随机动态规划》,John Wiley&Sons,Inc.,1994年·Zbl 0829.90134号
[38] 麦肯锡J C C,游戏理论导论,快递公司,2003年。
[39] Davis P J和Rabinowitz P,《数值积分方法》,Courier Corporation,2007年。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。