拦污栅 swMATH编号: 8968 软件作者: 卓、汉克斯、汉奎;杨强 描述: 通过转移学习获取行动模型以进行规划。应用学习技巧来获得动作模型是一个非常有研究兴趣的领域。该领域以前的大多数工作都假设在感兴趣的规划领域中有大量可用的培训数据。然而,通常很难获得足够的培训数据来确保所学的行动模型具有高质量。在本文中,我们试图探索一种新的算法框架,称为TRAMP,通过从其他域(称为源域)传输尽可能多的可用信息来帮助学习任务,从而学习目标域中训练数据有限的动作模型,假设源域中的动作模型可以传输到目标域。TRAMP通过在源域和目标域之间建立结构映射来传输源域的知识,然后利用Web搜索中的额外知识桥接和传输源知识。具体来说,TRAMP首先用一组命题对训练数据进行编码,并将传递的知识公式化为一组加权公式。然后,它学习目标领域的动作模型,以最好地解释命题集和转移的知识。我们在不同的环境中对TRAMP进行了实证评估,以了解它们在六个规划领域的优势和劣势,包括四个国际规划竞争(IPC)领域和两个合成领域。 主页: http://www.sciencedirect.com/science/article/pii/S0004370214000320 关键词: 人工智能规划;行动模型学习;迁移学习;马尔可夫逻辑网络;网络搜索 相关软件: PDDL公司;UCPOP公司;SCIP计划;科林;液化石油气;TensorFlow公司;图规划;TEXPLORE公司;前缀跨度;Prodigy公司;铲刀;国际学生成绩评估;SUPPLE公司 引用于: 7文件 全部的 前5名14位作者引用 4 卓、汉克斯、汉奎 3 苏巴拉奥·坎巴帕蒂 2 杨强 1 阿莱尼·吉勒姆 1 安东尼奥·加里多 1 井上,胜美 1 金、科宾 1 大卫·马丁内斯 1 赫克托·穆尼奥斯·阿维拉 1 托尼·里贝罗 1 萨拉斯Sreedharan 1 卡梅·托拉斯 1 万,海 1 肖占浩 3篇连载文章中引用 5 人工智能 1 约束条件 1 机器学习研究杂志(JMLR) 在1个字段中引用 7 计算机科学(68至XX) 按年份列出的引文