序列DecProb

序列决策问题、依赖类型和一般解

作者:尼古拉·博塔(Nicola Botta)、帕特里克·詹森(Patrik Jansson)、塞扎尔·埃内斯库(Cezar Ionescu)、大卫·克里斯蒂安森(David Christiansen)和埃德温·布莱迪(Edwin Brady)

谈话摘要

  • 2014-08-15:论文提交至LMCS公司.
  • 2015年1月13日:本文的源代码存储库和后续工作正在迁移到github
  • (2015年3月28日:A后续文件(针对不同的观众)提交给MSS公司.)
  • 2015年6月2日:LMCS审查(包含许多有用的建议)最终基本上都是“修改并重新提交”。
  • 2015-07-29:论文重新提交给LMCS(预打印).

摘要

我们提出了一种计算机检查的通用实现,用于解决有限时域序列决策问题。这是一类广泛的问题,包括跨时间优化、背包、最优包围、调度等。实现可以处理与时间步长相关的控制和状态空间,以及不确定性的一元表示(例如随机、非确定性、模糊或其组合)。这种级别的泛型在具有依赖类型的编程语言中是可以实现的(我们使用了Idris和Agda)。依赖类型也是使我们能够获得实现的核心组件的形式化和计算机检查证明的方法:Bellman的优化原则和相关的反向归纳算法。形式化澄清了反向归纳法的某些方面,并通过明确的概念,如生存能力和可达性,可以作为一元动力系统可控性理论的起点,这在气候影响研究中经常遇到。

LMCS-主题

程序逻辑、程序开发和规范、形式化数学、关于动作和计划的推理、函数编程和lambda演算、交互式验证、类型理论和构造数学、计算机辅助验证