rcss系统

R包rcss:凸开关系统。有限时间受控马尔可夫链在有限时间受控状态下的马尔可夫链控制问题的演化。假定奖赏函数在连续状态下是凸的和Lipschitz连续的。作用集是有限的。