在机器学习算法中,马尔可夫链(Markov chain)是个很重要的概念。马尔可夫链(Markov chain),又称离散时间马尔可夫链(disc...
强化学习笔记 1.马尔可夫决策过程(MDP) 1.马尔可夫性质 2.马尔可夫过程 3.马尔可夫奖励过程(MRP) 4.马尔可夫决策过程(MDP) 2.蒙特卡罗(MC&...
0 序言 这篇博客也与我的毕业论文有关,在上个阶段中,我用python代码实现了EM算法,并及进行了细节上的改进,并记录成了...