删除 exchange[root@h102 rabbitmq]# rabbitmqadmin list exchanges+--------------------+---------+| name | type |+--------------------+---------...
起初写完代码发现run完policy_evaluation后value表中的值不收敛,越来越大,直至inf。后来发现是new_value_table = np.copy(value_table)的错误,因为更新V(s)用的是+=,所以若不置零(new_value_table = np.zeros(env.nS))则...