假设一个环境 在A图景的情况下 输入action 0 得到图景 B 假设一个环境 在B图景的情况下 输入action 1 得到图景 C 假设一个环境 在C图景的情况下 输入action 2 得到图景 D 假设一个环境 在D图景的情况下 输入action 3 得到图景 E 使用 one_hot 分别表示 A,B,C,D,E
import paddleclass OneNet(paddle.nn.Layer):def __init__(self)