> 文章列表 > 自监督环境模型

自监督环境模型

自监督环境模型

假设一个环境 在A图景情况下 输入action 0 得到图景 B

假设一个环境 在B图景的情况下 输入action 1 得到图景 C

假设一个环境 在C图景的情况下 输入action 2 得到图景 D

假设一个环境 在D图景的情况下 输入action 3 得到图景 E

使用 one_hot 分别表示 A,B,C,D,E


import paddleclass OneNet(paddle.nn.Layer):def __init__(self)