复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29# -*- coding: utf-8 -*- import gym import time env = gym.make('CartPole-v0') observation = env.reset() print(observation) print("env actionspace:") print(env.action_space) print("env observationspace:") print(env.observation_space) print(env.observation_space.high) print(env.observation_space.low) count = 0 for t in range(100): #随机选择一个动作 action = env.action_space.sample() #执行动作 获取环境反馈 observation, reward, done, info = env.step(action) #如果玩死了就退出 if done: break env.render() count+=1 time.sleep(0.2) print(count)
效果图:
转载于:https://www.cnblogs.com/bonelee/p/9149608.html
最后
以上就是潇洒吐司最近收集整理的关于gym强化学习入门demo——随机选取动作 其实有了这些动作和反馈值以后就可以用来训练DNN网络了...的全部内容,更多相关gym强化学习入门demo——随机选取动作内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复