TA 关注的仓库 - AngryPanda_XYZ (AngryPanda_XYZ) - Gitee.com

AngryPanda_XYZ的个人主页

/

关注的仓库(22)

Watch AngryPanda_XYZ/playing-mario-with-deep-reinforcement-learning

使用强化学习算法玩mario游戏

待处理的项目

最近更新: 接近5年前

Watch AngryPanda_XYZ/Rainbow

Rainbow: Combining Improvements in Deep Reinforcement Learning

待处理的项目

最近更新: 接近5年前

Watch AngryPanda_XYZ/reinforce_with_ExperienceBuffer

设计了一种带有经验池回放机制的reinforce算法（reinforce with experience buffer），算法的主题部分使用多环境并行化的reinforce算法，并使用经验池回放机制来进一步改进算法。仿真环境使用gym的cartpole。

待处理的项目

最近更新: 5年前

Watch AngryPanda_XYZ/CartPole_PolicyNetwork_Reinforce

强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分重构，是在以前的版本CartPole_PolicyNetwork项目基础上的改进版本，主要加入了更新网络策略时不同的奖励值设定来观察不同形式下的性能区别。

待处理的项目

最近更新: 5年前

Watch AngryPanda_XYZ/Final_Version_Parallelism_Reinforce_CartPole

结合了前面几个版本的并行化强化学习的设计，给出了最终版本。gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。

待处理的项目

最近更新: 5年前

Watch AngryPanda_XYZ/Parallelism_Multi_Step_Reinforce_CartPole

gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下多步交互并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。

待处理的项目

最近更新: 5年前

Watch AngryPanda_XYZ/Parallelism_Reinforce_CartPole

gym下简单的CarlPole环境作为仿真环境，以reinforce算法作为实例算法，讨论了强化学习在多仿真环境下单步交互并行化设计的可行性，并给出了几种个人设计的架构，同时对各架构的性能进行了一定的分析。

待处理的项目

最近更新: 5年前

Watch AngryPanda_XYZ/CartPole_PolicyNetwork

强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分重构，并加入了些中文注释，同时给出了30次试验的运行结果。

待处理的项目

最近更新: 5年多前

Watch AngryPanda_XYZ/cliff_walking

强化学习中q-learning和Sarsa算法的经典对比问题------走悬崖问题

待处理的项目

最近更新: 5年多前

Watch AngryPanda_XYZ/tic_tac_toe

强化学习中经典的棋牌类双方博弈问题--------三连棋（黑白棋）问题

待处理的项目

最近更新: 5年多前