ppo-pytorch

Here are 93 public repositories matching this topic...

nikhilbarhate99 / PPO-PyTorch

Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch

reinforcement-learning deep-learning deep-reinforcement-learning pytorch policy-gradient reinforcement-learning-algorithms pytorch-tutorial proximal-policy-optimization ppo pytorch-implmention ppo-pytorch

Updated Jul 9, 2024
Python

Lizhi-sjtu / DRL-code-pytorch

Star

Concise pytorch implements of DRL algorithms, including REINFORCE, A2C, DQN, PPO(discrete and continuous), DDPG, TD3, SAC.

reinforcement-learning pytorch rainbow-dqn dqn-pytorch ddpg-pytorch ppo-pytorch sac-pytorch ppo-gru ppo-lstm td3-pytorch

Updated Mar 29, 2023
Python

reiniscimurs / DRL-robot-navigation-IR-SIM

Star

Deep Reinforcement Learning for mobile robot navigation in IR-SIM simulation. Using DRL (SAC, TD3, PPO, DDPG) neural networks, a robot learns to navigate to a random goal point in a simulated environment while avoiding obstacles.

ddpg obstacle-avoidance sac drl ppo robot-navigation obstacle-avoidance-robot td3 ddpg-pytorch ppo-pytorch sac-pytorch drl-pytorch td3-pytorch ir-sim

Updated Dec 14, 2025
Python

taherfattahi / ppo-rocket-landing

Star

Proximal Policy Optimization (PPO) algorithm using PyTorch to train an agent for a rocket landing task in a custom environment

machine-learning reinforcement-learning ai pytorch ppo ppo-pytorch

Updated Nov 2, 2024
Python

CherryPieSexy / imitation_learning

Star

PyTorch implementation of some reinforcement learning algorithms: A2C, PPO, Behavioral Cloning from Observation (BCO), GAIL.

reinforcement-learning deep-learning deep-reinforcement-learning pytorch policy-gradient imitation-learning proximal-policy-optimization ppo advantage-actor-critic a2c gail ppo-pytorch ppo-algo recurrent-ppo gail-ppo

Updated Nov 15, 2021
Python

dvalenciar / ReinforceUI-Studio

Sponsor

Star

ReinforceUI-Studio. A Python-based application designed to simplify the configuration and monitoring of RL training processes. Supporting MuJoCo, OpenAI Gymnasium, and DeepMind Control Suite. Algorithms included: CTD4, DDPG, DQN, PPO, SAC, TD3, TQC

machine-learning reinforcement-learning deep-learning pytorch reinforcement-learning-algorithms gymnasium mujoco reinforcement-learning-agent dm-control mlflow soft-actor-critic ppo-pytorch

Updated Jul 11, 2025
Python

philtabor / ProtoRL

Star

A Torch Based RL Framework for Rapid Prototyping of Research Papers

dqn ddpg sac actor-critic dueling-network-architecture dueling-dqn proximal-policy-optimization ppo prioritized-experience-replay td3 soft-actor-critic dqn-pytorch dueling-ddqn ddpg-pytorch dueling-dqn-pytorch ppo-pytorch sac-pytorch td3-pytorch twin-delayed-policy-gradient

Updated Jul 17, 2025
Python

akjayant / PPO_Lagrangian_PyTorch

Star

Implementation of PPO Lagrangian in PyTorch

reinforcement-learning lagrangian ppo safe-reinforcement-learning pytorch-implementation ppo-pytorch ppo-lagrangian

Updated Aug 29, 2022
Python

faildeny / Multi_Agent_PPO

Star

Multi agent PPO implementation in Pytorch for Unity ML Agents environments.

reinforcement-learning multi-agent-reinforcement-learning unity-ml-agents reacher-environment ppo-pytorch

Updated Jul 25, 2024
Python

paulchen2713 / RIS-MISO-HWI-DRL

Star

A PyTorch implementation of the IEEE WCNC 2025 paper "Worst-Case MSE Minimization for RIS-Assisted mmWave MU-MISO Systems With Hardware Impairments and Imperfect CSI"

reinforcement-learning gymnasium wireless-communication ppo-pytorch stable-baselines3 digital-beamforming reconfigurable-intelligent-surfaces

Updated Jun 8, 2025
Python

jatinarora2702 / gail-pytorch

Star

PyTorch implementation of GAIL and PPO reinforcement learning algorithms

reinforcement-learning openai-gym pytorch policy-gradient imitation-learning gail cartpole-v0 ppo-pytorch

Updated May 7, 2021
Python

Solrikk / CriptoWhisper

Star

TradeWhisperer is a sophisticated cryptocurrency trading bot that leverages advanced Reinforcement Learning techniques, specifically the Proximal Policy Optimization (PPO) algorithm, to navigate the complex world of crypto markets. Built with a focus on adaptability and risk management, this bot combines technical analysis with machine learning.