Edit Models filters

Multimodal

Audio-Text-to-Text

Image-Text-to-Text

Visual Question Answering

Document Question Answering

Video-Text-to-Text

Computer Vision

Depth Estimation

Image Classification

Object Detection

Image Segmentation

Unconditional Image Generation

Video Classification

Zero-Shot Image Classification

Mask Generation

Zero-Shot Object Detection

Image Feature Extraction

Keypoint Detection

Natural Language Processing

Text Classification

Token Classification

Table Question Answering

Question Answering

Zero-Shot Classification

Feature Extraction

Text Generation

Text2Text Generation

Sentence Similarity

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Tabular Regression

Time Series Forecasting

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

49,797

Full-text search

Active filters: reinforcement-learning

edbeeching/decision-transformer-gym-walker2d-expert

Reinforcement Learning • Updated Jun 29, 2022 • 18 • 4

sb3/ppo-HalfCheetah-v3

Reinforcement Learning • Updated Oct 11, 2022 • 7 • 1

sb3/tqc-PandaReach-v1

Reinforcement Learning • Updated Aug 17, 2023 • 36 • 1

sb3/tqc-FetchPickAndPlace-v1

Reinforcement Learning • Updated Oct 11, 2022 • 9 • 2

skrl/OmniIsaacGymEnvs-Crazyflie-PPO

Reinforcement Learning • Updated Jan 15, 2023 • 1

culteejen/PPO-default-Roomba

Reinforcement Learning • Updated Feb 2, 2023 • 3 • 2

qgallouedec/ppo-InvertedPendulum-v2-902944858

Reinforcement Learning • Updated Apr 17 • 5 • 1

sb3/ppo-MiniGrid-DoorKey-5x5-v0

Reinforcement Learning • Updated Mar 31, 2023 • 44 • 1

sb3/ppo-MiniGrid-Unlock-v0

Reinforcement Learning • Updated Mar 31, 2023 • 12 • 1

culteejen/BC-from-behavior-cloning-RoombaAToB-from-behavior-cloning

Reinforcement Learning • Updated Apr 18, 2023 • 1 • 1

culteejen/PPO-punish-stagnant-bounds-RoombaAToB-punish-stagnant-bounds

Reinforcement Learning • Updated Apr 19, 2023 • 2 • 1

culteejen/BC-no-theta-RoombaAToB-no-theta

Reinforcement Learning • Updated Apr 20, 2023 • 1

Cainiao-AI/GreedRL

Reinforcement Learning • Updated May 4, 2023 • 23

PKU-Alignment/beaver-7b-v1.0

Reinforcement Learning • Updated May 9 • 150 • 10

PKU-Alignment/beaver-7b-v1.0-cost

Reinforcement Learning • Updated Apr 20 • 231 • 9

VinayHajare/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 2, 2023 • 3 • 3

chencliu/tqc-PandaPickAndPlace-v3

Reinforcement Learning • Updated Oct 5, 2023 • 46 • 4

zap-thamm/PPO-Taxi-v3

Reinforcement Learning • Updated Jan 12 • 1

unity/sentis-neural-cellular-automata

Reinforcement Learning • Updated May 7 • 79 • 2

jat-project/jat

Reinforcement Learning • Updated Apr 29 • 345 • 85

electricwapiti/ppo-Huggy

Reinforcement Learning • Updated Aug 16 • 20 • 1

rajveer43/poca-SoccerTwos

Reinforcement Learning • Updated Sep 20 • 32 • 2

eloialonso/diamond

Reinforcement Learning • Updated Oct 21 • 16

Tatsss/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 30 days ago • 18 • 1

romariov/ppo-LunarLander-v2-test

Reinforcement Learning • Updated 23 days ago • 4 • 1

devdharpatel/tla-Pendulum-v1

Reinforcement Learning • Updated 18 days ago • 1

wunderwaffe08/PPO-LunarLander-V2

Reinforcement Learning • Updated 21 days ago • 7 • 1

devdharpatel/tla-MountainCarContinuous-v0

Reinforcement Learning • Updated 18 days ago • 1

YacineRL/LunarLander-v2-PPO

Reinforcement Learning • Updated 19 days ago • 6 • 1

devdharpatel/tla_InvertedPendulum-v2

Reinforcement Learning • Updated 18 days ago • 1