Edit Models filters

Multimodal

Audio-Text-to-Text

Image-Text-to-Text

Visual Question Answering

Document Question Answering

Video-Text-to-Text

Computer Vision

Depth Estimation

Image Classification

Object Detection

Image Segmentation

Unconditional Image Generation

Video Classification

Zero-Shot Image Classification

Mask Generation

Zero-Shot Object Detection

Image Feature Extraction

Keypoint Detection

Natural Language Processing

Text Classification

Token Classification

Table Question Answering

Question Answering

Zero-Shot Classification

Feature Extraction

Text Generation

Text2Text Generation

Sentence Similarity

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Tabular Regression

Time Series Forecasting

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

49,804

Full-text search

Active filters: reinforcement-learning

achimvp/PPO-LunarLander-v2

Reinforcement Learning • Updated Jan 14 • 3

edbeeching/dmlab_30_1111

Reinforcement Learning • Updated Nov 9, 2022 • 6

edbeeching/dmlab_30_2222

Reinforcement Learning • Updated Nov 9, 2022 • 3

edbeeching/dmlab_30_3333

Reinforcement Learning • Updated Nov 9, 2022 • 1

BeeBeaver/ppo-LunarLander-v2.1

Reinforcement Learning • Updated Nov 9, 2022 • 2

Terence3927/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 13, 2022 • 7

dodge99/a2c-AntBulletEnv-v0-short-training

Reinforcement Learning • Updated Nov 9, 2022 • 1

dodge99/a2c-AntBulletEnv-v0-5k-training

Reinforcement Learning • Updated Nov 9, 2022 • 1

damilare-akin/Reinforce-1

Reinforcement Learning • Updated Nov 9, 2022

Terence3927/ppo-LunarLander-v2-optuna

Reinforcement Learning • Updated Nov 10, 2022 • 2

Terence3927/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 10, 2022

Terence3927/q-Taxi-v3

Reinforcement Learning • Updated Nov 10, 2022

TimePlan/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 10, 2022

Galeros/Reinforce-cartpole0001

Reinforcement Learning • Updated Nov 10, 2022

reza-aditya/lunar-reinforcement-learning

Reinforcement Learning • Updated Nov 10, 2022

Galeros/Reinforce-pixelcopter0001

Reinforcement Learning • Updated Mar 31, 2023

Terence3927/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 10, 2022 • 6

Galeros/Reinforce-pong0001

Reinforcement Learning • Updated Nov 10, 2022

alextoyment/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 11, 2022 • 1

reza-aditya/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 11, 2022

reza-aditya/q-Taxi-v3

Reinforcement Learning • Updated Nov 11, 2022

Terence3927/testpyramidsrnd

Reinforcement Learning • Updated Nov 11, 2022 • 10

achimvp/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jan 15

Terence3927/Reinforce-CartPole-v1

Reinforcement Learning • Updated Nov 11, 2022

achimvp/q-Taxi-v3

Reinforcement Learning • Updated Jan 15

matthh/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023 • 7

OSalem99/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 11, 2022

OSalem99/q-Taxi-v3

Reinforcement Learning • Updated Nov 11, 2022

OSalem99/q-Taxi-v3-2

Reinforcement Learning • Updated Nov 11, 2022

Terence3927/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Nov 11, 2022