Adam Yanxiao Zhao's picture

9 3

Adam Yanxiao Zhao

sdpkjc

·

https://sdpkjc.com

AI & ML interests

Reinforcement Learning

Organizations

sdpkjc's activity

upvoted a paper 9 days ago

The N+ Implementation Details of RLHF with PPO: A Case Study on TL;DR Summarization

Paper • 2403.17031 • Published Mar 24 • 3

upvoted a paper 18 days ago

Robot Utility Models: General Policies for Zero-Shot Deployment in New Environments

Paper • 2409.05865 • Published Sep 9 • 14

upvoted 2 papers 3 months ago

Diffusion Policy Policy Optimization

Paper • 2409.00588 • Published Sep 1 • 19

D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning

Paper • 2408.08441 • Published Aug 15 • 7

upvoted 3 papers 5 months ago

On the Transformations across Reward Model, Parameter Update, and In-Context Prompt

Paper • 2406.16377 • Published Jun 24 • 11

FreeTraj: Tuning-Free Trajectory Control in Video Diffusion Models

Paper • 2406.16863 • Published Jun 24 • 10

TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published Jun 11 • 27

upvoted 2 papers 9 months ago

Open RL Benchmark: Comprehensive Tracked Experiments for Reinforcement Learning

Paper • 2402.03046 • Published Feb 5 • 6

Snapshot Reinforcement Learning: Leveraging Prior Trajectories for Efficiency

Paper • 2403.00673 • Published Mar 1 • 1