Shuo Zhang's picture

2 7 3

Shuo Zhang

Meteonis

·

00index

AI & ML interests

None yet

Organizations

Meteonis's activity

upvoted 3 papers 3 months ago

Power Scheduler: A Batch Size and Token Number Agnostic Learning Rate Scheduler

Paper • 2408.13359 • Published Aug 23 • 22

In-Context Imitation Learning via Next-Token Prediction

Paper • 2408.15980 • Published Aug 28 • 9

Amuro & Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models

Paper • 2408.06663 • Published Aug 13 • 15

upvoted 2 papers 5 months ago

Scaling Laws of RoPE-based Extrapolation

Paper • 2310.05209 • Published Oct 8, 2023 • 6

InternLM-Math: Open Math Large Language Models Toward Verifiable Reasoning

Paper • 2402.06332 • Published Feb 9 • 18

upvoted a paper 10 months ago

DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

Paper • 2401.06066 • Published Jan 11 • 43

upvoted a paper about 1 year ago

Leveraging Large Language Models for Automated Proof Synthesis in Rust

Paper • 2311.03739 • Published Nov 7, 2023 • 5