Qi Liu's picture

1 20

Qi Liu

purewhite42

·

Purewhite2019

AI & ML interests

Machine Learning, Theorem Proving

Organizations

purewhite42's activity

upvoted a paper 12 days ago

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published 12 days ago • 105

upvoted 2 papers about 1 month ago

Rethinking Data Selection at Scale: Random Selection is Almost All You Need

Paper • 2410.09335 • Published Oct 12 • 14

Intriguing Properties of Large Language and Vision Models

Paper • 2410.04751 • Published Oct 7 • 16

upvoted 3 papers 3 months ago

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

Paper • 2408.16532 • Published Aug 29 • 47

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

Paper • 2408.08152 • Published Aug 15 • 52

Language Model Can Listen While Speaking

Paper • 2408.02622 • Published Aug 5 • 37

upvoted 3 papers 4 months ago

ThinK: Thinner Key Cache by Query-Driven Pruning

Paper • 2407.21018 • Published Jul 30 • 30

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 155

Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On

Paper • 2407.08348 • Published Jul 11 • 50

upvoted 3 papers 5 months ago

BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions

Paper • 2406.15877 • Published Jun 22 • 45

Intrinsic Evaluation of Unlearning Using Parametric Knowledge Traces

Paper • 2406.11614 • Published Jun 17 • 4

An Image is Worth 32 Tokens for Reconstruction and Generation

Paper • 2406.07550 • Published Jun 11 • 55

upvoted 3 papers 6 months ago

Matryoshka Multimodal Models

Paper • 2405.17430 • Published May 27 • 31

LoRA Learns Less and Forgets Less

Paper • 2405.09673 • Published May 15 • 87

Chameleon: Mixed-Modal Early-Fusion Foundation Models

Paper • 2405.09818 • Published May 16 • 126

upvoted a paper 8 months ago

MoAI: Mixture of All Intelligence for Large Language and Vision Models

Paper • 2403.07508 • Published Mar 12 • 75

upvoted a paper 9 months ago

MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs

Paper • 2402.15627 • Published Feb 23 • 34

upvoted 2 papers 11 months ago

Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models

Paper • 2312.06585 • Published Dec 11, 2023 • 28

LLM360: Towards Fully Transparent Open-Source LLMs

Paper • 2312.06550 • Published Dec 11, 2023 • 56

upvoted a paper 12 months ago

Exponentially Faster Language Modelling

Paper • 2311.10770 • Published Nov 15, 2023 • 118