Brian Yu's picture

Brian Yu

brian-yu-nexusflow

·

AI & ML interests

None yet

Organizations

brian-yu-nexusflow's activity

upvoted 2 papers 20 days ago

COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training

Paper • 2410.19313 • Published 26 days ago • 18

Mind Your Step (by Step): Chain-of-Thought can Reduce Performance on Tasks where Thinking Makes Humans Worse

Paper • 2410.21333 • Published 23 days ago • 9

upvoted a paper 25 days ago

Unleashing Reasoning Capability of LLMs via Scalable Question Synthesis from Scratch

Paper • 2410.18693 • Published 27 days ago • 40

upvoted a paper 5 months ago

How Do Large Language Models Acquire Factual Knowledge During Pretraining?

Paper • 2406.11813 • Published Jun 17 • 30

upvoted a collection 8 months ago

Starling

2 items • Updated Mar 20 • 7

upvoted a paper 9 months ago

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Paper • 2403.04132 • Published Mar 7 • 38

upvoted 2 papers 10 months ago

Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads

Paper • 2401.10774 • Published Jan 19 • 54

Zero Bubble Pipeline Parallelism

Paper • 2401.10241 • Published Nov 30, 2023 • 23

upvoted 3 papers 11 months ago

Understanding LLMs: A Comprehensive Overview from Training to Inference

Paper • 2401.02038 • Published Jan 4 • 62

TinyLlama: An Open-Source Small Language Model

Paper • 2401.02385 • Published Jan 4 • 89

TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones

Paper • 2312.16862 • Published Dec 28, 2023 • 30

upvoted a collection 11 months ago

NexusRaven V2 Function Calling Benchmark

10 items • Updated Dec 14, 2023 • 5

upvoted a paper about 1 year ago

Effective Long-Context Scaling of Foundation Models

Paper • 2309.16039 • Published Sep 27, 2023 • 30