[to-read] - a h1de0us Collection

h1de0us 's Collections

TTS

[to-read]

updated 4 days ago

A Survey of Small Language Models

Paper • 2410.20011 • Published Oct 25 • 38
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters

Paper • 2410.23168 • Published Oct 30 • 22
What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published about 1 month ago • 59
GPT or BERT: why not both?

Paper • 2410.24159 • Published about 1 month ago • 13
Physics in Next-token Prediction

Paper • 2411.00660 • Published 29 days ago • 14
PPLLaVA: Varied Video Sequence Understanding With Prompt Guidance

Paper • 2411.02327 • Published 26 days ago • 11
OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published 23 days ago • 109
Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published 10 days ago • 37
GPT-4o System Card

Paper • 2410.21276 • Published Oct 25 • 79