Self-Learning AI - a admarcosai Collection

admarcosai 's Collections

Coding

Reasoning | Planning

Alignment: FineTuning-Preference

Data Efficiency

Survey

Efficient Inference

Libraries and Framworks

Preference Dataset

Function Calling Dataset

Model Architectures

Serving

LMMM

LLM Pretraining

Models

Self-Learning AI

XAI

Efficient-Continuous Training

ParadigmShift-Inquiry

AI UX

InContext Learning

Efficient Training

LLM x Symbolics

Tool Use | Function Calling

Quantization | Compression

Math

LLM x Animation

Memory

Modality: Video

3D - AI

Mambas and LLM-AltArch

Self-Learning AI

updated Jan 4

Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2 • 64