Edit Models filters

Inference status

Misc

arxiv: 2407.14679

AutoTrain Compatible

Inference Endpoints

text-generation-inference

Misc with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

20

Full-text search

Active filters: 2407.14679

nvidia/Nemotron-Mini-4B-Instruct

Updated 7 days ago • 80 • 54

nvidia/Llama-3.1-Minitron-4B-Width-Base

Updated 27 days ago • 676 • 178

abiks/Nemotron-Mini-4B-Instruct-GGUF-Q8

Updated 4 days ago • 25 • 3

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated 27 days ago • 17.4k • 146

nvidia/Minitron-8B-Base

Updated 29 days ago • 451 • 61

nvidia/Minitron-4B-Base

Updated 27 days ago • 623 • 118

mgoin/Minitron-8B-Base-FP8

Text Generation • Updated Jul 26 • 12 • 3

mgoin/Nemotron-4-340B-Base-hf

Text Generation • Updated Aug 8 • 10 • 1

mgoin/Nemotron-4-340B-Base-hf-FP8

Text Generation • Updated Aug 8 • 35 • 2

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Updated 27 days ago • 75 • 18

ThomasBaruzier/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated 22 days ago • 2.36k • 3

IntervitensInc/Llama-3.1-Minitron-4B-Width-Base-chatml

Updated 23 days ago • 2.97k • 1

QuantFactory/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated 28 days ago • 2.34k • 4

QuantFactory/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Updated 27 days ago • 850 • 1

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated 26 days ago • 3.67k

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated 26 days ago • 5

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated 25 days ago • 789 • 1

QuantFactory/Minitron-4B-Base-GGUF

Updated 25 days ago • 373 • 1

QuantFactory/Minitron-8B-Base-GGUF

Updated 25 days ago • 348 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated 9 days ago • 4