neuralmagic
/

Sparse-Llama-3.1-8B-gsm8k-2of4-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Sparse-Llama-3.1-8B-gsm8k-2of4-quantized.w4a16 / tokenizer_config.json

Commit History

Upload folder using huggingface_hub

1093d08
verified

alexmarques commited on 7 days ago