compressa-ai
/

Llama-3-70B-Instruct-OmniQuant

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3-70B-Instruct-OmniQuant

2 contributors

History: 5 commits

Vasily Alexeev

add mmlu and ru benchs

bc99d8d 6 months ago