catid
/

cat-llama-3-70b-awq-q128-w4-gemm

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

cat-llama-3-70b-awq-q128-w4-gemm

1 contributor

History: 9 commits

catid's picture

Merge branch 'main' of hf.co:catid/cat-llama-3-70b-awq-q128-w4-gemm

6821a88 7 months ago