nm-testing
/

tinyllama-one-shot-w4a16-channel-compressed

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

tinyllama-one-shot-w4a16-channel-compressed

2 contributors

History: 6 commits

mgoin's picture

Added quant_method to quantization_config

2591073 verified about 2 months ago