neuralmagic
/

Meta-Llama-3.1-8B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-Instruct-quantized.w8a8

Commit History

Update README.md

6aa0e7f
verified

alexmarques commited on Sep 30

Update README.md

9495321
verified

alexmarques commited on Sep 30

Upload tokenizer.json with huggingface_hub

be1f41f
verified

alexmarques commited on Sep 30

Update README.md

d7ac0b1
verified

alexmarques commited on Sep 30

Update README.md

1343a1c
verified

alexmarques commited on Sep 27

Upload tokenizer_config.json with huggingface_hub

f40c407
verified

alexmarques commited on Sep 27

Update README.md

2bfe93f
verified

alexmarques commited on Aug 13

Update README.md

44910a5
verified

alexmarques commited on Aug 7

Update README.md

e94a1df
verified

alexmarques commited on Aug 7

Update README.md

41fa77c
verified

alexmarques commited on Aug 7

Update README.md

e191b8d
verified

alexmarques commited on Jul 30

Update README.md

8f89d5f
verified

alexmarques commited on Jul 26

Update README.md

a5278f0
verified

alexmarques commited on Jul 24

Update README.md

be01205
verified

alexmarques commited on Jul 24

Update README.md

8e4a37a
verified

alexmarques commited on Jul 24

Create README.md

fa37030
verified

alexmarques commited on Jul 24

Upload folder using huggingface_hub

25b9a14
verified

alexmarques commited on Jul 24

initial commit

8599c95
verified

alexmarques commited on Jul 24