nisten
/

Tess-Mixtral-8x22B-imatrix-gguf

Inference Endpoints

Model card Files Files and versions Community

nisten commited on Apr 14

Commit

e412f32

•

1 Parent(s): b5c5d91

Update README.md

Files changed (1) hide show

README.md +5 -1

README.md CHANGED Viewed

@@ -7,6 +7,10 @@ iMatrix gguf quants of a newer finetune of Mixtral-8x22B
 EdgeQuants still underway, IQ4XS version recommended.  Make sure to combine/merge the parts back together before using
 ```
 cat tessIQ4XS.gguf.part* > tessIQ4XS.gguf
-``` Then use with llama.cpp version from April 12 or older. April 13 release had massive changes and messed up inferene for MoE models

 EdgeQuants still underway, IQ4XS version recommended.  Make sure to combine/merge the parts back together before using
 ```
 cat tessIQ4XS.gguf.part* > tessIQ4XS.gguf
+```
+Then use with llama.cpp version from April 12 or older. April 13 release had massive changes and messed up inferene for MoE models