sayhan
/

gemma-7b-it-GGUF-quantized

Text Generation

Model card Files Files and versions Community

sayhan commited on Feb 23

Commit

be32d9f

•

1 Parent(s): 302fb77

Update README.md

Files changed (1) hide show

README.md +10 -9

README.md CHANGED Viewed

@@ -34,15 +34,16 @@ state of the art AI models and helping foster innovation for everyone.
 ## Quantizon types
 | quantization method | bits | size     | description                                            | recommended |
 |---------------------|------|----------|-----------------------------------------------------|-------------|
-| Q3_K_S              | 3    | 20.4 GB  | very small, high quality loss                       | ❌         |
-| Q3_K_L              | 3    | 26.4 GB  | small, substantial quality loss                     | ❌         |
-| Q4_0                | 4    | 26.4 GB  | legacy; small, very high quality loss | ❌         |
-| Q4_K_M              | 4    | 28.4 GB  | medium, balanced quality              | ✅         |
-| Q5_0                | 5    | 33.2 GB  | legacy; medium, balanced quality  | ❌         |
-| Q5_K_S              | 5    | 32.2 GB  | large, low quality loss | ✅         |
-| Q5_K_M              | 5    | 33.2 GB  | large, very low quality loss | ✅         |
-| Q6_K                | 6    | 38.4 GB  | very large, extremely low quality loss              | ❌         |
-| Q8_0                | 8    | 49.6 GB  | very large, extremely low quality loss | ❌         |
 ## Usage
 You can use this model with the latest builds of LM Studio and llama.cpp.

 ## Quantizon types
 | quantization method | bits | size     | description                                            | recommended |
 |---------------------|------|----------|-----------------------------------------------------|-------------|
+| Q3_K_S              | 3    | 3.68 GB  | very small, high quality loss                       | ❌         |
+| Q3_K_L              | 3    | 4.4 GB  | small, substantial quality loss                     | ❌         |
+| Q4_0                | 4    | 4.81 GB  | legacy; small, very high quality loss | ❌         |
+| Q4_K_M              | 4    | 5.13 GB  | medium, balanced quality              | ✅         |
+| Q5_0                | 5    | 5.88 GB  | legacy; medium, balanced quality  | ❌         |
+| Q5_K_S              | 5    | 5.88 GB  | large, low quality loss | ✅         |
+| Q5_K_M              | 5    | 6.04 GB  | large, very low quality loss | ✅         |
+| Q6_K                | 6    | 7.01 GB  | very large, extremely low quality loss              | ❌         |
+| Q8_0                | 8    | 9.08 GB  | very large, extremely low quality loss | ❌         |
+| FP16                | 16   | 17.1 GB  | enormous, negligible quality loss |  ❌  |
 ## Usage
 You can use this model with the latest builds of LM Studio and llama.cpp.