Intel
/

distilbart-cnn-12-6-int8-dynamic-inc

Text2Text Generation

Intel® Neural Compressor

neural-compressor

PostTrainingDynamic

Inference Endpoints

Model card Files Files and versions Community

xinhe commited on Mar 3, 2023

Commit

9418e53

•

1 Parent(s): afc3f72

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -32,6 +32,7 @@ Below linear modules (21/133) are fallbacked to fp32 for less than 1% relative a
 ### Load with optimum:
 ```python
 from optimum.intel.neural_compressor.quantization import IncQuantizedModelForSeq2SeqLM
 int8_model = IncQuantizedModelForSeq2SeqLM.from_pretrained(
     'Intel/distilbart-cnn-12-6-int8-dynamic',

 ### Load with optimum:
 ```python
+# transformers <= 4.23.0
 from optimum.intel.neural_compressor.quantization import IncQuantizedModelForSeq2SeqLM
 int8_model = IncQuantizedModelForSeq2SeqLM.from_pretrained(
     'Intel/distilbart-cnn-12-6-int8-dynamic',