Intel
/

bert-base-uncased-mrpc-int8-static-inc

Text Classification

text-classfication

Intel® Neural Compressor

neural-compressor

PostTrainingStatic

Inference Endpoints

Model card Files Files and versions Community

echarlaix HF staff commited on Mar 21

Commit

c07b4ad

•

1 Parent(s): 8dc66f1

update loading instructions

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -37,10 +37,10 @@ The linear module **bert.encoder.layer.9.output.dense** falls back to fp32 to me
 #### Load with Intel® Neural Compressor:
 ```python
-from optimum.intel.neural_compressor import IncQuantizedModelForSequenceClassification
-int8_model = IncQuantizedModelForSequenceClassification.from_pretrained(
-    'Intel/bert-base-uncased-mrpc-int8-static',
-)
 ```
 ### ONNX
@@ -65,4 +65,4 @@ The calibration dataloader is the eval dataloader. The calibration sampling size
 ```python
 from optimum.onnxruntime import ORTModelForSequenceClassification
 model = ORTModelForSequenceClassification.from_pretrained('Intel/bert-base-uncased-mrpc-int8-static')
-```

 #### Load with Intel® Neural Compressor:
 ```python
+from optimum.intel import INCModelForSequenceClassification
+model_id = "Intel/bert-base-uncased-mrpc-int8-static"
+int8_model = INCModelForSequenceClassification.from_pretrained(model_id)
 ```
 ### ONNX
 ```python
 from optimum.onnxruntime import ORTModelForSequenceClassification
 model = ORTModelForSequenceClassification.from_pretrained('Intel/bert-base-uncased-mrpc-int8-static')
+```