hotchpotch
/

vespa-onnx-intfloat-multilingual-e5-small

Feature Extraction

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

hotchpotch commited on Mar 27

Commit

f218cbb

•

1 Parent(s): 3cf845d

Update README.md

Files changed (1) hide show

README.md +1 -3

README.md CHANGED Viewed

@@ -5,7 +5,7 @@ license: mit
 Converted [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) model in onnx format for use with [Vespa Embedding](https://docs.vespa.ai/en/embedding.html).
 - intfloat-multilingual-e5-small.onnx
-- intfloat-multilingual-e5-small_quantized.onnx (int8 quantize)
 python can also output the same vectors as vespa's embeddings.
@@ -37,8 +37,6 @@ import torch.nn.functional as F
 model_name = "hotchpotch/vespa-onnx-intfloat-multilingual-e5-small"
 onnx_file_name = "intfloat-multilingual-e5-small.onnx"
-# or quantized model
-# onnx_file_name = "intfloat-multilingual-e5-small_quantized.onnx"
 model = ORTModelForSequenceClassification.from_pretrained(
     model_name, file_name=onnx_file_name

 Converted [intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small) model in onnx format for use with [Vespa Embedding](https://docs.vespa.ai/en/embedding.html).
 - intfloat-multilingual-e5-small.onnx
+- intfloat-multilingual-e5-small_quantized.onnx (int8 quantize, In python, running it produces a different result...)
 python can also output the same vectors as vespa's embeddings.
 model_name = "hotchpotch/vespa-onnx-intfloat-multilingual-e5-small"
 onnx_file_name = "intfloat-multilingual-e5-small.onnx"
 model = ORTModelForSequenceClassification.from_pretrained(
     model_name, file_name=onnx_file_name