xmanii commited on
Commit
797be4f
1 Parent(s): 07b7842

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +15 -204
README.md CHANGED
@@ -9,27 +9,25 @@ tags:
9
  - generated_from_trainer
10
  - dataset_size:2000
11
  - loss:CosineSimilarityLoss
 
 
 
 
12
  widget:
13
  - source_sentence: انقلاب صنعتی چگونه جامعه را تغییر داد؟
14
  sentences:
15
- - انقلاب صنعتی منجر به شهرنشینی شد زیرا مردم به شهرها نقل مکان کردند تا در کارخانه‌ها
16
- کار کنند.
17
- - انقلاب صنعتی منجر به شهرنشینی شد زیرا مردم به شهرها نقل مکان کردند تا در کارخانه‌ها
18
- کار کنند.
19
  - انقلاب صنعتی چگونه جامعه را تغییر داد؟
20
  - source_sentence: الکترون‌ها چه نقشی در پیوندهای شیمیایی ایفا می‌کنند؟
21
  sentences:
22
  - الکترون‌ها چه نقشی در پیوندهای شیمیایی ایفا می‌کنند؟
23
- - پروتون‌ها در هسته بر هویت و ویژگی‌های اتم تأثیر می‌گذارند که به طور غیرمستقیم
24
- بر نحوه‌ی تشکیل پیوندهای شیمیایی تأثیر دارد.
25
- - پروتون‌ها در هسته بر هویت و ویژگی‌های اتم تأثیر می‌گذارند که به طور غیرمستقیم
26
- بر نحوه‌ی تشکیل پیوندهای شیمیایی تأثیر دارد.
27
  - source_sentence: عملکردهای اصلی سیستم ایمنی انسان چیست؟
28
  sentences:
29
- - آنتی بادی‌ها توسط سیستم ایمنی برای کمک به خنثی کردن پاتوژن‌های ایجادکننده عفونت
30
- تولید می‌شوند.
31
- - آنتی بادی‌ها توسط سیستم ایمنی برای کمک به خنثی کردن پاتوژن‌های ایجادکننده عفونت
32
- تولید می‌شوند.
33
  - عملکردهای اصلی سیستم ایمنی انسان چیست؟
34
  - source_sentence: ماهیت بنیادی واقعیت چیست؟
35
  sentences:
@@ -43,21 +41,20 @@ widget:
43
  - شخصیت‌های اصلی در جنبش کوبیسم چه کسانی بودند؟
44
  ---
45
 
46
- # SentenceTransformer based on Alibaba-NLP/gte-multilingual-base
47
 
48
- This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Alibaba-NLP/gte-multilingual-base](https://huggingface.co/Alibaba-NLP/gte-multilingual-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
49
 
50
  ## Model Details
51
 
52
  ### Model Description
53
  - **Model Type:** Sentence Transformer
54
- - **Base model:** [Alibaba-NLP/gte-multilingual-base](https://huggingface.co/Alibaba-NLP/gte-multilingual-base) <!-- at revision 7fc06782350c1a83f88b15dd4b38ef853d3b8503 -->
55
  - **Maximum Sequence Length:** 8192 tokens
56
  - **Output Dimensionality:** 768 tokens
57
  - **Similarity Function:** Cosine Similarity
58
- <!-- - **Training Dataset:** Unknown -->
59
- <!-- - **Language:** Unknown -->
60
- <!-- - **License:** Unknown -->
61
 
62
  ### Model Sources
63
 
@@ -107,41 +104,7 @@ print(similarities.shape)
107
  # [3, 3]
108
  ```
109
 
110
- <!--
111
- ### Direct Usage (Transformers)
112
-
113
- <details><summary>Click to see the direct usage in Transformers</summary>
114
-
115
- </details>
116
- -->
117
-
118
- <!--
119
- ### Downstream Usage (Sentence Transformers)
120
-
121
- You can finetune this model on your own dataset.
122
-
123
- <details><summary>Click to expand</summary>
124
-
125
- </details>
126
- -->
127
-
128
- <!--
129
- ### Out-of-Scope Use
130
 
131
- *List how the model may foreseeably be misused and address what users ought not to do with the model.*
132
- -->
133
-
134
- <!--
135
- ## Bias, Risks and Limitations
136
-
137
- *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
138
- -->
139
-
140
- <!--
141
- ### Recommendations
142
-
143
- *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
144
- -->
145
 
146
  ## Training Details
147
 
@@ -155,140 +118,6 @@ You can finetune this model on your own dataset.
155
  - `warmup_ratio`: 0.1
156
  - `fp16`: True
157
 
158
- #### All Hyperparameters
159
- <details><summary>Click to expand</summary>
160
-
161
- - `overwrite_output_dir`: False
162
- - `do_predict`: False
163
- - `eval_strategy`: steps
164
- - `prediction_loss_only`: True
165
- - `per_device_train_batch_size`: 32
166
- - `per_device_eval_batch_size`: 32
167
- - `per_gpu_train_batch_size`: None
168
- - `per_gpu_eval_batch_size`: None
169
- - `gradient_accumulation_steps`: 1
170
- - `eval_accumulation_steps`: None
171
- - `torch_empty_cache_steps`: None
172
- - `learning_rate`: 2e-05
173
- - `weight_decay`: 0.0
174
- - `adam_beta1`: 0.9
175
- - `adam_beta2`: 0.999
176
- - `adam_epsilon`: 1e-08
177
- - `max_grad_norm`: 1.0
178
- - `num_train_epochs`: 3
179
- - `max_steps`: -1
180
- - `lr_scheduler_type`: linear
181
- - `lr_scheduler_kwargs`: {}
182
- - `warmup_ratio`: 0.1
183
- - `warmup_steps`: 0
184
- - `log_level`: passive
185
- - `log_level_replica`: warning
186
- - `log_on_each_node`: True
187
- - `logging_nan_inf_filter`: True
188
- - `save_safetensors`: True
189
- - `save_on_each_node`: False
190
- - `save_only_model`: False
191
- - `restore_callback_states_from_checkpoint`: False
192
- - `no_cuda`: False
193
- - `use_cpu`: False
194
- - `use_mps_device`: False
195
- - `seed`: 42
196
- - `data_seed`: None
197
- - `jit_mode_eval`: False
198
- - `use_ipex`: False
199
- - `bf16`: False
200
- - `fp16`: True
201
- - `fp16_opt_level`: O1
202
- - `half_precision_backend`: auto
203
- - `bf16_full_eval`: False
204
- - `fp16_full_eval`: False
205
- - `tf32`: None
206
- - `local_rank`: 0
207
- - `ddp_backend`: None
208
- - `tpu_num_cores`: None
209
- - `tpu_metrics_debug`: False
210
- - `debug`: []
211
- - `dataloader_drop_last`: False
212
- - `dataloader_num_workers`: 0
213
- - `dataloader_prefetch_factor`: None
214
- - `past_index`: -1
215
- - `disable_tqdm`: False
216
- - `remove_unused_columns`: True
217
- - `label_names`: None
218
- - `load_best_model_at_end`: False
219
- - `ignore_data_skip`: False
220
- - `fsdp`: []
221
- - `fsdp_min_num_params`: 0
222
- - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
223
- - `fsdp_transformer_layer_cls_to_wrap`: None
224
- - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
225
- - `deepspeed`: None
226
- - `label_smoothing_factor`: 0.0
227
- - `optim`: adamw_torch
228
- - `optim_args`: None
229
- - `adafactor`: False
230
- - `group_by_length`: False
231
- - `length_column_name`: length
232
- - `ddp_find_unused_parameters`: None
233
- - `ddp_bucket_cap_mb`: None
234
- - `ddp_broadcast_buffers`: False
235
- - `dataloader_pin_memory`: True
236
- - `dataloader_persistent_workers`: False
237
- - `skip_memory_metrics`: True
238
- - `use_legacy_prediction_loop`: False
239
- - `push_to_hub`: False
240
- - `resume_from_checkpoint`: None
241
- - `hub_model_id`: None
242
- - `hub_strategy`: every_save
243
- - `hub_private_repo`: False
244
- - `hub_always_push`: False
245
- - `gradient_checkpointing`: False
246
- - `gradient_checkpointing_kwargs`: None
247
- - `include_inputs_for_metrics`: False
248
- - `eval_do_concat_batches`: True
249
- - `fp16_backend`: auto
250
- - `push_to_hub_model_id`: None
251
- - `push_to_hub_organization`: None
252
- - `mp_parameters`:
253
- - `auto_find_batch_size`: False
254
- - `full_determinism`: False
255
- - `torchdynamo`: None
256
- - `ray_scope`: last
257
- - `ddp_timeout`: 1800
258
- - `torch_compile`: False
259
- - `torch_compile_backend`: None
260
- - `torch_compile_mode`: None
261
- - `dispatch_batches`: None
262
- - `split_batches`: None
263
- - `include_tokens_per_second`: False
264
- - `include_num_input_tokens_seen`: False
265
- - `neftune_noise_alpha`: None
266
- - `optim_target_modules`: None
267
- - `batch_eval_metrics`: False
268
- - `eval_on_start`: False
269
- - `use_liger_kernel`: False
270
- - `eval_use_gather_object`: False
271
- - `batch_sampler`: batch_sampler
272
- - `multi_dataset_batch_sampler`: proportional
273
-
274
- </details>
275
-
276
- ### Training Logs
277
- | Epoch | Step | Training Loss | Validation Loss |
278
- |:------:|:----:|:-------------:|:---------------:|
279
- | 0.8772 | 50 | 0.0584 | - |
280
- | 1.7544 | 100 | 0.0342 | 0.0379 |
281
- | 2.6316 | 150 | 0.0277 | - |
282
-
283
-
284
- ### Framework Versions
285
- - Python: 3.10.8
286
- - Sentence Transformers: 3.2.0
287
- - Transformers: 4.45.2
288
- - PyTorch: 2.4.1+cu121
289
- - Accelerate: 1.0.1
290
- - Datasets: 3.0.1
291
- - Tokenizers: 0.20.1
292
 
293
  ## Citation
294
 
@@ -306,21 +135,3 @@ You can finetune this model on your own dataset.
306
  url = "https://arxiv.org/abs/1908.10084",
307
  }
308
  ```
309
-
310
- <!--
311
- ## Glossary
312
-
313
- *Clearly define terms in order to be accessible across audiences.*
314
- -->
315
-
316
- <!--
317
- ## Model Card Authors
318
-
319
- *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
320
- -->
321
-
322
- <!--
323
- ## Model Card Contact
324
-
325
- *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
326
- -->
 
9
  - generated_from_trainer
10
  - dataset_size:2000
11
  - loss:CosineSimilarityLoss
12
+ - persian
13
+ - farsi
14
+ - gpt4-translated
15
+
16
  widget:
17
  - source_sentence: انقلاب صنعتی چگونه جامعه را تغییر داد؟
18
  sentences:
19
+ - انقلاب صنعتی منجر به شهرنشینی شد زیرا مردم به شهرها نقل مکان کردند تا در کارخانه‌ها کار کنند.
20
+ - انقلاب صنعتی منجر به شهرنشینی شد زیرا مردم به شهرها نقل مکان کردند تا در کارخانه‌ها کار کنند.
 
 
21
  - انقلاب صنعتی چگونه جامعه را تغییر داد؟
22
  - source_sentence: الکترون‌ها چه نقشی در پیوندهای شیمیایی ایفا می‌کنند؟
23
  sentences:
24
  - الکترون‌ها چه نقشی در پیوندهای شیمیایی ایفا می‌کنند؟
25
+ - پروتون‌ها در هسته بر هویت و ویژگی‌های اتم تأثیر می‌گذارند که به طور غیرمستقیم بر نحوه‌ی تشکیل پیوندهای شیمیایی تأثیر دارد.
26
+ - پروتون‌ها در هسته بر هویت و ویژگی‌های اتم تأثیر می‌گذارند که به طور غیرمستقیم بر نحوه‌ی تشکیل پیوندهای شیمیایی تأثیر دارد.
 
 
27
  - source_sentence: عملکردهای اصلی سیستم ایمنی انسان چیست؟
28
  sentences:
29
+ - آنتی بادی‌ها توسط سیستم ایمنی برای کمک به خنثی کردن پاتوژن‌های ایجادکننده عفونت تولید می‌شوند.
30
+ - آنتی بادی‌ها توسط سیستم ایمنی برای کمک به خنثی کردن پاتوژن‌های ایجادکننده عفونت تولید می‌شوند.
 
 
31
  - عملکردهای اصلی سیستم ایمنی انسان چیست؟
32
  - source_sentence: ماهیت بنیادی واقعیت چیست؟
33
  sentences:
 
41
  - شخصیت‌های اصلی در جنبش کوبیسم چه کسانی بودند؟
42
  ---
43
 
44
+ # SentenceTransformer based on Alibaba-NLP/gte-multilingual-base for Persian (Farsi)
45
 
46
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Alibaba-NLP/gte-multilingual-base](https://huggingface.co/Alibaba-NLP/gte-multilingual-base). It maps Persian (Farsi) sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more in the Persian language.
47
 
48
  ## Model Details
49
 
50
  ### Model Description
51
  - **Model Type:** Sentence Transformer
52
+ - **Base model:** [Alibaba-NLP/gte-multilingual-base](https://huggingface.co/Alibaba-NLP/gte-multilingual-base)
53
  - **Maximum Sequence Length:** 8192 tokens
54
  - **Output Dimensionality:** 768 tokens
55
  - **Similarity Function:** Cosine Similarity
56
+ - **Training Dataset:** 2000 high-quality Persian sentence pairs translated from English using GPT-4
57
+ - **Language:** Persian (Farsi)
 
58
 
59
  ### Model Sources
60
 
 
104
  # [3, 3]
105
  ```
106
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
107
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
108
 
109
  ## Training Details
110
 
 
118
  - `warmup_ratio`: 0.1
119
  - `fp16`: True
120
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
121
 
122
  ## Citation
123
 
 
135
  url = "https://arxiv.org/abs/1908.10084",
136
  }
137
  ```