|
--- |
|
license: apache-2.0 |
|
datasets: |
|
- nicholasKluge/Pt-Corpus |
|
language: |
|
- pt |
|
--- |
|
|
|
É um modelo base pré-treinado com cerca de 1b tokens em portugues iniciado com os pesos oficiais do modelo, o modelo não segue instrução então precisa fazer fine tuning. |
|
|
|
| | Mistral Base PTBR | Mistral Base | Melhoria | |
|
|------------------------------|-------------------|--------------|----------| |
|
| assin2_rte | 90,11 | 87,74 | 2,37 | |
|
| assin2_sts | 72,51 | 67,05 | 5,46 | |
|
| bluex | 53,97 | 53,27 | 0,70 | |
|
| enem | 64,94 | 62,42 | 2,52 | |
|
| faquad_nli | 69,04 | 47,63 | 21,41 | |
|
| hatebr_offensive_binary | 79,62 | 77,63 | 1,99 | |
|
| oab_exams | 45,42 | 45,24 | 0,18 | |
|
| portuguese_hate_speech_binary| 58,52 | 55,72 | 2,80 | |