mogaio commited on
Commit
30d8fff
1 Parent(s): cd69681

Add SetFit model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false
7
+ }
README.md ADDED
@@ -0,0 +1,387 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ library_name: setfit
3
+ tags:
4
+ - setfit
5
+ - sentence-transformers
6
+ - text-classification
7
+ - generated_from_setfit_trainer
8
+ metrics:
9
+ - '0'
10
+ - '1'
11
+ - '2'
12
+ - accuracy
13
+ - macro avg
14
+ - weighted avg
15
+ widget:
16
+ - text: 'L’armée, qui annonce avoir pris en tenaille la ville de Gaza, avance désormais
17
+ à ses portes. Le long de la mer, les bombardements se sont multipliés et des échanges
18
+ de tirs ont été entendus à la lisière nord du camp de réfugiés de Shati, vaste
19
+ et miséreux fief du Hamas où a longtemps vécu le chef de son bureau politique,
20
+ Ismaïl Hanniyeh, ainsi que plus au sud, dans le quartier cossu de Tel al-hawa,
21
+ autour de l’hôpital Al-quds Au sud, enfin, des forces de la 36e division blindée,
22
+ précédées par un bataillon de reconnaissance de la brigade Golani, ont traversé
23
+ l’enclave pour atteindre la côte et isoler la ville de Gaza du reste du territoire.
24
+
25
+ « Nos forces opèrent sous la forme de groupes tactiques combinant l’infanterie,
26
+ le renseignement, la logistique et le génie, avec l’appui d’une puissante couverture
27
+ aérienne», détaille le lieutenant-colonel Conricus »
28
+
29
+ Le journaliste souligne par ailleurs que « l’heure tourne », et que chaque nouveau
30
+ bombardement risque d’accroître la pression de la communauté internationale vis-à-vis
31
+ d’israël Après d’intenses bombardements et une avancée prudente aux portes de
32
+ Gaza, l’armée israélienne engage la phase critique de ses opérations, qui vise
33
+ à traquer les combattants du Hamas dans leurs tunnels et leurs bunkers « Avec
34
+ ses milliers d’accès vers la surface, qui permettent à l’ennemi de surgir derrière
35
+ nos
36
+
37
+ troupes pour leur tirer dessus avant de replonger sous terre, la forteresse de
38
+ Gaza constitue un défi qu’aucune armée occidentale n’a jamais affronté », poursuit
39
+ Giora Eiland.
40
+
41
+ Ce week-end, les brigades Ezzedine al-qassam ont diffusé un montage enchaînant
42
+ de courtes vidéos sur lesquelles des combattants, embusqués derrière les ruines
43
+ d’un bâtiment bombardé ou tapis au coin d’une rue, tirent avec un lance-grenades
44
+ RPG ou un missile antichar sur un blindé isolé » Selon l’armée israélienne, d’énormes
45
+ quantités de ciment et de métal fournies par des bailleurs de fonds étrangers,
46
+ afin de reconstruire l’enclave après de précédentes guerres, ont été détournées
47
+ pour aménager plus de 500 kilomètres de tunnels reliant des bunkers enterrés parfois
48
+ à plus de 50 mètres de profondeur Le ministre de la Défense, Yoav Gallant, affirme
49
+ que l’armée progresse désormais «au coeur de Gaza-ville ».
50
+
51
+ L’opération terrestre, pour l’heure circonscrite à la moitié nord de l’enclave,
52
+ a débuté le 27 octobre par une manoeuvre d’encerclement organisée le long de trois
53
+ axes distincts'
54
+ - text: 'Au deuxième jour de leur sommet, les chefs d’État et de gouvernement de l’UE
55
+ ont insisté sur le fait qu’il durerait aussi longtemps qu’il le faudra.
56
+
57
+ Pourtant, quelques fractures sont apparues sur le front économique Au deuxième
58
+ jour de leur sommet, les chefs d’État et de gouvernement de l’UE ont insisté sur
59
+ le fait qu’il durerait aussi longtemps qu’il le faudra.
60
+
61
+ Au deuxième jour de leur sommet, les chefs d’État et de gouvernement de l’UE ont
62
+ insisté sur le fait qu’il durerait aussi longtemps qu’il le faudra Le débat sur
63
+ l’aide à l’Ukraine s’inscrit dans une question plus large concernant l’argent
64
+ dont l’UE a besoin pour augmenter son budget pluriannuel. Depuis qu’il a été convenu,
65
+ de nouvelles dépenses ont été engagées pour faire face au Covid, à la guerre en
66
+ Ukraine et à la hausse des taux d’intérêt Au deuxième jour de leur sommet, les
67
+ chefs d’État et de gouvernement de l’UE ont insisté sur le fait qu’il durerait
68
+ aussi longtemps qu’il le faudra'
69
+ - text: 'On a le droit de voir un signe là où d’autres envisagent le hasard: le roi
70
+ Pelé est mort le 29décembre 2022, onze jours après le couronnement de Lionel Messi,
71
+ à Doha, en finale de la Coupe du monde, vive le roi. Vivent les rois: en devenant
72
+ enfin champion du monde, à 35ans, l’Argentin est devenu le seul voisin du Brésilien,
73
+ sur un trône à deux couronnes Lionel Messi a reçu hier son huitième Ballon d’Or.
74
+ Un total stratosphérique qui place l’Argentin de 36 ans au-dessus de toute concurrence,
75
+ et peut-être pour l’éternité L’attaquant argentin a reçu, hier à Paris, un huitième
76
+ Ballon d’Or, sans doute le dernier, qui le place loin devant la concurrence.
77
+
78
+ De Paris, Lionel Messi ne conserve pas que de bons souvenirs, mais jamais il n’y
79
+ avait été autant acclamé pour marcher sous les projecteurs qu’hier soir aux alentours
80
+ de 22 h 30, au théâtre du Châtelet, quand lui a été décerné le huitième Ballon
81
+ d’Or de son immense carrière'
82
+ - text: 'Réalité
83
+
84
+ Gaston d’Orléans, le troisième fils d’Henri IV et de Marie de Médicis et le frère
85
+ benjamin du roi Louis XIII, était un être instable et belliqueux qui passa sa
86
+ vie à conspirer, à ourdir des complots contre son propre frère et le cardinal
87
+ de Richelieu, puis contre sa belle-soeur Anne d’Autriche. Dans le film, c’est
88
+ la conspiration de Chalais en 1626, visant le cardinal de Richelieu et Louis XIII,
89
+ qui est reconstituée Dans le roman d’Alexandre Dumas, Constance Bonacieux, son
90
+ héroïne de papier, est l’une des servantes loyales de la reine Anne d’Autriche.
91
+ Soupçonnée d’espionnage, elle est enlevée sur ordre de Richelieu, sous les yeux
92
+ de d’Artagnan, son chevalier servant'
93
+ - text: 'Une vidéo qui a fait réagir
94
+
95
+ Cristiano Ronaldo sur le réseau social. Le quintuple ballon d’or portugais, éternel
96
+ rival de Messi, s’est fendu d’un commentaire avec quatre émojis «mort de rire»,
97
+ comme pour dénigrer les propose du journaliste Le quintuple ballon d’or a réagi
98
+ à la vidéo d’un journaliste espagnol félicitant
99
+
100
+ Lionel Messi'
101
+ pipeline_tag: text-classification
102
+ inference: true
103
+ base_model: sentence-transformers/paraphrase-multilingual-mpnet-base-v2
104
+ model-index:
105
+ - name: SetFit with sentence-transformers/paraphrase-multilingual-mpnet-base-v2
106
+ results:
107
+ - task:
108
+ type: text-classification
109
+ name: Text Classification
110
+ dataset:
111
+ name: Unknown
112
+ type: unknown
113
+ split: test
114
+ metrics:
115
+ - type: '0'
116
+ value:
117
+ precision: 0.9102564102564102
118
+ recall: 0.8402366863905325
119
+ f1-score: 0.8738461538461538
120
+ support: 169
121
+ name: '0'
122
+ - type: '1'
123
+ value:
124
+ precision: 0.9342465753424658
125
+ recall: 0.9551820728291317
126
+ f1-score: 0.9445983379501386
127
+ support: 714
128
+ name: '1'
129
+ - type: '2'
130
+ value:
131
+ precision: 0.8734177215189873
132
+ recall: 0.8625
133
+ f1-score: 0.8679245283018868
134
+ support: 240
135
+ name: '2'
136
+ - type: accuracy
137
+ value: 0.9180765805877115
138
+ name: Accuracy
139
+ - type: macro avg
140
+ value:
141
+ precision: 0.9059735690392877
142
+ recall: 0.8859729197398881
143
+ f1-score: 0.8954563400327263
144
+ support: 1123
145
+ name: Macro Avg
146
+ - type: weighted avg
147
+ value:
148
+ precision: 0.9176363680252991
149
+ recall: 0.9180765805877115
150
+ f1-score: 0.9175646483426998
151
+ support: 1123
152
+ name: Weighted Avg
153
+ ---
154
+
155
+ # SetFit with sentence-transformers/paraphrase-multilingual-mpnet-base-v2
156
+
157
+ This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.
158
+
159
+ The model has been trained using an efficient few-shot learning technique that involves:
160
+
161
+ 1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
162
+ 2. Training a classification head with features from the fine-tuned Sentence Transformer.
163
+
164
+ ## Model Details
165
+
166
+ ### Model Description
167
+ - **Model Type:** SetFit
168
+ - **Sentence Transformer body:** [sentence-transformers/paraphrase-multilingual-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2)
169
+ - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
170
+ - **Maximum Sequence Length:** 128 tokens
171
+ - **Number of Classes:** 3 classes
172
+ <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
173
+ <!-- - **Language:** Unknown -->
174
+ <!-- - **License:** Unknown -->
175
+
176
+ ### Model Sources
177
+
178
+ - **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
179
+ - **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
180
+ - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
181
+
182
+ ### Model Labels
183
+ | Label | Examples |
184
+ |:------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
185
+ | pos | <ul><li>'Avec, entre autres, « Un homme et une femme », « L’aventure, c’est l’aventure », « La bonne année », «Les uns et les autres» ou «Itinéraire d’un enfant gâté », il reste l’un des cinéastes préférés des Français Claude Lelouch «JE SUIS UN CINÉASTE AMATEUR, PAS UN PROFESSIONNEL DU CINÉMA !»\nJOURNAL DE FRANCE : Claude, comment vous est venue l’idée de ce spectacle « Ciné Spectacle\nSymphonique» ?\nCLAUDE LELOUCH : On est venu me proposer ce projet que j’ai trouvé tout de suite formidable, à savoir de revisiter mes 50 films à travers la musique et les bandes originales, interprétées par un grand orchestre symphonique'</li><li>'"Ces camions ne sont pas seulement des camions, ils sont une bouée de sauvetage, ils font la différence entre la vie et la mort pour de nom‐ breuses personnes à Gaza", a déclaré le secrétaire général de l\'ONU Antonio Guterres en supervisant personnellement les opérations à Rafah ven‐ dredi Le Hamas a libéré vendredi soir deux Américaines qu\'il avait enlevées le 7 octobre lors de son attaque meur‐ trière contre Israël, une lueur d\'espoir pour les quelque 200 otages encore retenus à Gaza, où des mil‐ lions de Palestiniens conti‐ nuent d\'attendre l\'arrivée de l\'aide humanitaire ur‐ gente Le Croissant Rouge palesti‐ nien a par ailleurs fait état d\'une menace de bombarde‐ ment israélien contre l\'hôpital\nAl-Quds, dans le nord de la bande de Gaza, mais s\'est dé‐ claré "incapable" d\'évacuer l\'établissement qui héberge quelque 500 patients dans la zone de l\'enclave la plus dure‐ ment frappée par l\'armée is‐ raélienne - Camions bloqués Au onzième jour de siège complet par Israël, les 2,4 mil‐ lions d\'habitants de Gaza manquent de nourriture, d\'eau potable, de médica‐ ments et de carburant. Et ce alors qu\'environ 175 camions d\'aide humanitaire restent bloqués du côté égyptien de la frontière, au terminal de Ra‐ fah 400 personnes ont été tuées sur le territoire israélien par les hommes du Hamas depuis le 7 octobre, en majorité des civils fauchés par balles, brûlés vifs ou morts de mutilations au premier jour de l\'attaque des combattants du mouvement islamiste pa‐ lestinien menée à partir de Gaza, selon les autorités israé‐ liennes.\nSelon l\'armée israélienne, environ 1.500 combattants du Hamas ont été tués dans la contre-offensive ayant permis à Israël de reprendre le contrôle des zones attaquées - Camions bloqués Au onzième jour de siège complet par Israël, les 2,4 mil‐ lions d\'habitants de Gaza manquent de nourriture, d\'eau potable, de médica‐ ments et de carburant A terme, Israël envisage parmi les scénarios possibles de "remettre les clés" de la bande de Gaza à une partie tierce qui pourrait être l\'Egypte, sans aucune garantie que Le Caire accepte ce scéna‐ rio repoussé depuis des dé‐ cennies, a affirmé une source au ministère des Affaires étrangères israélien à l\'AFP Le Hamas a libéré vendredi soir deux Américaines qu\'il avait enlevées le 7 octobre lors de son attaque meur‐ trière contre Israël, une lueur d\'espoir pour les quelque 200 otages encore retenus à Gaza, où des mil‐ lions de Palestiniens conti‐ nuent d\'attendre l\'arrivée de l\'aide humanitaire ur‐ gente.\nLes deux femmes, une mère et sa fille, ont été relâ‐ chées apr��s une médiation du Qatar "J\'ai peur que les destruc‐ tions actuelles suivent un plan clair, que les gens ne trouvent pas d\'endroit où vivre et que cela provoque une deuxième Nakba", s\'in‐ quiète à Gaza Omar Ashour, un général à la retraite, en ré‐ férence à l\'expulsion d\'environ 760.000 Palestiniens à la créa‐ tion d\'Israël 137 Palestiniens, majoritai‐ rement des civils, ont été tués dans les bombardements in‐ cessants menés en repré‐ sailles par l\'armée israélienne, selon le ministère de la Santé du Hamas à Gaza Israël a autorisé, à la de‐ mande des Etats-Unis, l\'entrée d\'aide via Rafah, seule issue de Gaza sur le monde qu\'il ne contrôle pas. A condition qu\'elle n\'arrive qu\'aux "civils".\nLe Croissant Rouge palesti‐ nien a par ailleurs fait état d\'une menace de bombarde‐ ment israélien contre l\'hôpital\nAl-Quds, dans le nord de la bande de Gaza, mais s\'est dé‐ claré "incapable" d\'évacuer l\'établissement qui héberge quelque 500 patients dans la zone de l\'enclave la plus dure‐ ment frappée par l\'armée is‐ raélienne'</li><li>'En septembre, son legs était couronné par la sortie, en coffret, de l’intégrale de ses oeuvres, Cétoului : Rachid Taha, régime intégral. Cette effervescence ne pouvait laisser indifférent son vieux pote Burger, qui a programmé, du 19 au 22 octobre, un hommage ponctué de concerts, rencontres, lectures et tables rondes Le samedi sera projeté Rachid Taha, rockeur sans frontières, du réalisateur Thierry Guedj, avant que l’historien Jean-pierre Filiu, admirateur du musicien, donne une conférence sur les liens méconnus entre l’alsace et l’algérie, suivie d’une table ronde Depuis 2001, Saintemarie-aux-mines, ville alsacienne au nom délicieusement cathoprolo, nichée au creux d’une vallée vosgienne, accueille le bien nommé festival C’est dans la vallée, créé et toujours dirigé par un natif du coin, le musicien Rodolphe Burger, fondateur de Kat Onoma, groupe de rock phare de la charnière 1980-1990, et fureteur de sonorités nouvelles C’est avec eux que Rachid Taha a donné son dernier concert à Marseille, quelques jours avant sa mort, et des sessions programmées en studio'</li></ul> |
186
+ | obj | <ul><li>'Elon Musk estime que le télétravail est moralement répréhensible. Google a récemment inclus l’assiduité au bureau dans l’évaluation des performances de ses employés'</li><li>'"Ce qu\'on voit à la télévi‐ sion, les massacres qui ont lieu à Gaza, les enfants, ça nous brise le coeur", déclare Moustafa el-Sayyed, 53 ans, parti avec ses deux femmes et ses onze enfants de Beit Lif, un petit village situé à moins de six kilomètres de la fron‐ tière avec Israël "Nous allons entrer dans Gaza, nous allons le faire pour un but opérationnel, détruire les infrastructures et les terro‐ ristes du Hamas, et nous al‐ lons le faire de manière pro‐ fessionnelle", a affirmé same‐ di lors d\'une revue des troupes le chef d\'état-major israélien, le général Herzi Ha‐ levi "Gaza est complexe, Gaza est densément peuplé, l\'enne‐ mi y prépare beaucoup de choses, mais nous nous pré‐ parons aussi pour lui", a pré‐ venu le général Halevi "Dès aujourd\'hui, nous al‐ lons augmenter les frappes" sur la bande de Gaza, a préve‐ nu samedi le général Daniel Hagari, porte-parole de l\'ar‐ mée israélienne, le but étant selon lui de "réduire les risques pour nos forces dans les prochaines étapes" du conflit - Famille décimée A six kilomètres de la fron‐ tière avec Gaza, le kibboutz de Beeri, où les commandos du Hamas ont massacré au moins 100 personnes le 7 oc‐ tobre, se prépare à de nou‐ veaux enterrements di‐ manche Israël a ordonné le 15 oc‐ tobre aux civils du nord de la bande de Gaza de fuir vers le sud du territoire pour se mettre à l\'abri de ses bombar‐ dements contre le Hamas.\n- Situation "catastro‐ phique" à Gaza Mais les bombardements se poursuivent aussi dans les parties méridionales de l\'en‐ clave 400 personnes ont été tuées sur le territoire israélien par les hommes du Hamas depuis le 7 octobre, en majorité des civils fauchés par balles, brûlés vifs ou morts de mutilations au premier jour de l\'attaque des combattants du mouvement islamiste pa‐ lestinien menée à partir de Gaza, selon les autorités israé‐ liennes.\nDans la bande de Gaza, au moins 4.385 Palestiniens, ma‐ joritairement des civils, ont été tués dans les bombarde‐ ments incessants menés en représailles par l\'armée israé‐ lienne, selon le ministère de la Santé du Hamas - Situation "catastro‐ phique" à Gaza Mais les bombardements se poursuivent aussi dans les parties méridionales de l\'en‐ clave. Les autorités du Hamas ont ainsi fait état de neuf morts lors d\'une frappe à Khan Younès dans la nuit de samedi à dimanche Soumise à un blocus israé‐ lien terrestre, aérien et mari‐ time depuis que le Hamas y a pris le pouvoir en 2007, la bande de Gaza est placée de‐ puis le 9 octobre en état de "siège complet" par Israël qui y a coupé l\'eau, l\'électricité et l\'approvisionnement en nour‐ riture Samedi, un convoi de vingt camions transportant de l\'aide humanitaire est entré dans l\'enclave depuis l\'Egypte par le poste-frontière de Ra‐ fah, la seule issue de la bande de Gaza qui ne soit pas contrôlée par Israël, qui a été à nouveau fermé ensuite.\nMais selon le Bureau des affaires humanitaires de l\'ONU (OCHA), ces vingt ca‐ mions n\'équivalent qu\'à 4% des importations quoti‐ diennes de Gaza avant le dé‐ but des hostilités, et au moins 100 camions par jour sont né‐ cessaires pour améliorer la si‐ tuation 385 Palestiniens, ma‐ joritairement des civils, ont été tués dans les bombarde‐ ments incessants menés en représailles par l\'armée israé‐ lienne, selon le ministère de la Santé du Hamas Mais selon le Bureau des affaires humanitaires de l\'ONU (OCHA), ces vingt ca‐ mions n\'équivalent qu\'à 4% des importations quoti‐ diennes de Gaza avant le dé‐ but des hostilités, et au moins 100 camions par jour sont né‐ cessaires pour améliorer la si‐ tuation.\nAu moins 42% des loge‐ ments de la bande de Gaza ont été détruits ou endom‐ magés depuis le début du conflit, selon l\'OCHA Au moins 42% des loge‐ ments de la bande de Gaza ont été détruits ou endom‐ magés depuis le début du conflit, selon l\'OCHA. - Renforcement américain Autre foyer de tension, le nord d\'Israël, où les échanges de tirs se multiplient entre l\'armée israélienne et le Hez‐ bollah pro-iranien, allié du Ha‐ mas et basé dans le sud du Li‐ ban'</li><li>'Elle implique des coopérations », a expliqué mercredi soir Emmanuel Macron à l’issue de son voyage au Proche-Orient. La veille, il avait proposé la mise d’une coalition régionale et internationale sur le modèle de celle qui lutte contre Daech au Levant Mercredi au Caire, le président français a insisté sur le soutien humanitaire et la recherche d’une solution politique\n« Ce que je suis venu dire, c’est que la lute contre le terrorisme n’est pas l’affaire d’un seul pays Au lendemain de sa proposition de mise en place d’une coalition internationale, sur le modèle de celle utilisée en Irak et en Syrie pour lutter contre Daech, Emmanuel Macron a rétropédalé mercredi lors de son allocution au Caire au côté du président égyptien, Abdel Fattah alSissi « La bonne réponse est de coopérer, de tirer les enseignements de la coalition contre Daech, contre lequel nous sommes engagés depuis plusieurs années », formule désormais Emmanuel Macron. Le chef de l’Etat ne parle plus de « coalition » mais de « coopération », notamment en matière de renseignement, ce que pratique déjà Israël Au terme d’une tournée au ProcheOrient qui l’aura mené en Israël, en Palestine, en Jordanie et enfin en Egypte, Emmanuel Macron s’est envolé pour Paris mercredi soir sans avoir pu obtenir la libération des otages. Paris cherchera à avoir un siège à la table des négociations, une fois la guerre achevée, pour remettre sur les rails le processus de paix israélo-palestiniens A Ramallah, à Amman et au Caire, Emmanuel Macron a pu éprouver la révolte profonde des populations. Des manifestations ont eu lieu dans les deux premières capitales où son effigie a été brûlée Chez Macron, il y a aussi toujours cette propension à relier la politique étrangère à la scène intérieure française.\nCette volonté perpétuelle d’être au centre du jeu et de recherche immédiate de résultats a parfois trahi le président français dans le passé, comme en Libye où il voulait des élections à tout prix et au Liban où il poussait un agenda politique que la classe politique locale n’était pas prête à accepter'</li></ul> |
187
+ | neg | <ul><li>'Cette tenaille identitaire est d’autant plus préoccupante que Jean-Luc Mélenchon est en train de laisser le RN se faire le premier défenseur des juifs. Dans sa stratégie de dédiabolisation, le RN récupère et instrumentalise une frustration existante dans la communauté juive Dans sa stratégie de dédiabolisation, le RN récupère et instrumentalise une frustration existante dans la communauté juive. Or, il est devenu facile de diaboliser LFI Ni LFI, ni le RN n’ont leur place dans la lutte contre l’antisémitisme. Ces deux limites auraient dû être posées dès le départ. Au sein de la communauté juive, j’ai longtemps plaidé pour maintenir le dialogue avec Jean-Luc Mélenchon et ses sympathisants Le philosémitisme du RN n’est qu’une façon de taper sur les musulmans sur fond de choc des civilisations. Quand les héritiers de Jean-Marie Le Pen auront fini de prendre les musulmans pour cibles, ils s’attaqueront aux juifs pour ce qu’ils ont toujours été aux yeux de l’extrême droite : un agent étranger RAFAËL AMSELEM est chargé d’études pour GenerationLibre, un think tank libéral'</li><li>'L’avocate a demandé au tribunal de prononcer une série d’injonctions à l’adresse de GSK afin d’abolir ce qu’elle considère comme une discrimination, soit cesser d’organiser des contacts, réunions et informations de chaque délégation syndicale (celle des ouvriers et des employés) de manière séparée, entendez par là que la société privilégie les représentants syndicaux de la FGTB réunis sans que ceux de la CSC ne soient admis dans le saint des saints En ouvrant mardi matin l’audience du tribunal du travail du Brabant wallon siégeant à Wavre, la présidente Mariella Forêt résuma en ces termes le différend qui oppose les verts et les rouges au travers de GSK : « Ce n’est pas l’amour fou entre eux… »\nPour la petite histoire, on relèvera qu’elle demanda aux avocats intervenants d’excuser les conditions dans lesquelles elle les accueillait, au premier étage d’un immeuble du centre-ville La CSC et la CNE accusent la société rixensartoise de discrimination au profit de la FGTB qui est largement représentée en son sein Dans la foulée, l’avocat JeanPhilippe Cordier prit la parole pour GSK. « En trente ans de barreau, je n’ai jamais entendu autant de contre-vérités. C’est digne d’un bac à sable'</li><li>'Israël a répliqué lundi avec des frappes aériennes sur la bande de Gaza et un siège complet de ce territoire palestinien, alors que le Hamas menace d’exécuter les otages saisis lors de son incursion armée si les attaques ne cessent pas Son armée a ainsi ordonné, lundi, un « siège complet » de Gaza, ce qui signifie pas d’électricité, pas d’eau, pas de gaz, pas de nourriture, a précisé lundi le ministre israélien de la Défense, Yoav Gallant »\nIsraël a aussi pilonné la bande de Gaza, d’où ont surgi la majorité des combattants du Hamas au petit matin, samedi La réplique de cette attaque surprise exécutée dès samedi matin par les combattants du Hamas depuis Gaza sur plusieurs fronts sera d’une « force sans précédent », a déclaré lundi le premier ministre israélien, Benjamin Nétanyahou, dans une allocution télévisée Parmi les victimes en territoire israélien, au moins 250 ont été massacrées sur le site d’un festival de musique techno dans le désert, à quelques kilomètres à peine de la bande de Gaza, dans le sud d’Israël. Des témoins ont décrit un terrifiant carnage, et des jeunes courant à travers le désert dans toutes les directions pour fuir les balles qui sifflaient autour d’eux Outre l’attaque contre le festival, le Hamas a tiré des roquettes — plus de 4500, selon Israël — depuis la bande de Gaza vers les localités israéliennes voisines et jusque vers TelAviv et Jérusalem Le Hamas a aussi procédé à prendre des otages parmi les soldats et même les civils trouvés sur son passage et à les ramener dans la bande de Gaza, un territoire qu’il contrôle depuis 2007. Israël estime que 150 des siens sont captifs Du côté palestinien, 687 personnes ont été tuées et 3700 blessées, selon le ministère de la Santé de la bande de Gaza.\n« À ma connaissance, depuis la Shoah, il n’y a jamais eu autant de Juifs tués en un seul jour », a déclaré le président israélien, Isaac Herzog, dans une vidéo Profitant de l’effet de surprise, des combattants du Hamas à bord de véhicules, de bateaux et même de parapentes motorisés se sont joués de l’imposante barrière de sécurité érigée par Israël autour de Gaza, attaquant des positions militaires ou des civils en pleine rue.\nLe Hamas a aussi procédé à prendre des otages parmi les soldats et même les civils trouvés sur son passage et à les ramener dans la bande de Gaza, un territoire qu’il contrôle depuis 2007 Trois jours après le début d’une offensive sanglante du Hamas en territoire israélien, le monde assiste, horrifié, à une escalade des hostilités Il s’est dit « bouleversé par l’annonce du « siège total » imposé par Israël à la bande de Gaza, tout comme l’organisation Human Rights Watch, qui a qualifié la décision d’« odieuse » : « Priver la population d’un territoire occupé de nourriture et d’électricité est un châtiment collectif, ce qui constitue un crime de guerre'</li></ul> |
188
+
189
+ ## Evaluation
190
+
191
+ ### Metrics
192
+ | Label | 0 | 1 | 2 | Accuracy | Macro Avg | Weighted Avg |
193
+ |:--------|:----------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------|:---------|:-----------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------|
194
+ | **all** | {'precision': 0.9102564102564102, 'recall': 0.8402366863905325, 'f1-score': 0.8738461538461538, 'support': 169} | {'precision': 0.9342465753424658, 'recall': 0.9551820728291317, 'f1-score': 0.9445983379501386, 'support': 714} | {'precision': 0.8734177215189873, 'recall': 0.8625, 'f1-score': 0.8679245283018868, 'support': 240} | 0.9181 | {'precision': 0.9059735690392877, 'recall': 0.8859729197398881, 'f1-score': 0.8954563400327263, 'support': 1123} | {'precision': 0.9176363680252991, 'recall': 0.9180765805877115, 'f1-score': 0.9175646483426998, 'support': 1123} |
195
+
196
+ ## Uses
197
+
198
+ ### Direct Use for Inference
199
+
200
+ First install the SetFit library:
201
+
202
+ ```bash
203
+ pip install setfit
204
+ ```
205
+
206
+ Then you can load this model and run inference.
207
+
208
+ ```python
209
+ from setfit import SetFitModel
210
+
211
+ # Download from the 🤗 Hub
212
+ model = SetFitModel.from_pretrained("mogaio/pr_ebsa_fr_merged25_offsets_10")
213
+ # Run inference
214
+ preds = model("Une vidéo qui a fait réagir
215
+ Cristiano Ronaldo sur le réseau social. Le quintuple ballon d’or portugais, éternel rival de Messi, s’est fendu d’un commentaire avec quatre émojis «mort de rire», comme pour dénigrer les propose du journaliste Le quintuple ballon d’or a réagi à la vidéo d’un journaliste espagnol félicitant
216
+ Lionel Messi")
217
+ ```
218
+
219
+ <!--
220
+ ### Downstream Use
221
+
222
+ *List how someone could finetune this model on their own dataset.*
223
+ -->
224
+
225
+ <!--
226
+ ### Out-of-Scope Use
227
+
228
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
229
+ -->
230
+
231
+ <!--
232
+ ## Bias, Risks and Limitations
233
+
234
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
235
+ -->
236
+
237
+ <!--
238
+ ### Recommendations
239
+
240
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
241
+ -->
242
+
243
+ ## Training Details
244
+
245
+ ### Training Set Metrics
246
+ | Training set | Min | Median | Max |
247
+ |:-------------|:----|:---------|:-----|
248
+ | Word count | 10 | 235.6465 | 1295 |
249
+
250
+ | Label | Training Sample Count |
251
+ |:------|:----------------------|
252
+ | neg | 169 |
253
+ | obj | 714 |
254
+ | pos | 240 |
255
+
256
+ ### Training Hyperparameters
257
+ - batch_size: (8, 8)
258
+ - num_epochs: (10, 10)
259
+ - max_steps: -1
260
+ - sampling_strategy: oversampling
261
+ - num_iterations: 1
262
+ - body_learning_rate: (2e-05, 1e-05)
263
+ - head_learning_rate: 0.01
264
+ - loss: CosineSimilarityLoss
265
+ - distance_metric: cosine_distance
266
+ - margin: 0.25
267
+ - end_to_end: False
268
+ - use_amp: False
269
+ - warmup_proportion: 0.1
270
+ - seed: 42
271
+ - eval_max_steps: -1
272
+ - load_best_model_at_end: True
273
+
274
+ ### Training Results
275
+ | Epoch | Step | Training Loss | Validation Loss |
276
+ |:-------:|:--------:|:-------------:|:---------------:|
277
+ | 0.0036 | 1 | 0.2912 | - |
278
+ | 0.1779 | 50 | 0.219 | - |
279
+ | 0.3559 | 100 | 0.264 | - |
280
+ | 0.5338 | 150 | 0.2899 | - |
281
+ | 0.7117 | 200 | 0.2574 | - |
282
+ | 0.8897 | 250 | 0.1979 | - |
283
+ | 1.0 | 281 | - | 0.1788 |
284
+ | 1.0676 | 300 | 0.2144 | - |
285
+ | 1.2456 | 350 | 0.2309 | - |
286
+ | 1.4235 | 400 | 0.1943 | - |
287
+ | 1.6014 | 450 | 0.1899 | - |
288
+ | 1.7794 | 500 | 0.1955 | - |
289
+ | 1.9573 | 550 | 0.1374 | - |
290
+ | 2.0 | 562 | - | 0.1413 |
291
+ | 2.1352 | 600 | 0.2828 | - |
292
+ | 2.3132 | 650 | 0.2386 | - |
293
+ | 2.4911 | 700 | 0.1212 | - |
294
+ | 2.6690 | 750 | 0.1412 | - |
295
+ | 2.8470 | 800 | 0.1418 | - |
296
+ | 3.0 | 843 | - | 0.0909 |
297
+ | 3.0249 | 850 | 0.1157 | - |
298
+ | 3.2028 | 900 | 0.1346 | - |
299
+ | 3.3808 | 950 | 0.0552 | - |
300
+ | 3.5587 | 1000 | 0.2629 | - |
301
+ | 3.7367 | 1050 | 0.3486 | - |
302
+ | 3.9146 | 1100 | 0.1163 | - |
303
+ | 4.0 | 1124 | - | 0.0798 |
304
+ | 4.0925 | 1150 | 0.0796 | - |
305
+ | 4.2705 | 1200 | 0.0797 | - |
306
+ | 4.4484 | 1250 | 0.0628 | - |
307
+ | 4.6263 | 1300 | 0.0762 | - |
308
+ | 4.8043 | 1350 | 0.1248 | - |
309
+ | 4.9822 | 1400 | 0.1472 | - |
310
+ | 5.0 | 1405 | - | 0.0728 |
311
+ | 5.1601 | 1450 | 0.0439 | - |
312
+ | 5.3381 | 1500 | 0.0818 | - |
313
+ | 5.5160 | 1550 | 0.0327 | - |
314
+ | 5.6940 | 1600 | 0.1214 | - |
315
+ | 5.8719 | 1650 | 0.022 | - |
316
+ | 6.0 | 1686 | - | 0.0598 |
317
+ | 6.0498 | 1700 | 0.0012 | - |
318
+ | 6.2278 | 1750 | 0.2772 | - |
319
+ | 6.4057 | 1800 | 0.0996 | - |
320
+ | 6.5836 | 1850 | 0.2456 | - |
321
+ | 6.7616 | 1900 | 0.1857 | - |
322
+ | 6.9395 | 1950 | 0.0844 | - |
323
+ | 7.0 | 1967 | - | 0.0688 |
324
+ | 7.1174 | 2000 | 0.0874 | - |
325
+ | 7.2954 | 2050 | 0.0244 | - |
326
+ | 7.4733 | 2100 | 0.0635 | - |
327
+ | 7.6512 | 2150 | 0.1615 | - |
328
+ | 7.8292 | 2200 | 0.1485 | - |
329
+ | **8.0** | **2248** | **-** | **0.0594** |
330
+ | 8.0071 | 2250 | 0.2025 | - |
331
+ | 8.1851 | 2300 | 0.2224 | - |
332
+ | 8.3630 | 2350 | 0.002 | - |
333
+ | 8.5409 | 2400 | 0.0491 | - |
334
+ | 8.7189 | 2450 | 0.0452 | - |
335
+ | 8.8968 | 2500 | 0.021 | - |
336
+ | 9.0 | 2529 | - | 0.0683 |
337
+ | 9.0747 | 2550 | 0.2686 | - |
338
+ | 9.2527 | 2600 | 0.0399 | - |
339
+ | 9.4306 | 2650 | 0.0117 | - |
340
+ | 9.6085 | 2700 | 0.2297 | - |
341
+ | 9.7865 | 2750 | 0.0075 | - |
342
+ | 9.9644 | 2800 | 0.0166 | - |
343
+ | 10.0 | 2810 | - | 0.0649 |
344
+
345
+ * The bold row denotes the saved checkpoint.
346
+ ### Framework Versions
347
+ - Python: 3.10.12
348
+ - SetFit: 1.0.1
349
+ - Sentence Transformers: 2.2.2
350
+ - Transformers: 4.35.2
351
+ - PyTorch: 2.1.0+cu121
352
+ - Datasets: 2.16.1
353
+ - Tokenizers: 0.15.0
354
+
355
+ ## Citation
356
+
357
+ ### BibTeX
358
+ ```bibtex
359
+ @article{https://doi.org/10.48550/arxiv.2209.11055,
360
+ doi = {10.48550/ARXIV.2209.11055},
361
+ url = {https://arxiv.org/abs/2209.11055},
362
+ author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
363
+ keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
364
+ title = {Efficient Few-Shot Learning Without Prompts},
365
+ publisher = {arXiv},
366
+ year = {2022},
367
+ copyright = {Creative Commons Attribution 4.0 International}
368
+ }
369
+ ```
370
+
371
+ <!--
372
+ ## Glossary
373
+
374
+ *Clearly define terms in order to be accessible across audiences.*
375
+ -->
376
+
377
+ <!--
378
+ ## Model Card Authors
379
+
380
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
381
+ -->
382
+
383
+ <!--
384
+ ## Model Card Contact
385
+
386
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
387
+ -->
config.json ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "checkpoints/step_2248/",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "gradient_checkpointing": false,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.1,
13
+ "hidden_size": 768,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 3072,
16
+ "layer_norm_eps": 1e-05,
17
+ "max_position_embeddings": 514,
18
+ "model_type": "xlm-roberta",
19
+ "num_attention_heads": 12,
20
+ "num_hidden_layers": 12,
21
+ "output_past": true,
22
+ "pad_token_id": 1,
23
+ "position_embedding_type": "absolute",
24
+ "torch_dtype": "float32",
25
+ "transformers_version": "4.35.2",
26
+ "type_vocab_size": 1,
27
+ "use_cache": true,
28
+ "vocab_size": 250002
29
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "2.0.0",
4
+ "transformers": "4.7.0",
5
+ "pytorch": "1.9.0+cu102"
6
+ }
7
+ }
config_setfit.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "normalize_embeddings": false,
3
+ "labels": null
4
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c3e1d0a902babf5b530d573909611fd31b6b32a99397a80202ac592719b089c9
3
+ size 1112197096
model_head.pkl ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6e22089270cd9d69afa0aa6c6987dcc3890b7fe3a37aad0c754ea61e4053085b
3
+ size 19311
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 128,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fa685fc160bbdbab64058d4fc91b60e62d207e8dc60b9af5c002c5ab946ded00
3
+ size 17083009
tokenizer_config.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "max_length": 128,
50
+ "model_max_length": 512,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "<pad>",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "</s>",
56
+ "stride": 0,
57
+ "tokenizer_class": "XLMRobertaTokenizer",
58
+ "truncation_side": "right",
59
+ "truncation_strategy": "longest_first",
60
+ "unk_token": "<unk>"
61
+ }