Add verifyToken field to verify evaluation results are produced by Hugging Face's automatic model evaluator

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋! We've added a new `verifyToken` field to your evaluation results to verify that they are produced by the model evaluator. Accept this PR to ensure that your results remain listed as **verified** on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards).

Files changed (1) hide show

README.md +15 -11

README.md CHANGED Viewed

@@ -1,12 +1,12 @@
 ---
-datasets:
-- squad_v2
 language: en
 license: mit
-pipeline_tag: question-answering
 tags:
 - deberta
 - deberta-v3
 model-index:
 - name: navteca/deberta-v3-base-squad2
   results:
@@ -19,14 +19,16 @@ model-index:
       config: squad_v2
       split: validation
     metrics:
-    - name: Exact Match
-      type: exact_match
       value: 83.8248
       verified: true
-    - name: F1
-      type: f1
       value: 87.41
       verified: true
   - task:
       type: question-answering
       name: Question Answering
@@ -36,14 +38,16 @@ model-index:
       config: plain_text
       split: validation
     metrics:
-    - name: Exact Match
-      type: exact_match
       value: 84.9678
       verified: true
-    - name: F1
-      type: f1
       value: 92.2777
       verified: true
 ---
 # Deberta v3 base model for QA (SQuAD 2.0)

 ---
 language: en
 license: mit
 tags:
 - deberta
 - deberta-v3
+datasets:
+- squad_v2
+pipeline_tag: question-answering
 model-index:
 - name: navteca/deberta-v3-base-squad2
   results:
       config: squad_v2
       split: validation
     metrics:
+    - type: exact_match
       value: 83.8248
+      name: Exact Match
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiYjFkNmYwODcyYjY3MjJjMzAwNjQzZjI2NjliYmQ4MGZiMDI2OWZkMTdhYmFmN2UyMzE2NDk4YTBjNTdjYTE2ZCIsInZlcnNpb24iOjF9.LgIENpA4WbqDCo_noI-6Dc2UmpufMqCLYAb7rZpEj33vqp4kqOkUGNaHC1iOgfPmyyeedk0NylgUEVmkS51lBQ
+    - type: f1
       value: 87.41
+      name: F1
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiY2E3NWYxMTc2NDUzOGM3ZWUyNDA0NDRhNGEyY2QyYmFmZmJlNGYwZmRhMjljZmE2OTIyNmFlMmQ1YWExNDQwNyIsInZlcnNpb24iOjF9.oRi3d751NQo6jQfSWB3xuw9e54-UhjeiNRyiIjE6WgeYd5T3-oRuphubLwnhv8xQPYQqSih8VOuEYj4Qbqj-AA
   - task:
       type: question-answering
       name: Question Answering
       config: plain_text
       split: validation
     metrics:
+    - type: exact_match
       value: 84.9678
+      name: Exact Match
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiZGZkZWUyZjJlZWMwOTZiMWU1NmNlN2RiNDI4MWY5YTI3Njc3Y2NjMmYzMDYxYjUwOWI3NTMyOGQ1YjM5MjNhYyIsInZlcnNpb24iOjF9.1Ti7oa5RXpETbOlpHtKpKZ2gz0spb4kzkBfOG1LQGbFMp5v3sRz4u_LhSXYiS2ksJ3sJNz7yIMK8Ci5xT05ODg
+    - type: f1
       value: 92.2777
+      name: F1
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiYWE0Mjc5OTE2NjExYzZiM2YyNjdjMjI5Nzk5MTkxZDcxNjMwMjU5MWNkOWNkOTRmMjk1OTczZGRiZGY2ZWRlYSIsInZlcnNpb24iOjF9.Gyhns0q1kBjiDgG7rE2X78lK4HATol9R2d53rWmdf6QamGb5qX2-d8tA48KTEP8WTCxvvvfOPV1es6qmMzN1BQ
 ---
 # Deberta v3 base model for QA (SQuAD 2.0)