Adding Evaluation Results (#2)

- Adding Evaluation Results (b077c168ef208cd33e91ba161da868f59121c3f6)

Co-authored-by: Open LLM Leaderboard PR Bot <[email protected]>

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,9 +1,9 @@
 ---
-base_model: pints-ai/1.5-Pints-16K-v0.1
-library_name: peft
 license: mit
 tags:
 - generated_from_trainer
 model-index:
 - name: tangledgroup/tangled-llama-pints-1.5b-v0.2-instruct
   results: []
@@ -156,4 +156,17 @@ The following hyperparameters were used during training:
 - Transformers 4.45.0.dev0
 - Pytorch 2.4.1
 - Datasets 2.21.0
-- Tokenizers 0.19.1

 ---
 license: mit
+library_name: peft
 tags:
 - generated_from_trainer
+base_model: pints-ai/1.5-Pints-16K-v0.1
 model-index:
 - name: tangledgroup/tangled-llama-pints-1.5b-v0.2-instruct
   results: []
 - Transformers 4.45.0.dev0
 - Pytorch 2.4.1
 - Datasets 2.21.0
+- Tokenizers 0.19.1
+# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard)
+Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_tangledgroup__tangled-llama-pints-1.5b-v0.2-instruct)
+|      Metric       |Value|
+|-------------------|----:|
+|Avg.               | 4.66|
+|IFEval (0-Shot)    |17.24|
+|BBH (3-Shot)       | 4.08|
+|MATH Lvl 5 (4-Shot)| 0.76|
+|GPQA (0-shot)      | 0.00|
+|MuSR (0-shot)      | 4.57|
+|MMLU-PRO (5-shot)  | 1.30|