togethercomputer
/

GPT-JT-6B-v1

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Adding Evaluation Results

#27

by leaderboard-pr-bot - opened Nov 17, 2023

base: refs/heads/main

←

from: refs/pr/27

Discussion Files changed

Files changed (1) hide show

README.md +14 -1

README.md CHANGED Viewed

@@ -155,4 +155,17 @@ We used [the Together Research Computer](https://together.xyz/) to conduct train
 [1]: Tay, Yi, Mostafa Dehghani, Vinh Q. Tran, Xavier Garcia, Dara Bahri, Tal Schuster, Huaixiu Steven Zheng, Neil Houlsby, and Donald Metzler. "Unifying Language Learning Paradigms." arXiv preprint arXiv:2205.05131 (2022).
-[2]: Tay, Yi, Jason Wei, Hyung Won Chung, Vinh Q. Tran, David R. So, Siamak Shakeri, Xavier Garcia et al. "Transcending scaling laws with 0.1% extra compute." arXiv preprint arXiv:2210.11399 (2022).

 [1]: Tay, Yi, Mostafa Dehghani, Vinh Q. Tran, Xavier Garcia, Dara Bahri, Tal Schuster, Huaixiu Steven Zheng, Neil Houlsby, and Donald Metzler. "Unifying Language Learning Paradigms." arXiv preprint arXiv:2205.05131 (2022).
+[2]: Tay, Yi, Jason Wei, Hyung Won Chung, Vinh Q. Tran, David R. So, Siamak Shakeri, Xavier Garcia et al. "Transcending scaling laws with 0.1% extra compute." arXiv preprint arXiv:2210.11399 (2022).
+# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
+Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_togethercomputer__GPT-JT-6B-v1)
+| Metric                | Value                     |
+|-----------------------|---------------------------|
+| Avg.                  | 37.6   |
+| ARC (25-shot)         | 40.87          |
+| HellaSwag (10-shot)   | 67.15    |
+| MMLU (5-shot)         | 47.19         |
+| TruthfulQA (0-shot)   | 37.07   |
+| Winogrande (5-shot)   | 65.27   |
+| GSM8K (5-shot)        | 1.21        |
+| DROP (3-shot)         | 4.42         |