Fine-tuning on Intel Gaudi2

This model is a fine-tuned model based on mistralai/Mistral-7B-v0.1 on the open source dataset Open-Orca/SlimOrca. Then we align it with DPO algorithm. For more details, you can refer our blog: The Practice of Supervised Fine-tuning and Direct Preference Optimization on Intel Gaudi2.

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Safetensors

Model size

10.7B params

Tensor type

FP16

normalized accuracy on AI2 Reasoning Challenge (25-Shot)
test set Open LLM Leaderboard

66.640
normalized accuracy on HellaSwag (10-Shot)
validation set Open LLM Leaderboard

82.120
accuracy on MMLU (5-Shot)
test set Open LLM Leaderboard

62.370
mc2 on TruthfulQA (0-shot)
validation set Open LLM Leaderboard

60.220
accuracy on Winogrande (5-shot)
validation set Open LLM Leaderboard

79.640
accuracy on GSM8k (5-shot)
test set Open LLM Leaderboard

42.150