Spaces:

ThaiLLM-Leaderboard
/

leaderboard

Running

kunato commited on 6 days ago

Commit

4eae489

•

1 Parent(s): 86468e9

add-new-thaiexam2-add-dash-to-no-score-model

Files changed (2) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -31,6 +31,7 @@ DATASET_TO_NAME_MAPPING = {
     "Knowledge III": "MT-Bench: Knowledge",
     'Social Science': 'MT-Bench: Social Science',
     'thaiexam_qa': "Thai Exam",
     'lr_sum_tha_seacrowd_t2t': '',
     'ntrex_128_eng-US_tha_seacrowd_t2t': '',
@@ -156,7 +157,6 @@ class EvalResult:
         for k in list(data_dict.keys()):
             if k not in [AutoEvalColumn.model.name, 'Average ⬆️']:
                 data_dict.move_to_end(k)
         return data_dict

     "Knowledge III": "MT-Bench: Knowledge",
     'Social Science': 'MT-Bench: Social Science',
     'thaiexam_qa': "Thai Exam",
+    "thaiexam2_qa": "Thai Exam2",
     'lr_sum_tha_seacrowd_t2t': '',
     'ntrex_128_eng-US_tha_seacrowd_t2t': '',
         for k in list(data_dict.keys()):
             if k not in [AutoEvalColumn.model.name, 'Average ⬆️']:
                 data_dict.move_to_end(k)
         return data_dict

src/populate.py CHANGED Viewed

@@ -13,6 +13,7 @@ def get_leaderboard_df(results_path: str) -> pd.DataFrame:
     all_data_json = [v.to_dict() for v in raw_data]
     df = pd.DataFrame.from_records(all_data_json)
     df = df.round(decimals=2)
     df = df.sort_values(by='Average ⬆️', ascending=False)
     return raw_data, df

     all_data_json = [v.to_dict() for v in raw_data]
     df = pd.DataFrame.from_records(all_data_json)
+    df = df.fillna('-')
     df = df.round(decimals=2)
     df = df.sort_values(by='Average ⬆️', ascending=False)
     return raw_data, df