leaderboard

Running on CPU Upgrade

App Files Files Community

nan commited on Jun 5

Commit

1ac2307

•

1 Parent(s): dccb8fe

refactor: refactoring the dashboard codes

Browse files

Files changed (3) hide show

app.py +30 -136
src/display/gradio_formatting.py +92 -0
src/display/utils.py +1 -1

app.py CHANGED Viewed

@@ -15,13 +15,13 @@ from src.display.utils import COL_NAME_IS_ANONYMOUS, COL_NAME_REVISION, COL_NAME
 from src.envs import API, EVAL_RESULTS_PATH, REPO_ID, RESULTS_REPO, TOKEN
 from src.read_evals import get_raw_eval_results, get_leaderboard_df
 from src.utils import update_table, update_metric, update_table_long_doc, upload_file, get_default_cols, submit_results, clear_reranking_selections
 def restart_space():
     API.restart_space(repo_id=REPO_ID)
 try:
     snapshot_download(
         repo_id=RESULTS_REPO, local_dir=EVAL_RESULTS_PATH, repo_type="dataset", tqdm_class=None, etag_timeout=30,
@@ -54,6 +54,9 @@ shown_columns_long_doc, types_long_doc = get_default_cols(
 leaderboard_df_long_doc = leaderboard_df_long_doc[~leaderboard_df_long_doc[COL_NAME_IS_ANONYMOUS]][shown_columns_long_doc]
 leaderboard_df_long_doc.drop([COL_NAME_REVISION, COL_NAME_TIMESTAMP], axis=1, inplace=True)
 def update_metric_qa(
         metric: str,
@@ -90,90 +93,33 @@ with demo:
                 with gr.Column():
                     # search retrieval models
                     with gr.Row():
-                        selected_version = gr.Dropdown(
-                            choices=["AIR-Bench_24.04",],
-                            value="AIR-Bench_24.04",
-                            label="Select the version of AIR-Bench",
-                            interactive = True
-                        )
                     with gr.Row():
-                        search_bar = gr.Textbox(
-                            placeholder=" 🔍 Search for retrieval methods (separate multiple queries with `;`) and press ENTER...",
-                            show_label=False,
-                            elem_id="search-bar",
-                            info="Search the retrieval methods"
-                        )
-                    # select reranking model
-                    reranking_models = sorted(list(frozenset([eval_result.reranking_model for eval_result in raw_data])))
                     with gr.Row():
-                        selected_rerankings = gr.Dropdown(
-                            choices=reranking_models,
-                            # value=reranking_models,
-                            label="Select the reranking models",
-                            elem_id="reranking-select",
-                            interactive=True,
-                            multiselect=True
-                        )
                     with gr.Row():
-                        select_noreranker_only_btn = gr.Button(
-                            value="Only show results without ranking models",
-                        )
                 with gr.Column(min_width=320):
                     # select the metric
-                    selected_metric = gr.Dropdown(
-                        choices=METRIC_LIST,
-                        value=DEFAULT_METRIC,
-                        label="Select the metric",
-                        interactive=True,
-                        elem_id="metric-select",
-                    )
                     # select domain
                     with gr.Row():
-                        selected_domains = gr.CheckboxGroup(
-                            choices=DOMAIN_COLS_QA,
-                            value=DOMAIN_COLS_QA,
-                            label="Select the domains",
-                            elem_id="domain-column-select",
-                            interactive=True,
-                        )
                     # select language
                     with gr.Row():
-                        selected_langs = gr.Dropdown(
-                            choices=LANG_COLS_QA,
-                            value=LANG_COLS_QA,
-                            label="Select the languages",
-                            elem_id="language-column-select",
-                            multiselect=True,
-                            interactive=True
-                        )
                     with gr.Row():
-                        show_anonymous = gr.Checkbox(
-                            label="Show anonymous submissions",
-                            value=False,
-                            info="The anonymous submissions might have invalid model information."
-                        )
                     with gr.Row():
-                        show_revision_and_timestamp = gr.Checkbox(
-                            label="Show submission details",
-                            value=False,
-                            info="Show the revision and timestamp information of submissions"
-                        )
-            leaderboard_table = gr.components.Dataframe(
-                value=leaderboard_df_qa,
-                datatype=types_qa,
-                elem_id="leaderboard-table",
-                interactive=False,
-                visible=True,
-            )
             # Dummy leaderboard for handling the case when the user uses backspace key
-            hidden_leaderboard_table_for_search = gr.components.Dataframe(
-                value=original_df_qa,
-                datatype=types_qa,
-                visible=False,
-            )
             # Set search_bar listener
             search_bar.submit(
@@ -232,90 +178,38 @@ with demo:
             with gr.Row():
                 with gr.Column():
                     with gr.Row():
-                        selected_version = gr.Dropdown(
-                            choices=["AIR-Bench_24.04",],
-                            value="AIR-Bench_24.04",
-                            label="Select the version of AIR-Bench",
-                            interactive=True
-                        )
                     with gr.Row():
-                        search_bar = gr.Textbox(
-                            info="Search the retrieval methods",
-                            placeholder=" 🔍 Search for retrieval methods (separate multiple queries with `;`)"
-                                        " and press ENTER...",
-                            show_label=False,
-                            elem_id="search-bar-long-doc",
-                        )
                     # select reranking model
-                    reranking_models = list(frozenset([eval_result.reranking_model for eval_result in raw_data]))
                     with gr.Row():
-                        selected_rerankings = gr.Dropdown(
-                            choices=reranking_models,
-                            # value=reranking_models,
-                            label="Select the reranking models",
-                            elem_id="reranking-select-long-doc",
-                            interactive=True,
-                            multiselect=True,
-                        )
                     with gr.Row():
-                        select_noreranker_only_btn = gr.Button(
-                            value="Only show results without ranking models",
-                        )
                 with gr.Column(min_width=320):
                     # select the metric
                     with gr.Row():
-                        selected_metric = gr.Dropdown(
-                            choices=METRIC_LIST,
-                            value=DEFAULT_METRIC,
-                            label="Select the metric",
-                            interactive=True,
-                            elem_id="metric-select-long-doc",
-                        )
                     # select domain
                     with gr.Row():
-                        selected_domains = gr.CheckboxGroup(
-                            choices=DOMAIN_COLS_LONG_DOC,
-                            value=DOMAIN_COLS_LONG_DOC,
-                            label="Select the domains",
-                            elem_id="domain-column-select-long-doc",
-                            interactive=True,
-                        )
                     # select language
                     with gr.Row():
-                        selected_langs = gr.Dropdown(
-                            choices=LANG_COLS_LONG_DOC,
-                            value=LANG_COLS_LONG_DOC,
-                            label="Select the languages",
-                            elem_id="language-column-select-long-doc",
-                            multiselect=True,
-                            interactive=True
                         )
                     with gr.Row():
-                        show_anonymous = gr.Checkbox(
-                            label="Show anonymous submissions",
-                            value=False,
-                            info="The anonymous submissions might have invalid model information."
-                        )
                     with gr.Row():
-                        show_revision_and_timestamp = gr.Checkbox(
-                            label="Show submission details",
-                            value=False,
-                            info="Show the revision and timestamp information of submissions"
-                        )
-            leaderboard_table_long_doc = gr.components.Dataframe(
-                value=leaderboard_df_long_doc,
-                datatype=types_long_doc,
-                elem_id="leaderboard-table-long-doc",
-                interactive=False,
-                visible=True,
             )
             # Dummy leaderboard for handling the case when the user uses backspace key
-            hidden_leaderboard_table_for_search = gr.components.Dataframe(
-                value=original_df_long_doc,
-                datatype=types_long_doc,
-                visible=False,
             )
             # Set search_bar listener

 from src.envs import API, EVAL_RESULTS_PATH, REPO_ID, RESULTS_REPO, TOKEN
 from src.read_evals import get_raw_eval_results, get_leaderboard_df
 from src.utils import update_table, update_metric, update_table_long_doc, upload_file, get_default_cols, submit_results, clear_reranking_selections
+from src.display.gradio_formatting import get_version_dropdown, get_search_bar, get_reranking_dropdown, get_noreranker_button, get_metric_dropdown, get_domain_dropdown, get_language_dropdown, get_anonymous_checkbox, get_revision_and_ts_checkbox, get_leaderboard_table
 def restart_space():
     API.restart_space(repo_id=REPO_ID)
 try:
     snapshot_download(
         repo_id=RESULTS_REPO, local_dir=EVAL_RESULTS_PATH, repo_type="dataset", tqdm_class=None, etag_timeout=30,
 leaderboard_df_long_doc = leaderboard_df_long_doc[~leaderboard_df_long_doc[COL_NAME_IS_ANONYMOUS]][shown_columns_long_doc]
 leaderboard_df_long_doc.drop([COL_NAME_REVISION, COL_NAME_TIMESTAMP], axis=1, inplace=True)
+# select reranking model
+reranking_models = sorted(list(frozenset([eval_result.reranking_model for eval_result in raw_data])))
 def update_metric_qa(
         metric: str,
                 with gr.Column():
                     # search retrieval models
                     with gr.Row():
+                        selected_version = get_version_dropdown()
                     with gr.Row():
+                        search_bar = get_search_bar()
                     with gr.Row():
+                        selected_rerankings = get_reranking_dropdown(reranking_models)
                     with gr.Row():
+                        select_noreranker_only_btn = get_noreranker_button()
                 with gr.Column(min_width=320):
                     # select the metric
+                    selected_metric = get_metric_dropdown(METRIC_LIST, DEFAULT_METRIC)
                     # select domain
                     with gr.Row():
+                        selected_domains = get_domain_dropdown(DOMAIN_COLS_QA, DOMAIN_COLS_QA)
                     # select language
                     with gr.Row():
+                        selected_langs = get_language_dropdown(LANG_COLS_QA, LANG_COLS_QA)
                     with gr.Row():
+                        show_anonymous = get_anonymous_checkbox()
                     with gr.Row():
+                        show_revision_and_timestamp = get_revision_and_ts_checkbox()
+            leaderboard_table = get_leaderboard_table(leaderboard_df_qa, types_qa)
             # Dummy leaderboard for handling the case when the user uses backspace key
+            hidden_leaderboard_table_for_search = get_leaderboard_table(original_df_qa, types_qa, visible=False)
             # Set search_bar listener
             search_bar.submit(
             with gr.Row():
                 with gr.Column():
                     with gr.Row():
+                        selected_version = get_version_dropdown()
                     with gr.Row():
+                        search_bar = get_search_bar()
                     # select reranking model
                     with gr.Row():
+                        selected_rerankings = get_reranking_dropdown(reranking_models)
                     with gr.Row():
+                        select_noreranker_only_btn = get_noreranker_button()
                 with gr.Column(min_width=320):
                     # select the metric
                     with gr.Row():
+                        selected_metric = get_metric_dropdown(METRIC_LIST, DEFAULT_METRIC)
                     # select domain
                     with gr.Row():
+                        selected_domains = get_domain_dropdown(DOMAIN_COLS_LONG_DOC, DOMAIN_COLS_LONG_DOC)
                     # select language
                     with gr.Row():
+                        selected_langs = get_language_dropdown(
+                            LANG_COLS_LONG_DOC, LANG_COLS_LONG_DOC
                         )
                     with gr.Row():
+                        show_anonymous = get_anonymous_checkbox()
                     with gr.Row():
+                        show_revision_and_timestamp = get_revision_and_ts_checkbox()
+            leaderboard_table_long_doc = get_leaderboard_table(
+                leaderboard_df_long_doc, types_long_doc
             )
             # Dummy leaderboard for handling the case when the user uses backspace key
+            hidden_leaderboard_table_for_search =get_leaderboard_table(
+                original_df_long_doc, types_long_doc, visible=False
             )
             # Set search_bar listener

src/display/gradio_formatting.py ADDED Viewed

	@@ -0,0 +1,92 @@

+import gradio as gr
+def get_version_dropdown():
+    return gr.Dropdown(
+        choices=["AIR-Bench_24.04", ],
+        value="AIR-Bench_24.04",
+        label="Select the version of AIR-Bench",
+        interactive=True
+    )
+def get_search_bar():
+    return gr.Textbox(
+        placeholder=" 🔍 Search for retrieval methods (separate multiple queries with `;`) and press ENTER...",
+        show_label=False,
+        # elem_id="search-bar",
+        info="Search the retrieval methods"
+    )
+def get_reranking_dropdown(model_list):
+    return gr.Dropdown(
+        choices=model_list,
+        label="Select the reranking models",
+        # elem_id="reranking-select",
+        interactive=True,
+        multiselect=True
+    )
+def get_noreranker_button():
+    return gr.Button(
+        value="Only show results without ranking models",
+    )
+def get_metric_dropdown(metric_list, default_metrics):
+    return gr.Dropdown(
+        choices=metric_list,
+        value=default_metrics,
+        label="Select the metric",
+        interactive=True,
+        # elem_id="metric-select-long-doc",
+    )
+def get_domain_dropdown(domain_list, default_domains):
+    return gr.CheckboxGroup(
+        choices=domain_list,
+        value=default_domains,
+        label="Select the domains",
+        # elem_id="domain-column-select",
+        interactive=True,
+    )
+def get_language_dropdown(language_list, default_languages):
+    return gr.Dropdown(
+        choices=language_list,
+        value=language_list,
+        label="Select the languages",
+        # elem_id="language-column-select",
+        multiselect=True,
+        interactive=True
+    )
+def get_anonymous_checkbox():
+    return gr.Checkbox(
+        label="Show anonymous submissions",
+        value=False,
+        info="The anonymous submissions might have invalid model information."
+    )
+def get_revision_and_ts_checkbox():
+    return gr.Checkbox(
+        label="Show submission details",
+        value=False,
+        info="Show the revision and timestamp information of submissions"
+    )
+def get_leaderboard_table(df, datatype, visible=True):
+    return gr.components.Dataframe(
+                value=df,
+                datatype=datatype,
+                elem_id="leaderboard-table",
+                interactive=False,
+                visible=visible,
+            )

src/display/utils.py CHANGED Viewed

@@ -90,4 +90,4 @@ COLS_LITE = [c.name for c in fields(AutoEvalColumnQA) if c.displayed_by_default
 QA_BENCHMARK_COLS = [t.value.col_name for t in BenchmarksQA]
-LONG_DOC_BENCHMARK_COLS = [t.value.col_name for t in BenchmarksLongDoc]


90
91	QA_BENCHMARK_COLS = [t.value.col_name for t in BenchmarksQA]
92
93	+ LONG_DOC_BENCHMARK_COLS = [t.value.col_name for t in BenchmarksLongDoc]