leaderboard

Running on CPU Upgrade

nan commited on Oct 14

Commit

e2d3123

•

1 Parent(s): 2508d96

refactor: move the column names to a seperated file

Files changed (6) hide show

app.py CHANGED Viewed

@@ -18,13 +18,8 @@ from src.benchmarks import (
     DEFAULT_METRIC_LONG_DOC
 )
 from src.display.css_html_js import custom_css
-from src.display.utils import (
-    COL_NAME_IS_ANONYMOUS,
-    COL_NAME_REVISION,
-    COL_NAME_TIMESTAMP,
-    COL_NAME_RERANKING_MODEL,
-    COL_NAME_RETRIEVAL_MODEL
-)
 from src.envs import (
     API,
     EVAL_RESULTS_PATH,

     DEFAULT_METRIC_LONG_DOC
 )
 from src.display.css_html_js import custom_css
+from src.display.column_names import COL_NAME_RETRIEVAL_MODEL, COL_NAME_RERANKING_MODEL, COL_NAME_REVISION, \
+    COL_NAME_TIMESTAMP, COL_NAME_IS_ANONYMOUS
 from src.envs import (
     API,
     EVAL_RESULTS_PATH,

src/display/column_names.py ADDED Viewed

+COL_NAME_AVG = "Average ⬆️"
+COL_NAME_RETRIEVAL_MODEL = "Retrieval Method"
+COL_NAME_RERANKING_MODEL = "Reranking Model"
+COL_NAME_RETRIEVAL_MODEL_LINK = "Retrieval Model LINK"
+COL_NAME_RERANKING_MODEL_LINK = "Reranking Model LINK"
+COL_NAME_RANK = "Rank 🏆"
+COL_NAME_REVISION = "Revision"
+COL_NAME_TIMESTAMP = "Submission Date"
+COL_NAME_IS_ANONYMOUS = "Anonymous Submission"

src/display/utils.py CHANGED Viewed

@@ -1,6 +1,9 @@
 from dataclasses import dataclass, make_dataclass
 from src.benchmarks import BenchmarksQA, BenchmarksLongDoc
 def fields(raw_class):
@@ -19,17 +22,6 @@ class ColumnContent:
     never_hidden: bool = False
-COL_NAME_AVG = "Average ⬆️"
-COL_NAME_RETRIEVAL_MODEL = "Retrieval Method"
-COL_NAME_RERANKING_MODEL = "Reranking Model"
-COL_NAME_RETRIEVAL_MODEL_LINK = "Retrieval Model LINK"
-COL_NAME_RERANKING_MODEL_LINK = "Reranking Model LINK"
-COL_NAME_RANK = "Rank 🏆"
-COL_NAME_REVISION = "Revision"
-COL_NAME_TIMESTAMP = "Submission Date"
-COL_NAME_IS_ANONYMOUS = "Anonymous Submission"
 def get_default_auto_eval_column_dict():
     auto_eval_column_dict = []
     # Init

 from dataclasses import dataclass, make_dataclass
 from src.benchmarks import BenchmarksQA, BenchmarksLongDoc
+from src.display.column_names import COL_NAME_AVG, COL_NAME_RETRIEVAL_MODEL, COL_NAME_RERANKING_MODEL, \
+    COL_NAME_RETRIEVAL_MODEL_LINK, COL_NAME_RERANKING_MODEL_LINK, COL_NAME_RANK, COL_NAME_REVISION, COL_NAME_TIMESTAMP, \
+    COL_NAME_IS_ANONYMOUS
 def fields(raw_class):
     never_hidden: bool = False
 def get_default_auto_eval_column_dict():
     auto_eval_column_dict = []
     # Init

src/read_evals.py CHANGED Viewed

@@ -8,20 +8,14 @@ import pandas as pd
 from src.benchmarks import get_safe_name
 from src.display.utils import (
-    COL_NAME_RERANKING_MODEL,
-    COL_NAME_RETRIEVAL_MODEL,
-    COL_NAME_RERANKING_MODEL_LINK,
-    COL_NAME_RETRIEVAL_MODEL_LINK,
-    COL_NAME_REVISION,
-    COL_NAME_TIMESTAMP,
-    COL_NAME_IS_ANONYMOUS,
     COLS_QA,
     QA_BENCHMARK_COLS,
     COLS_LONG_DOC,
-    LONG_DOC_BENCHMARK_COLS,
-    COL_NAME_AVG,
-    COL_NAME_RANK
 )
 from src.display.formatting import make_clickable_model

 from src.benchmarks import get_safe_name
 from src.display.utils import (
     COLS_QA,
     QA_BENCHMARK_COLS,
     COLS_LONG_DOC,
+    LONG_DOC_BENCHMARK_COLS
 )
+from src.display.column_names import COL_NAME_AVG, COL_NAME_RETRIEVAL_MODEL, COL_NAME_RERANKING_MODEL, \
+    COL_NAME_RETRIEVAL_MODEL_LINK, COL_NAME_RERANKING_MODEL_LINK, COL_NAME_RANK, COL_NAME_REVISION, COL_NAME_TIMESTAMP, \
+    COL_NAME_IS_ANONYMOUS
 from src.display.formatting import make_clickable_model

src/utils.py CHANGED Viewed

@@ -8,8 +8,9 @@ import pandas as pd
 from src.benchmarks import BENCHMARK_COLS_QA, BENCHMARK_COLS_LONG_DOC, BenchmarksQA, BenchmarksLongDoc
 from src.display.formatting import styled_message, styled_error
-from src.display.utils import COLS_QA, TYPES_QA, COLS_LONG_DOC, TYPES_LONG_DOC, COL_NAME_RANK, COL_NAME_AVG, \
-    COL_NAME_RERANKING_MODEL, COL_NAME_RETRIEVAL_MODEL, COL_NAME_IS_ANONYMOUS, COL_NAME_TIMESTAMP, COL_NAME_REVISION, get_default_auto_eval_column_dict
 from src.envs import API, SEARCH_RESULTS_REPO, LATEST_BENCHMARK_VERSION
 from src.read_evals import FullEvalResult, get_leaderboard_df, calculate_mean

 from src.benchmarks import BENCHMARK_COLS_QA, BENCHMARK_COLS_LONG_DOC, BenchmarksQA, BenchmarksLongDoc
 from src.display.formatting import styled_message, styled_error
+from src.display.utils import COLS_QA, TYPES_QA, COLS_LONG_DOC, TYPES_LONG_DOC, get_default_auto_eval_column_dict
+from src.display.column_names import COL_NAME_AVG, COL_NAME_RETRIEVAL_MODEL, COL_NAME_RERANKING_MODEL, COL_NAME_RANK, \
+    COL_NAME_REVISION, COL_NAME_TIMESTAMP, COL_NAME_IS_ANONYMOUS
 from src.envs import API, SEARCH_RESULTS_REPO, LATEST_BENCHMARK_VERSION
 from src.read_evals import FullEvalResult, get_leaderboard_df, calculate_mean

tests/test_utils.py CHANGED Viewed

@@ -2,7 +2,8 @@ import pandas as pd
 import pytest
 from src.utils import filter_models, search_table, filter_queries, select_columns, update_table_long_doc, get_iso_format_timestamp, get_default_cols, update_table
-from src.display.utils import COL_NAME_IS_ANONYMOUS, COL_NAME_REVISION, COL_NAME_TIMESTAMP, COL_NAME_RERANKING_MODEL, COL_NAME_RETRIEVAL_MODEL, COL_NAME_RANK, COL_NAME_AVG
 @pytest.fixture

 import pytest
 from src.utils import filter_models, search_table, filter_queries, select_columns, update_table_long_doc, get_iso_format_timestamp, get_default_cols, update_table
+from src.display.column_names import COL_NAME_AVG, COL_NAME_RETRIEVAL_MODEL, COL_NAME_RERANKING_MODEL, COL_NAME_RANK, \
+    COL_NAME_REVISION, COL_NAME_TIMESTAMP, COL_NAME_IS_ANONYMOUS
 @pytest.fixture