Files changed (1) hide show
  1. app.py +5 -5
app.py CHANGED
@@ -2,7 +2,7 @@ import gradio as gr
2
  import pandas as pd
3
 
4
  csv_filename = 'leaderboard.csv'
5
- # url = 'https://docs.google.com/spreadsheets/d/1Oh3nrbdWjKuh9twJsc9yJLppiJeD_BZyKgCTOxRkALM/export?format=csv'
6
 
7
  def get_data_classifica():
8
  dataset = pd.read_csv("leaderboard_general.csv", sep=',')
@@ -10,7 +10,7 @@ def get_data_classifica():
10
  dataset.rename(columns={'model ': 'model'}, inplace=True)
11
  df_classifica = dataset[['model', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
12
  df_classifica['media'] = df_classifica[['helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']].mean(axis=1)
13
- df_classifica['media'] = df_classifica['media'].round(2)
14
  df_classifica = df_classifica.sort_values(by='media', ascending=False)
15
  df_classifica = df_classifica[['model', 'media', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
16
 
@@ -27,7 +27,7 @@ with gr.Blocks() as demo:
27
  with gr.Tab('Classifica Generale'):
28
 
29
  gr.Markdown('''# Classifica generale degli LLM italiani''')
30
- discord_link = 'https://discord.gg/m7sS3mduY2'
31
  gr.Markdown('''
32
  I modelli sottostanti sono stati testati con [lm_evaluation_harness](https://github.com/EleutherAI/lm-evaluation-harness) su task specifici per l'italiano introdotti con questa [PR](https://github.com/EleutherAI/lm-evaluation-harness/pull/1358).
33
  L'intero progetto, i modelli e i dataset sono rigorosamente open source e tutti i risultati sono riproducibili lanciando dei comandi come questo:
@@ -68,9 +68,9 @@ with gr.Blocks() as demo:
68
 
69
  form_link = "https://forms.gle/Gc9Dfu52xSBhQPpAA"
70
  gr.Markdown('''# Community discord
71
- Se vuoi contribuire al progetto o semplicemente unirti alla community di LLM italiani unisciti al nostro [discord!](https://discord.gg/m7sS3mduY2)
72
  # Aggiungi il tuo modello
73
- Se hai sviluppato un tuo modello che vuoi far valutare, compila il form [qui](https://forms.gle/Gc9Dfu52xSBhQPpAA) è tutto gratuito!
74
  ''')
75
 
76
  with gr.Tab('Sponsor'):
 
2
  import pandas as pd
3
 
4
  csv_filename = 'leaderboard.csv'
5
+ url = 'https://docs.google.com/spreadsheets/d/1Oh3nrbdWjKuh9twJsc9yJLppiJeD_BZyKgCTOxRkALM/export?format=csv'
6
 
7
  def get_data_classifica():
8
  dataset = pd.read_csv("leaderboard_general.csv", sep=',')
 
10
  dataset.rename(columns={'model ': 'model'}, inplace=True)
11
  df_classifica = dataset[['model', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
12
  df_classifica['media'] = df_classifica[['helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']].mean(axis=1)
13
+ df_classifica['media'] = df_classifica['media'].round(4)
14
  df_classifica = df_classifica.sort_values(by='media', ascending=False)
15
  df_classifica = df_classifica[['model', 'media', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
16
 
 
27
  with gr.Tab('Classifica Generale'):
28
 
29
  gr.Markdown('''# Classifica generale degli LLM italiani''')
30
+ discord_link = 'https://discord.com/invite/nfgaTG3H'
31
  gr.Markdown('''
32
  I modelli sottostanti sono stati testati con [lm_evaluation_harness](https://github.com/EleutherAI/lm-evaluation-harness) su task specifici per l'italiano introdotti con questa [PR](https://github.com/EleutherAI/lm-evaluation-harness/pull/1358).
33
  L'intero progetto, i modelli e i dataset sono rigorosamente open source e tutti i risultati sono riproducibili lanciando dei comandi come questo:
 
68
 
69
  form_link = "https://forms.gle/Gc9Dfu52xSBhQPpAA"
70
  gr.Markdown('''# Community discord
71
+ Se vuoi contribuire al progetto o semplicemente unirti alla community di LLM italiani unisciti al nostro [discord!](https://discord.com/invite/nfgaTG3H)
72
  # Aggiungi il tuo modello
73
+ Se hai sviluppato un tuo modello che vuoi far valutare, compila il form [qui]({form_link}) è tutto gratuito!
74
  ''')
75
 
76
  with gr.Tab('Sponsor'):