metadata

language: en
tags:
  - musr
  - question-answering
  - reasoning
metrics:
  - accuracy: 0.87
  - reasoning_quality: 1
  - source_integration: 0.975
datasets:
  - allenai/qasc
model-index:
  - name: Qwen-0.5B-MUSR
    results:
      - task:
          type: question-answering
          name: Multi-Source Reasoning (MUSR)
        dataset:
          name: QASC
          type: allenai/qasc
        metrics:
          - type: accuracy
            value: 0.87
            name: Accuracy

Qwen-0.5B-MUSR

Ce modèle est une version fine-tunée de Qwen-0.5B optimisée pour le benchmark MUSR, atteignant :

Une amélioration de 40.52% de l'eval_loss par rapport à la baseline
Une accuracy de 87% sur les questions multi-sources
Une qualité de raisonnement parfaite (100%)
Une utilisation quasi-parfaite des sources (97.5%)

Performances

Accuracy: 0.87
Reasoning Quality: 1.0
Source Integration: 0.975
Eval Loss: 1.036

Cas d'utilisation

Particulièrement efficace pour :

Questions nécessitant l'intégration de multiples sources
Raisonnement complexe
Réponses explicatives détaillées

Configuration optimale :

max_length: 170
weight_decay: 0.1
warmup_ratio: 0.07
gradient_accumulation: 4
scheduler: polynomial