Spaces:

symanto
/

generation_evaluator

Sleeping

App Files Files Community

Ian Borrego Obrador commited on Sep 17

Commit

faf189f

•

1 Parent(s): 1b5f36c

generalization in eval_args

Browse files

Files changed (2) hide show

generation_evaluator.py +20 -10
requirements.txt +2 -1

generation_evaluator.py CHANGED Viewed

@@ -5,6 +5,7 @@ import numpy as np
 import spacy
 import torch
 from alignscore import AlignScore
 _CITATION = """\
 @inproceedings{lin-2004-rouge,
@@ -155,9 +156,7 @@ class GenerationEvaluator(evaluate.Metric):
         # Download AlignScore model and move to GPU if possible
         model_path = dl_manager.download(ALIGNSCORE_ARGS["ckpt_path"])
         ALIGNSCORE_ARGS["ckpt_path"] = model_path
-        ALIGNSCORE_ARGS["device"] = (
-            "cuda:0" if torch.cuda.is_available() else "cpu"
-        )
         self.align_scorer = AlignScore(**ALIGNSCORE_ARGS)
         # Prepare scorers
@@ -167,20 +166,33 @@ class GenerationEvaluator(evaluate.Metric):
         self.bert_scorer = evaluate.load("bertscore")
         self.chrf_scorer = evaluate.load("chrf")
-    def _compute(self, predictions, references, tokenizer=None):
         # Compute ROUGE
         rouge_results = self.rouge_scorer.compute(
-            predictions=predictions, references=references, tokenizer=tokenizer
         )
         # Compute BLEU
         if tokenizer is None:
             bleu_results = self.bleu_scorer.compute(
-                predictions=predictions, references=references
             )
         else:
             bleu_results = self.bleu_scorer.compute(
-                predictions=predictions, references=references, tokenizer=tokenizer
             )
         # Compute Exact Match
@@ -203,9 +215,7 @@ class GenerationEvaluator(evaluate.Metric):
         # Compute AlignScore
         align_score = round(
-            np.mean(
-                self.align_scorer.score(contexts=references, claims=predictions)
-            ),
             4,
         )

 import spacy
 import torch
 from alignscore import AlignScore
+from transformers import AutoTokenizer
 _CITATION = """\
 @inproceedings{lin-2004-rouge,
         # Download AlignScore model and move to GPU if possible
         model_path = dl_manager.download(ALIGNSCORE_ARGS["ckpt_path"])
         ALIGNSCORE_ARGS["ckpt_path"] = model_path
+        ALIGNSCORE_ARGS["device"] = "cuda:0" if torch.cuda.is_available() else "cpu"
         self.align_scorer = AlignScore(**ALIGNSCORE_ARGS)
         # Prepare scorers
         self.bert_scorer = evaluate.load("bertscore")
         self.chrf_scorer = evaluate.load("chrf")
+    def _compute(self, predictions, references, **eval_kwargs):
+        tokenizer_name = eval_kwargs.pop("tokenizer_name", None)
+        tokenizer = None
+        if tokenizer_name is not None:
+            tks = AutoTokenizer.from_pretrained(tokenizer_name)
+            tokenizer = tks.tokenize
         # Compute ROUGE
         rouge_results = self.rouge_scorer.compute(
+            predictions=predictions,
+            references=references,
+            tokenizer=tokenizer,
+            **eval_kwargs
         )
         # Compute BLEU
         if tokenizer is None:
             bleu_results = self.bleu_scorer.compute(
+                predictions=predictions, references=references, **eval_kwargs
             )
         else:
             bleu_results = self.bleu_scorer.compute(
+                predictions=predictions,
+                references=references,
+                tokenizer=tokenizer,
+                **eval_kwargs
             )
         # Compute Exact Match
         # Compute AlignScore
         align_score = round(
+            np.mean(self.align_scorer.score(contexts=references, claims=predictions)),
             4,
         )

requirements.txt CHANGED Viewed

@@ -7,4 +7,5 @@ rouge_score
 numpy
 sacrebleu
 git+https://github.com/yuh-zha/AlignScore.git
-spacy

 numpy
 sacrebleu
 git+https://github.com/yuh-zha/AlignScore.git
+spacy
+transformers