TwT-6
/

api-demo

Model card Files Files and versions Community

api-demo / opencompass-my-api /opencompass /datasets /lawbench /evaluation_functions /ydlj.py

TwT-6's picture

Upload 2667 files

256a159 verified 8 months ago

history blame contribute delete

531 Bytes

	from ..utils.comprehension_scores import compute_rc_f1

	"""
	Task: machine reading comprehension
	Metric: F1 score
	法律阅读理解
	"""
	def compute_ydlj(data_dict):
	references, predictions = [], []
	for example in data_dict:
	question, prediction, answer = example["origin_prompt"], example["prediction"], example["refr"]
	answer = answer.replace("回答:", "")
	predictions.append(prediction)
	references.append(answer)

	f1_score = compute_rc_f1(predictions, references)
	return f1_score