Spaces:

ml6team
/

keyphrase-extraction

Running

keyphrase-extraction / pipelines /keyphrase_extraction_pipeline.py

Thomas De Decker

Add max input length

f2f4fc6 over 2 years ago

No virus

787 Bytes

	import numpy as np
	from transformers import (
	AutoModelForTokenClassification,
	AutoTokenizer,
	TokenClassificationPipeline,
	)
	from transformers.pipelines import AggregationStrategy


	class KeyphraseExtractionPipeline(TokenClassificationPipeline):
	def __init__(self, model, args, *kwargs):
	super().__init__(
	model=AutoModelForTokenClassification.from_pretrained(model),
	tokenizer=AutoTokenizer.from_pretrained(model),
	*args,
	**kwargs
	)

	def postprocess(self, model_outputs):
	results = super().postprocess(
	model_outputs=model_outputs,
	aggregation_strategy=AggregationStrategy.SIMPLE,
	)
	return np.unique([result.get("word").strip() for result in results])