usamakenway
/

Wizard-Vicuna-13B-Uncensored-AutoGPTQ

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Wizard-Vicuna-13B-Uncensored-AutoGPTQ / pipleline.py

usamakenway's picture

add custom pipeline

ecaa798 about 1 year ago

history blame contribute delete

1.13 kB

	from typing import Dict, List, Any
	from transformers import AutoTokenizer, TextGenerationPipeline, pipeline
	from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig


	class PreTrainedPipeline():
	def __init__(self, path=""):
	tokenizer = AutoTokenizer.from_pretrained(path)
	model = AutoGPTQForCausalLM.from_quantized(path, device="cuda:0", use_safetensors=True)


	def __call__(self, data: Any) -> List[List[Dict[str, float]]]:
	"""
	Args:
	data (:obj:):
	includes the input data and the parameters for the inference.
	Return:
	A :obj:`list`:. The list contains the embeddings of the inference inputs
	"""
	inputs = data.get("inputs", data)
	parameters = data.get("parameters", {})

	# tokenize the input
	input_ids = self.tokenizer(inputs,return_tensors="pt").input_ids.to(self.model.device)
	# run the model
	logits = self.model.generate(input_ids, **parameters)
	# Perform pooling
	# postprocess the prediction
	return {"generated_text": self.tokenizer.decode(logits[0].tolist())}