eryk-mazus
/

polka-1.1b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

eryk-mazus commited on Jan 6

Commit

c4c61cf

•

1 Parent(s): 468ec96

Update README.md

Files changed (1) hide show

README.md +16 -1

README.md CHANGED Viewed

@@ -26,5 +26,20 @@ The training took 425 GPU hours on a single 8 x RTX 4090 machine with DeepSpeed
 ## Sample code
 ```python
-...
 ```

 ## Sample code
 ```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+model_name = "eryk-mazus/polka-1.1b"
+tokenizer = AutoTokenizer.from_pretrained(model_name, padding_side="left")
+tokenizer.pad_token = tokenizer.eos_token
+model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", load_in_8bit=True)
+prompt = """..."""
+model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
+generated_ids = model.generate(**model_inputs, max_new_tokens=512, do_sample=True, penalty_alpha=0.6, top_k=5)
+output = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
+print(output)
 ```