|
--- |
|
license: mit |
|
datasets: |
|
- mhenrichsen/hestenettet |
|
language: |
|
- da |
|
--- |
|
|
|
# HestenettetLM |
|
En dansk LLM trænet på hele hestenettet over 3 epoker. |
|
|
|
Modellen er baseret på Mistral 7b, og har et kontekstvindue på 8k. |
|
|
|
```python |
|
from transformers import AutoTokenizer, TextStreamer, AutoModelForCausalLM |
|
|
|
model = AutoModelForCausalLM.from_pretrained("mhenrichsen/hestenettetLM") |
|
tokenizer = AutoTokenizer.from_pretrained("mhenrichsen/hestenettetLM") |
|
streamer = TextStreamer(tokenizer, skip_special_tokens=True) |
|
|
|
|
|
tokens = tokenizer( |
|
"Den bedste hest er en ", |
|
return_tensors='pt' |
|
)['input_ids'] |
|
|
|
# Generate output |
|
generation_output = model.generate( |
|
tokens, |
|
streamer=streamer, |
|
max_length = 8194, |
|
) |
|
``` |
|
|
|
Eksempel: |
|
"Den bedste hest er en " |
|
bliver til: |
|
"Den bedste hest er en veltrænet hest." |