mhenrichsen commited on
Commit
5b6ba40
1 Parent(s): 96f1761

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +33 -0
README.md ADDED
@@ -0,0 +1,33 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ datasets:
4
+ - DDSC/partial-danish-gigaword-no-twitter
5
+ language:
6
+ - da
7
+ ---
8
+
9
+ # HestenettetLM
10
+ En dansk LLM trænet på hele hestenettet over 3 epoker.
11
+
12
+ Modellen er baseret på Mistral 7b, og har et kontekstvindue på 8k.
13
+
14
+ ```
15
+ from transformers import AutoTokenizer, TextStreamer, AutoModelForCausalLM
16
+
17
+ model = AutoModelForCausalLM.from_pretrained("mhenrichsen/hestenettetLM")
18
+ tokenizer = AutoTokenizer.from_pretrained("mhenrichsen/hestenettetLM")
19
+ streamer = TextStreamer(tokenizer, skip_special_tokens=True)
20
+
21
+
22
+ tokens = tokenizer(
23
+ "Den bedste hest er en ",
24
+ return_tensors='pt'
25
+ )['input_ids']
26
+
27
+ # Generate output
28
+ generation_output = model.generate(
29
+ tokens,
30
+ streamer=streamer,
31
+ max_length = 8194,
32
+ )
33
+ ```