PathFinderKR
commited on
Commit
•
f1fc06e
1
Parent(s):
5bfbd92
Update README.md
Browse files
README.md
CHANGED
@@ -172,9 +172,9 @@ bnb_4bit_use_double_quant=True
|
|
172 |
################################################################################
|
173 |
task_type="CAUSAL_LM"
|
174 |
target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"]
|
175 |
-
r=
|
176 |
-
lora_alpha=
|
177 |
-
lora_dropout=0.
|
178 |
bias="none"
|
179 |
|
180 |
################################################################################
|
@@ -193,7 +193,7 @@ weight_decay=0.01
|
|
193 |
################################################################################
|
194 |
# SFT parameters
|
195 |
################################################################################
|
196 |
-
max_seq_length=
|
197 |
packing=False
|
198 |
```
|
199 |
|
@@ -276,7 +276,7 @@ packing=False
|
|
276 |
|
277 |
### Training Details
|
278 |
|
279 |
-
- **Training time:**
|
280 |
- More details on [Weights & Biases](https://wandb.ai/pathfinderkr/Waktaverse-Llama-3-KO-8B-Instruct?nw=nwuserpathfinderkr)
|
281 |
|
282 |
|
|
|
172 |
################################################################################
|
173 |
task_type="CAUSAL_LM"
|
174 |
target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"]
|
175 |
+
r=8
|
176 |
+
lora_alpha=16
|
177 |
+
lora_dropout=0.05
|
178 |
bias="none"
|
179 |
|
180 |
################################################################################
|
|
|
193 |
################################################################################
|
194 |
# SFT parameters
|
195 |
################################################################################
|
196 |
+
max_seq_length=4096
|
197 |
packing=False
|
198 |
```
|
199 |
|
|
|
276 |
|
277 |
### Training Details
|
278 |
|
279 |
+
- **Training time:** 80 hours
|
280 |
- More details on [Weights & Biases](https://wandb.ai/pathfinderkr/Waktaverse-Llama-3-KO-8B-Instruct?nw=nwuserpathfinderkr)
|
281 |
|
282 |
|