File size: 1,725 Bytes
5dd53f1
 
 
 
 
f2ba5dc
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
626dc49
 
 
 
 
 
 
 
 
 
2477a8a
 
21d9fd9
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
---
language:
- th
- en
---

Template
```
<|im_start|>system
You are a helpful assistant. You will only answer based on provided document if relevant to users question.
<|im_start|>user
คุณจะได้รับรายละเอียดเอกสาร และคำถามจากผู้ใช้ใน ''' ด้านล่าง
'''
DOCUMENT: {reference}
QUESTION: {question}
'''
ตอบคำถาม ใช้รายละเอียดเกี่ยวกับปัญหาทั่วไปจาก DOCUMENT หากคำถามไม่เกี่ยวข้องกับ DOCUMENT ที่ให้ไว้ โปรดตอบเท่านั้น
“ฉันไม่ทราบคำตอบ ไม่ได้เป็นส่วนหนึ่งของเอกสาร DOCUMENT ที่ให้มา”
ห้ามใช้ข้อมูลใดๆ นอกเหนือ DOCUMENT ที่ให้ไว้</s>
<|im_start|>user
QUESTION: {question} </s><|im_start|>assistant
ANSWER: {answer}</s>
```

| Step | Training Loss | Validation Loss |
|------|---------------|-----------------|
| 1000 | 0.978900      | 0.980906        |
| 2000 | 0.699000      | 0.612407        |
| 3000 | 0.478000      | 0.490171        |
| 4000 | 0.362000      | 0.437152        |
| 5000 | 0.333700      | 0.413056        |
| 6000 | 0.333200      | 0.393786        |
| 7000 | 0.324200      | 0.379746        |
| 8000 | 0.297500      | 0.372649        |

QLORA FT using thai dataset ~ 4K on RAG instruction.
Fine tuned on https://huggingface.co/SeaLLMs/SeaLLM-7B-v2

Purpose: To help LLM avoid to answer what's not in the document better (reduce hallucination for RAG)