Splend1dchan
commited on
Commit
•
6652ccd
1
Parent(s):
74f8a66
Update README.md
Browse files
README.md
CHANGED
@@ -89,20 +89,19 @@ pip install flash-attn
|
|
89 |
```
|
90 |
Then load the model in transformers:
|
91 |
```python
|
92 |
-
from transformers import
|
93 |
-
|
94 |
-
|
95 |
-
|
96 |
-
|
97 |
-
|
98 |
-
|
99 |
-
|
100 |
-
|
101 |
-
from transformers import AutoTokenizer
|
102 |
-
tokenizer = AutoTokenizer.from_pretrained("MediaTek-Research/Breeze-7B-32k-Base-v1_0")
|
103 |
-
tokenizer.tokenize("你好,我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如:回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。")
|
104 |
# Tokenized results
|
|
|
105 |
# ['▁', '你好', ',', '我', '可以', '幫助', '您', '解決', '各種', '問題', '、', '提供', '資訊', '和', '協助', '您', '完成', '許多', '不同', '的', '任務', '。', '例如', ':', '回答', '技術', '問題', '、', '提供', '建議', '、', '翻譯', '文字', '、', '尋找', '資料', '或', '協助', '您', '安排', '行程', '等', '。', '請', '告訴', '我', '如何', '能', '幫助', '您', '。']
|
|
|
106 |
```
|
107 |
|
108 |
|
|
|
89 |
```
|
90 |
Then load the model in transformers:
|
91 |
```python
|
92 |
+
>>> from transformers import AutoTokenizer
|
93 |
+
>>> tokenizer = AutoTokenizer.from_pretrained("MediaTek-Research/Breeze-7B-32k-Instruct-v1_0/")
|
94 |
+
>>> chat = [
|
95 |
+
... {"role": "user", "content": "你好,請問你可以完成什麼任務?"},
|
96 |
+
... {"role": "assistant", "content": "你好,我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如:回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。"},
|
97 |
+
... {"role": "user", "content": "太棒了!"},
|
98 |
+
... ]
|
99 |
+
>>> tokenizer.apply_chat_template(chat, tokenize=False)
|
100 |
+
"<s>You are a helpful AI assistant built by MediaTek Research. The user you are helping speaks Traditional Chinese and comes from Taiwan. [INST] 你好,請問你可以完成什麼任務? [/INST] 你好,我可以幫助您解決各種問題、提供資訊和協助您完成許多不同的任務。例如:回答技術問題、提供建議、翻譯文字、尋找資料或協助您安排行程等。請告訴我如何能幫助您。 [INST] 太棒了! [/INST] "
|
|
|
|
|
|
|
101 |
# Tokenized results
|
102 |
+
# ['▁', '你好', ',', '請問', '你', '可以', '完成', '什麼', '任務', '?']
|
103 |
# ['▁', '你好', ',', '我', '可以', '幫助', '您', '解決', '各種', '問題', '、', '提供', '資訊', '和', '協助', '您', '完成', '許多', '不同', '的', '任務', '。', '例如', ':', '回答', '技術', '問題', '、', '提供', '建議', '、', '翻譯', '文字', '、', '尋找', '資料', '或', '協助', '您', '安排', '行程', '等', '。', '請', '告訴', '我', '如何', '能', '幫助', '您', '。']
|
104 |
+
# ['▁', '太', '棒', '了', '!']
|
105 |
```
|
106 |
|
107 |
|