yuyijiong
/

Qwen-14b-chat-yarn-32k

Text Generation

Model card Files Files and versions Community

yuyijiong commited on Dec 14, 2023

Commit

42389c8

•

1 Parent(s): d8bfd9a

Update README.md

Files changed (1) hide show

README.md +5 -1

README.md CHANGED Viewed

@@ -10,7 +10,8 @@ datasets:
 pipeline_tag: text-generation
 ---
 * 2023.12.14更新：发布微调后的Qwen-14b的权重，微调后的模型能适应32k长度（约4万汉字）的中英问答，在多文档问答任务上提升非常显著，超过chatglm3-32k。
 # LongBench测试结果
 ### LongBench的passage_retrieval_zh的评测结果
 | 模型                                          | 得分 (acc) |
@@ -22,6 +23,7 @@ pipeline_tag: text-generation
 | CausalLM-14b                                | 0.086    |
 # Usage
 * 使用此模型时会自动设置  config.use_logn_attn=False、config.use_dynamic_ntk=True，会产生warning，不影响模型使用。
@@ -36,6 +38,7 @@ response, history = model.chat(tokenizer, input_text, history=None)
 print(response)
 ```
 # 训练过程
 ### 1.模型结构修改
@@ -46,6 +49,7 @@ print(response)
 ### 3.指令微调
 * 使用[yuyijiong/Long-Instruction-Chinese](https://huggingface.co/datasets/yuyijiong/Long-Instruction-Chinese)数据，Qlora方法，对Qwen模型进行微调。
 # 问答例子
 * 模型支持中文和英文，支持长文本总结、多文档问答、长文本问答、多轮对话等任务。

 pipeline_tag: text-generation
 ---
 * 2023.12.14更新：发布微调后的Qwen-14b的权重，微调后的模型能适应32k长度（约4万汉字）的中英问答，在多文档问答任务上提升非常显著，超过chatglm3-32k。
+<br>
+<br>
 # LongBench测试结果
 ### LongBench的passage_retrieval_zh的评测结果
 | 模型                                          | 得分 (acc) |
 | CausalLM-14b                                | 0.086    |
+<br>
 # Usage
 * 使用此模型时会自动设置  config.use_logn_attn=False、config.use_dynamic_ntk=True，会产生warning，不影响模型使用。
 print(response)
 ```
+<br>
 # 训练过程
 ### 1.模型结构修改
 ### 3.指令微调
 * 使用[yuyijiong/Long-Instruction-Chinese](https://huggingface.co/datasets/yuyijiong/Long-Instruction-Chinese)数据，Qlora方法，对Qwen模型进行微调。
+<br>
 # 问答例子
 * 模型支持中文和英文，支持长文本总结、多文档问答、长文本问答、多轮对话等任务。