stvlynn's picture
Update README.md
b3be673 verified
|
raw
history blame
1.36 kB
metadata
license: agpl-3.0
language:
  - zh
base_model:
  - Qwen/Qwen1.5-32B
tags:
  - reflection

Reflection-Chinese-32B · Reflection-中文-32B

本模型使用Reflection-Chinese-Dataset微调,底模为Qwen1.5-32B

通过Reflection格式(think-reflect-output)的数据集引导模型形成特定的思维方式,提高正确率

Demo

  1. ✅3.11和3.8哪个大

  1. ✅鲁迅为什么打周树人

  1. 树上几只鸟

  1. ❌strawberry(未完全通过,因为复现成功率低)

存在的问题

  1. Reflection-llama3.1-70B在真实性上存在很多疑问,本项目使用的数据集是基于该项目的,所以本项目不保证可用性

  2. 虽然本项目的数据集严格使用标签用来分割内容,但是实际输出并没有这样的效果