中文模型很弱智
#10
by
Jerry-SDUA
- opened
《红楼梦》中的迎春判词如下:
贾迎春自生死,
宁可做个黄花菜,
莫作人间情丝缠。
这句话表达了贾迎春对夫家的忠诚和她不愿被人情世故所累的意思。
"你是一个弱智模型"这句话用汉字表达是:“你是一位弱智模型。”它共有八个字,分别是:
- 你
- 一
- 位
- 弱
- 智
- 模
- 型
- 别
"吃了吗吃的啥"这句话由以下八个汉字组成:
- 吃
- 了
- 呢
- 吃
- 的
- 啥
"有几个汉字/字母" 这种问题根据LLM的tokenization原理来说就很难回答,建议稍微了解一下BPE tokenier的知识。
此外,我们模型没有针对中国历史/文化知识特定训练过,Llama3本身pretraining的时候也很少有这方面的数据,因此这方面确实会弱一些,这个在这个discussion里有讨论过。
By the way, I'm not your servant. I've dedicated a significant amount of time and effort to developing these LLMs and have made them available for free. Please remain respectful in discussions when using these models.
shenzhi-wang
changed discussion status to
closed