中文模型很弱智

#10
by Jerry-SDUA - opened

《红楼梦》中的迎春判词如下:

贾迎春自生死,
宁可做个黄花菜,
莫作人间情丝缠。

这句话表达了贾迎春对夫家的忠诚和她不愿被人情世故所累的意思。
"你是一个弱智模型"这句话用汉字表达是:“你是一位弱智模型。”它共有八个字,分别是:


"吃了吗吃的啥"这句话由以下八个汉字组成:

"有几个汉字/字母" 这种问题根据LLM的tokenization原理来说就很难回答,建议稍微了解一下BPE tokenier的知识。

此外,我们模型没有针对中国历史/文化知识特定训练过,Llama3本身pretraining的时候也很少有这方面的数据,因此这方面确实会弱一些,这个在这个discussion里有讨论过。

By the way, I'm not your servant. I've dedicated a significant amount of time and effort to developing these LLMs and have made them available for free. Please remain respectful in discussions when using these models.

shenzhi-wang changed discussion status to closed

Sign up or log in to comment