metadata
license: mit
tags:
- ja
- gpt_neox
- text-generation
- lm
- nlp
datasets:
- kunishou/databricks-dolly-15k-ja
- kunishou/hh-rlhf-49k-ja
- Jumtra/oasst1_ja
- Jumtra/jglue_jnli
- Jumtra/jglue_jsquad
- Jumtra/jglue_jsquads_with_input
inference: false
language:
- ja
rinna-3.6b
このモデルは、MosaicMLのllm-foundryリポジトリを使用してJumtra/rinna-3.6b-tune-ep5をファインチューニングしたモデルです。
Model Date
June 28, 2023
Model License
MIT
評価
Jumtra/test_data_100QAを用いてモデルの正答率を評価した また、学習時のvalidateデータに対してのPerplexityを記載した。
model name | 正答率 | Perplexity |
---|---|---|
Jumtra/rinna-3.6b-tune-ep5 | 40/100 | 8.105 |
Jumtra/rinna-v1-tune-ep1 | 42/100 | 7.458 |
Jumtra/rinna-v1-tune-ep3 | 41/100 | 7.034 |
Jumtra/calm-7b-tune-ep4 | 40/100 | 9.766 |
Jumtra/calm-v3-ep1 | 35/100 | 9.305 |
Jumtra/calm-v3-ep3 | 37/100 | 13.276 |
以下のプロンプトを用いた
INSTRUCTION_KEY = "### 入力:"
RESPONSE_KEY = "### 回答:"
INTRO_BLURB = "以下はタスクを説明する指示と文脈のある文章が含まれた入力です。要求を適切に満たす回答を生成しなさい。"
JP_PROMPT_FOR_GENERATION_FORMAT = """{intro}
{instruction_key}
{instruction}
{response_key}
""".format(
intro=INTRO_BLURB,
instruction_key=INSTRUCTION_KEY,
instruction="{instruction}",
response_key=RESPONSE_KEY,
)