team-hatakeyama-phase2
/

Tanuki-8x8B-dpo-v1.0-GGUF

Inference Endpoints

Model card Files Files and versions Community

Tanuki-8x8B-dpo-v1.0-GGUF / README.md

Aratako's picture

Update README.md

6178429 verified 3 months ago

|

1.78 kB

	---
	base_model: weblab-GENIAC/Tanuki-8x8B-dpo-v1.0
	language:
	- ja
	- en
	license: apache-2.0
	tags:
	- japanese
	---
	# Tanuki-8x8B-dpo-v1.0-GGUF
	## 概要
	GENIAC 松尾研 LLM開発プロジェクトで開発されたLLMである[weblab-GENIAC/Tanuki-8x8B-dpo-v1.0](https://huggingface.co/weblab-GENIAC/Tanuki-8x8B-dpo-v1.0)のGGUF量子化モデルです。
	imatrixの計算には[Wikitext-JA](https://www.lsta.media.kyoto-u.ac.jp/resource/data/wikitext-ja/)を用いています。

	## 注意
	このGGUFモデルはtokenizerを元モデルから完全に変換出来ていない可能性があります。また、独自アーキテクチャの実装を反映するためにllama.cpp側の実装変更が必要となり、通常通り推論しようとすると性能低下が発生します。
	具体的には、内部のテストでJMT-Benchにおいて全体スコア-0.5点程度、特に数学やコーディング、リーズニングの難易度が高いタスクで大きな性能低下が起こることを確認しています。また、人手評価では更に大きな性能低下が確認される可能性もあります。

	そのため、他の形式の量子化モデルの利用を推奨いたします。
	- [AWQ 4bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-AWQ)
	- [GPTQ 4bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-4bit)
	- [GPTQ 8bit量子化](https://huggingface.co/team-hatakeyama-phase2/Tanuki-8x8B-dpo-v1.0-GPTQ-8bit)

	本モデルを利用する際は性能が低下していることをご理解の上お使いください。

	モデルに関する詳細については[元モデル]((https://huggingface.co/weblab-GENIAC/Tanuki-8x8B-dpo-v1.0))をご確認ください。