README.md · shinyice/llava-jp-LoRA-1.3b-v1.1-Dog at b36dafcba98987b26387d5f1729ea7df74deaf5c

metadata

library_name: transformers
tags: []

llava-jp-LoRA-1.3b-v1.1-Dog Model Card

このモデルはLLaVA-JP-13b-v1.1からLoRAを作成し、画像に写っている犬の気持ちをなんとなくで言語化するモデルです。
精度は信頼できません。

使い方

当モデルはdensenet121-dog-emotionsと一緒に使うことを前提にしています。

from transformers.generation.streamers import TextStreamer
from llava.constants import DEFAULT_IMAGE_TOKEN, IMAGE_TOKEN_INDEX
from llava.conversation import conv_templates, SeparatorStyle
from llava.model.llava_gpt2 import LlavaGpt2ForCausalLM
from llava.train.arguments_dataclass import ModelArguments, DataArguments, TrainingArguments
from llava.train.dataset import tokenizer_image_token
import transformers

model = LlavaGpt2ForCausalLM.from_pretrained(
    llava_jp_name,
    low_cpu_mem_usage=True,
    use_safetensors=True,
    torch_dtype=torch_dtype,
    device_map=device,
)
tokenizer = transformers.AutoTokenizer.from_pretrained(
    llava_jp_name,
    model_max_length=1532,
    padding_side="right",
    use_fast=False,
)
model.eval()

# プロンプトモード設定（V1）
conv_mode = "v1"
conv = conv_templates[conv_mode].copy()