---
pipeline_tag: image-text-to-text
language:
  - ja
tags:
  - multimodal
library_name: transformers
license: cc-by-nc-4.0
---

# AIBunCho/Qwen2-VL-7B-Instruct-bokete

## 概要

このモデルは、Qwen/Qwen2-VL-7B-Instruct を元にloraしたモデルで、画像に対してボケること を目的としています。


## 学習方法、環境構築
   - [Qwen2-VL-7B-InstructのLoRA](https://note.com/soneo/n/n06fee06016f1)

## 使用方法
./images に推論させたい画像をおいて、inference.pyのpathを書き換えてください。

```bash
CUDA_VISIBLE_DEVICES=0 python inference.py 
```

用意した環境以外でのテストはしておりません。

**会社HP**: [インダストリアル・ドリーム株式会社](https://www.industrial-dream.com/)