--- pipeline_tag: image-text-to-text language: - ja tags: - multimodal library_name: transformers license: cc-by-nc-4.0 --- # AIBunCho/Qwen2-VL-7B-Instruct-bokete ## 概要 このモデルは、Qwen/Qwen2-VL-7B-Instruct を元にloraしたモデルで、画像に対してボケること を目的としています。 ## 学習方法、環境構築 - [Qwen2-VL-7B-InstructのLoRA](https://note.com/soneo/n/n06fee06016f1) ## 使用方法 ./images に推論させたい画像をおいて、inference.pyのpathを書き換えてください。 ```bash CUDA_VISIBLE_DEVICES=0 python inference.py ``` 用意した環境以外でのテストはしておりません。 **会社HP**: [インダストリアル・ドリーム株式会社](https://www.industrial-dream.com/)