metadata
language: ko
license: apache-2.0
team-lucid/t5-v1_1-large-ko
Google's T5 Version 1.1 that trained on korean corpus
t5-v1_1-large-ko์ ํ๊ตญ์ด ์ฝํผ์ค์์ ํ์ต๋ t5 v1.1 ๋ชจ๋ธ์ ๋๋ค.
OOV์ ๋ง๊ธฐ ์ํด BBPE๋ฅผ ์ฌ์ฉํ์์ผ๋ฉฐ, HyperCLOVA์์ ํํ์ ๋ถ์์ด ์ฑ๋ฅ์ ๋ํ๋๋ฐ ๋์์ด ๋๋ ๊ฒ์ ๋ณด๊ณ ํ ํฌ๋์ด์ ํ์ต ๊ณผ์ ์์ MeCab์ ์ด์ฉํด ํํ์๊ฐ ์ด์ํ๊ฒ ํ ํฐํ๋์ง ์๋๋ก ํ์์ต๋๋ค.
์ด ์ฐ๊ตฌ๋ ๊ตฌ๊ธ์ TPU Research Cloud(TRC)๋ฅผ ํตํด ์ง์๋ฐ์ Cloud TPU๋ก ํ์ต๋์์ต๋๋ค.
Usage
from transformers import AutoTokenizer, T5ForConditionalGeneration
tokenizer = AutoTokenizer.from_pretrained('team-lucid/t5-v1_1-large-ko')
model = T5ForConditionalGeneration.from_pretrained('team-lucid/t5-v1_1-large-ko')