Cho mình hỏi độ dài tối đa

#3
by minhduc96 - opened

bạn cho mình hỏi độ dài tối đa mà mô hình có thể sử dụng là bao nhiêu, nếu câu dài hơn khi tách ra và sử dụng riêng thì hiệu suất thế nào

BKAI-HUST Foundation Models Lab org

Bọn mình dùng pretrained model và tokenizer của PhoBERT nên độ dài tối đa của context giống PhoBERT là 256 tokens nhé bạn, còn về nếu câu dài hơn context hiệu suất sẽ phụ thuộc vào dataset bạn dùng và cách bạn chunking như thế nào nhé.

Sign up or log in to comment