Cho mình hỏi độ dài tối đa
#3
by
minhduc96
- opened
bạn cho mình hỏi độ dài tối đa mà mô hình có thể sử dụng là bao nhiêu, nếu câu dài hơn khi tách ra và sử dụng riêng thì hiệu suất thế nào
Bọn mình dùng pretrained model và tokenizer của PhoBERT nên độ dài tối đa của context giống PhoBERT là 256 tokens nhé bạn, còn về nếu câu dài hơn context hiệu suất sẽ phụ thuộc vào dataset bạn dùng và cách bạn chunking như thế nào nhé.