SmerkyG
/

rwkv-5-world-7b

Text Generation

Inference Endpoints

Model card Files Files and versions Community

SmerkyG commited on Mar 22

Commit

f2ca022

•

1 Parent(s): 49f029b

Update tokenization_rwkv_world.py

Files changed (1) hide show

tokenization_rwkv_world.py +3 -3

tokenization_rwkv_world.py CHANGED Viewed

@@ -93,7 +93,7 @@ class RWKVWorldTokenizer(PreTrainedTokenizer):
     vocab_files_names = VOCAB_FILES_NAMES
     model_input_names = ["input_ids", "attention_mask"]
-    def __init__(self, vocab_file, errors="replace", pad_token="\n", **kwargs):
         self.add_bos_token = False
         self.encoder = {}
         sorted = []  # must be already sorted
@@ -133,7 +133,7 @@ class RWKVWorldTokenizer(PreTrainedTokenizer):
     @property
     def pad_token_id(self) -> Optional[int]:
-        return 11
     @property
     def vocab_size(self):
@@ -316,7 +316,7 @@ class RWKVWorldTokenizer(PreTrainedTokenizer):
         verbose: bool = True,
         **kwargs,
     ) -> BatchEncoding:
-        def get_input_ids(text, max_length=None, pad_token_id=11):
             def pad_sequence(seq, max_len, pad_tok):
                 return [pad_tok] * (max_len - len(seq)) + seq

     vocab_files_names = VOCAB_FILES_NAMES
     model_input_names = ["input_ids", "attention_mask"]
+    def __init__(self, vocab_file, errors="replace", pad_token="0", **kwargs):
         self.add_bos_token = False
         self.encoder = {}
         sorted = []  # must be already sorted
     @property
     def pad_token_id(self) -> Optional[int]:
+        return 0
     @property
     def vocab_size(self):
         verbose: bool = True,
         **kwargs,
     ) -> BatchEncoding:
+        def get_input_ids(text, max_length=None, pad_token_id=0):
             def pad_sequence(seq, max_len, pad_tok):
                 return [pad_tok] * (max_len - len(seq)) + seq