Language Modelling with Phonemes

https://github.com/codebyzeb/PhonemeTransformers

tweetbyzeb

codebyzeb

Request to join this org

AI & ML interests

Child language acquisition, CHILDES, word segmentation, phonemes, BabyLM

Collections 1

spaces 1

segmentation_scores

models 77

phonemetransformers/BABYLM-TOKENIZER-CHAR-PHON-SPACELESS

phonemetransformers/BABYLM-TOKENIZER-CHAR-PHON

phonemetransformers/BABYLM-TOKENIZER-BPE-PHON-SPACELESS

phonemetransformers/BABYLM-TOKENIZER-BPE-PHON

phonemetransformers/BABYLM-TOKENIZER-CHAR-TXT-SPACELESS

phonemetransformers/BABYLM-TOKENIZER-CHAR-TXT

phonemetransformers/BABYLM-TOKENIZER-BPE-TXT-SPACELESS

phonemetransformers/BABYLM-TOKENIZER-BPE-TXT

phonemetransformers/GPT2-85M-BPE-PHON

Updated Sep 12 • 10

phonemetransformers/GPT2-85M-BPE-PHON-SPACELESS

Updated Sep 12 • 7

datasets 2

phonemetransformers/BabyLM-phonemized

Viewer • Updated 25 days ago • 12.5M • 37

phonemetransformers/CHILDES

Viewer • Updated Oct 15 • 7.48M • 1.98k • 1