--- license: mit datasets: - allenai/MADLAD-400 --- Mae'r model LLM yn seiliedig ar [microsoft/phi-2](https://huggingface.co/microsoft/phi-2), gyda hyfforddiant parhaus ar 100k llinell o ddata Cymreig o'r dataset [allenai/MADLAD-400](https://huggingface.co/datasets/allenai/MADLAD-400) am 1 Epoch. Pwrpas y model yw fod yn gychwyn i hyfforddiant cywrain pellach i greu casgliad o LLMs Cymreig penodol. --- *Contains information from [allenai/MADLAD-400](https://huggingface.co/datasets/allenai/MADLAD-400) which is made available under the ODC Attribution License.*