beomi
/

kollama-7b

@@ -13,6 +13,26 @@ tags:
 - KoreanGPT
 ---
 # KoLLaMA Model Card
 KoLLaMA (7B) trained on Korean/English/Code dataset with LLaMA Architecture via JAX.

 - KoreanGPT
 ---
+> 🚧 Note: this repo is under construction 🚧
+## Todo
+✅ - finish
+👀 - working on it
+- ✅ Train new BBPE Tokenizer
+- ✅ Test train code on TPUv4 Pods (with model parallel)
+- ✅ Converting test (jax to PyTorch)
+- 👀 LM train validation on minimal dataset (1 sentence 1000 step)
+- Build Data Shuffler (curriculum learning)
+- Train 7B Model
+- Train 13B Model
+- Train 33B Model
+- Train 65B Model
 # KoLLaMA Model Card
 KoLLaMA (7B) trained on Korean/English/Code dataset with LLaMA Architecture via JAX.