Gabriel Mukobi's picture

4 1

Gabriel Mukobi

gmukobi

https://gabrielmukobi.com/

AI & ML interests

AI safety, robustness, interpretability, evaluations, value learning.

Organizations

None yet

Papers 5

arxiv:2406.04391

arxiv:2403.03218

arxiv:2401.03408

arxiv:2310.16763

models 316

gmukobi/shf-v4-llama-s4-10k-kl-0.4

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.35

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.45

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.5

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.275

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.225

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.3

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.375

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.2

Updated Jul 14, 2023

gmukobi/shf-v4-llama-s4-10k-kl-0.25

Updated Jul 14, 2023

datasets

None public yet