collapse_gemma-2-2b_hs2_replace_iter14_sftsd1

This model is a fine-tuned version of google/gemma-2-2b on an unknown dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

Training Loss	Epoch	Step	Validation Loss	Input Tokens Seen
No log	0	0	1.3909	0
1.5075	0.0511	5	1.2776	235544
0.836	0.1022	10	1.2777	467032
0.4955	0.1533	15	1.4886	700024
0.3103	0.2043	20	1.6793	936792
0.1031	0.2554	25	1.9368	1172032
0.0885	0.3065	30	2.1415	1401888
0.0543	0.3576	35	2.2858	1638624
0.0376	0.4087	40	2.3690	1882040
0.0231	0.4598	45	2.4836	2115960
0.0275	0.5109	50	2.5069	2358760
0.0255	0.5619	55	2.5359	2591288
0.0237	0.6130	60	2.5399	2832448
0.024	0.6641	65	2.5485	3068016
0.024	0.7152	70	2.5532	3301008
0.0249	0.7663	75	2.5420	3541120
0.0225	0.8174	80	2.5494	3772632
0.0232	0.8685	85	2.5649	4012576
0.0234	0.9195	90	2.5743	4257128
0.0228	0.9706	95	2.5775	4478968