tsavage68
/

MedQA_L3_1000steps_1e5rate_03beta_CSFTDPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

MedQA_L3_1000steps_1e5rate_03beta_CSFTDPO / final_checkpoint /model-00002-of-00004.safetensors

Commit History

End of training

b784446
verified

tsavage68 commited on May 23