Gopal2002
/

SmolLM2-FT-DPO-Beta0.1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

SmolLM2-FT-DPO-Beta0.1 / model_dpo_ft

543 MB

1 contributor

History: 1 commit

Gopal2002's picture

End of training

bcfdddf verified 9 months ago

SmolLM2-FT-DPO-Beta0.1
End of training 9 months ago