JHuel
/

Mistral-Nemo-Instruct-2407_DPO_qlora

Reinforcement Learning

Model card Files Files and versions

Mistral-Nemo-Instruct-2407_DPO_qlora

55.1 MB

1 contributor

History: 8 commits

JHuel's picture

Update README.md

db7d153 verified 11 months ago