pyamy
/

llama3-dpo-pairrm

preference-learning

Model card Files Files and versions

Metrics Training metrics Community

llama3-dpo-pairrm / runs

24.1 kB

1 contributor

History: 1 commit

pyamy's picture

Upload DPO PairRM fine-tuned model

ca53b0b verified 4 months ago

Aug10_16-54-04_Cheddar
Upload DPO PairRM fine-tuned model 4 months ago