pyamy
/

llama3-dpo-llm-judge

preference-learning

Model card Files Files and versions

Metrics Training metrics Community

llama3-dpo-llm-judge / checkpoint-100

Commit History

Upload DPO LLM Judge fine-tuned model

5ab83fa
verified

pyamy commited on Aug 12

Upload DPO LLM Judge fine-tuned model

ec5dc50
verified

pyamy commited on Aug 11

Upload DPO LLM Judge fine-tuned model

f582c27
verified

pyamy commited on Aug 11