5456es
/

implicit_reward_Llama-3.2-3B-Instruct_prune_0.3-sigmoid

preference-learning

Model card Files Files and versions

implicit_reward_Llama-3.2-3B-Instruct_prune_0.3-sigmoid

609 kB

1 contributor

History: 8 commits

5456es's picture

Upload rng_state_4.pth with huggingface_hub

f6403b7 verified 3 months ago