luckeciano
/

Qwen-2.5-Base-7B-GRPO-Base-v2_7758

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen-2.5-Base-7B-GRPO-Base-v2_7758 / README.md

Commit History

End of training

e8dfaa5
verified

luckeciano commited on Sep 21

Model save

8192414
verified

luckeciano commited on Sep 21

Training in progress, step 10

f1223ba
verified

luckeciano commited on Sep 20