mgcyung
/

Qwen2.5-1.5B-Open-R1-Code-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-Code-GRPO / model.safetensors

Commit History

Training in progress, step 500

3da39e8
verified

mgcyung commited on Jun 18

Training in progress, step 450

12cb679
verified

mgcyung commited on Jun 18

Training in progress, step 400

51fe786
verified

mgcyung commited on Jun 18

Training in progress, step 350

6778646
verified

mgcyung commited on Jun 18

Training in progress, step 300

353b428
verified

mgcyung commited on Jun 18

Training in progress, step 250

e24e339
verified

mgcyung commited on Jun 18

Training in progress, step 200

fd5c3dd
verified

mgcyung commited on Jun 18

Training in progress, step 150

272d056
verified

mgcyung commited on Jun 18

Training in progress, step 100

87ba6ef
verified

mgcyung commited on Jun 18

Training in progress, step 50

45f7b95
verified

mgcyung commited on Jun 18