Paradoxis
/

Qwen2.5-VL-3B-Instruct-GRPO

Generated from Trainer

Model card Files Files and versions

Qwen2.5-VL-3B-Instruct-GRPO

Commit History

Training in progress, step 1000

22ddd6c
verified

Paradoxis commited on Sep 9

Training in progress, step 500

0e84497
verified

Paradoxis commited on Sep 8

initial commit

17d350b
verified

Paradoxis commited on Sep 8