hdong0
/

Qwen3-1.7B-base-Open-R1-GRPO_deepscaler_acc_8192

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen3-1.7B-base-Open-R1-GRPO_deepscaler_acc_8192 / tokenizer.json

Commit History

Training in progress, step 50

b2f698c
verified

hdong0 commited on Oct 1