Blancy
/

DeepSeek-R1-Distill-Qwen-0.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-0.5B-GRPO / config.json

Commit History

End of training

6be64b0
verified

Blancy commited on Apr 18, 2025

Training in progress, epoch 0

9e097a3
verified

Blancy commited on Apr 18, 2025

End of training

882671c
verified

Blancy commited on Apr 17, 2025

Training in progress, epoch 0

188c40f
verified

Blancy commited on Apr 17, 2025

End of training

8932d6d
verified

Blancy commited on Apr 17, 2025

Training in progress, epoch 0

52536a8
verified

Blancy commited on Apr 17, 2025

End of training

97726b8
verified

Blancy commited on Apr 16, 2025

Training in progress, epoch 0

c4064c4
verified

Blancy commited on Apr 16, 2025