dmnsh
/

Qwen3-4b-W0-GenRM

Reinforcement Learning

GenerativeRewardModel

Model card Files Files and versions

README.md exists but content is empty.

Downloads last month: -

Video Preview

Reinforcement Learning

loading

Model tree for dmnsh/Qwen3-4b-W0-GenRM

Base model

Qwen/Qwen3-4B-Base

Finetuned

PrimeIntellect/Qwen3-4B

Finetuned

dmnsh/Qwen3-4B-W0-LitBench-SFT

Finetuned

(1)

this model

Dataset used to train dmnsh/Qwen3-4b-W0-GenRM