⚔️ BigCodeArena - a bigcode Collection

bigcode 's Collections

⚔️ BigCodeArena

💫 StarCoder2

🌸BigCodeBench

✨Astraios-15B

⚔️ BigCodeArena

updated Oct 13

Unveiling More Reliable Human Preferences in Code Generation via Execution

Running

37

BigCodeArena

🚀

37

Compare two AI models by sending them code and seeing their responses
BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation via Execution

Paper • 2510.08697 • Published Oct 9 • 35
bigcode/bigcodearena-raw-14k

Viewer • Updated Oct 13 • 14.1k • 47 • 1
bigcode/bigcodearena-preference-5k

Viewer • Updated Oct 13 • 4.73k • 94 • 1
bigcode/bigcodereward

Viewer • Updated Oct 15 • 4.73k • 162 • 2
bigcode/bigcodereward-experiment-results

Viewer • Updated Oct 13 • 141k • 439
bigcode/autocodearena-v0

Viewer • Updated Oct 15 • 600 • 108 • 2