Qingping Yang's picture

4 2

Qingping Yang

qingping95

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 17 days ago

DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation

authored a paper 6 months ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

upvoted a paper 6 months ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

View all activity

Organizations

upvoted a paper 17 days ago

DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation

Paper • 2511.06307 • Published 19 days ago • 50

authored a paper 6 months ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Paper • 2505.11896 • Published May 17 • 58

upvoted a paper 6 months ago

AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning

Paper • 2505.11896 • Published May 17 • 58

authored a paper 8 months ago

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published Mar 28 • 45

upvoted a paper 8 months ago

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published Mar 28 • 45

liked a dataset 12 months ago

ReasonMind/UTMath

Viewer • Updated Jan 14 • 1.05k • 112 • 7

updated a dataset about 1 year ago

ReasonMind/UTMath

Viewer • Updated Jan 14 • 1.05k • 112 • 7

upvoted a paper about 1 year ago

Qwen2.5-Coder Technical Report

Paper • 2409.12186 • Published Sep 18, 2024 • 152

liked a Space almost 2 years ago

Big Code Models Leaderboard

Submit code models for evaluation and view leaderboard