PinxueGuo's picture

1 16

PinxueGuo

PinxueGuo

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 12 days ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

liked a dataset about 2 months ago

Salesforce/APIGen-MT-5k

liked a Space 4 months ago

opencompass/open_vlm_leaderboard

View all activity

Organizations

None yet

upvoted a paper 12 days ago

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Paper • 2510.18927 • Published 13 days ago • 82