LLM - a texzhang Collection

texzhang 's Collections

LLM

LLM

updated Aug 11

On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

Paper • 2508.05629 • Published Aug 7 • 177