yichen he's picture

5 9 2

yichen he

hyc2026

·

https://hyc2026.github.io

hyc2026

AI & ML interests

None yet

Organizations

upvoted 2 papers 3 months ago

Low-probability Tokens Sustain Exploration in Reinforcement Learning with Verifiable Reward

Paper • 2510.03222 • Published Oct 3, 2025 • 75

Memory Retrieval and Consolidation in Large Language Models through Function Tokens

Paper • 2510.08203 • Published Oct 9, 2025 • 9

upvoted a paper 5 months ago

Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory

Paper • 2508.09736 • Published Aug 13, 2025 • 57

upvoted a paper 7 months ago

MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning

Paper • 2506.05523 • Published Jun 5, 2025 • 34

upvoted 2 papers 10 months ago

Frac-Connections: Fractional Extension of Hyper-Connections

Paper • 2503.14125 • Published Mar 18, 2025 • 22

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published Mar 18, 2025 • 144

upvoted a paper 11 months ago

S^2R: Teaching LLMs to Self-verify and Self-correct via Reinforcement Learning

Paper • 2502.12853 • Published Feb 18, 2025 • 29

upvoted an article 12 months ago

Article

Putting RL back in RLHF

Jun 12, 2024

•

109

upvoted a paper 12 months ago

PaSa: An LLM Agent for Comprehensive Academic Paper Search

Paper • 2501.10120 • Published Jan 17, 2025 • 54