Serendipity

Yuhan

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 22 days ago

Redesign Mixture-of-Experts Routers with Manifold Power Iteration

upvoted a paper 25 days ago

Your UnEmbedding Matrix is Secretly a Feature Lens for Text Embeddings

upvoted a paper about 1 month ago

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

View all activity

Organizations

upvoted a paper 22 days ago

Redesign Mixture-of-Experts Routers with Manifold Power Iteration

Paper • 2606.12397 • Published 23 days ago • 89

upvoted a paper 25 days ago

Your UnEmbedding Matrix is Secretly a Feature Lens for Text Embeddings

Paper • 2606.07502 • Published 28 days ago • 99

upvoted a paper about 1 month ago

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Paper • 2605.21467 • Published May 20 • 207

upvoted a paper about 2 months ago

The Many Faces of On-Policy Distillation: Pitfalls, Mechanisms, and Fixes

Paper • 2605.11182 • Published May 11 • 5

upvoted a paper 4 months ago

AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents

Paper • 2603.14465 • Published Mar 15 • 23

upvoted a paper 5 months ago

DARC: Decoupled Asymmetric Reasoning Curriculum for LLM Evolution

Paper • 2601.13761 • Published Jan 20 • 16

upvoted 3 papers 6 months ago

ViPER: Empowering the Self-Evolution of Visual Perception Abilities in Vision-Language Model

Paper • 2510.24285 • Published Oct 28, 2025 • 3

Forest Before Trees: Latent Superposition for Efficient Visual Reasoning

Paper • 2601.06803 • Published Jan 11 • 10

From a Tiny Slip to a Giant Leap: An LLM-Based Simulation for Fake News Evolution

Paper • 2410.19064 • Published Oct 24, 2024 • 1

upvoted a paper about 1 year ago

The Climb Carves Wisdom Deeper Than the Summit: On the Noisy Rewards in Learning to Reason

Paper • 2505.22653 • Published May 28, 2025 • 43

upvoted 2 papers over 1 year ago

Injecting Domain-Specific Knowledge into Large Language Models: A Comprehensive Survey

Paper • 2502.10708 • Published Feb 15, 2025 • 4

Autonomy-of-Experts Models

Paper • 2501.13074 • Published Jan 22, 2025 • 44