Yonggan Fu's picture

4 9 1

Yonggan Fu PRO

YongganFu

·

https://www.yongganfu.com/

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

commented on a paper 1 day ago

Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

updated a model 5 days ago

nvidia/Nemotron-Flash-1B

View all activity

Organizations

upvoted a paper 1 day ago

Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

Paper • 2511.18890 • Published 9 days ago • 16

upvoted an article 5 months ago

Article

SmolLM3: smol, multilingual, long-context reasoner

+21

Jul 8

•

733

upvoted 2 papers 8 months ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper • 2504.13161 • Published Apr 17 • 93

Scaling Vision Pre-Training to 4K Resolution

Paper • 2503.19903 • Published Mar 25 • 41

upvoted a paper 10 months ago

SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer

Paper • 2501.18427 • Published Jan 30 • 23

upvoted a paper 12 months ago

NVILA: Efficient Frontier Visual Language Models

Paper • 2412.04468 • Published Dec 5, 2024 • 59

upvoted a collection about 1 year ago

Hymba

A series of Hybrid Small Language Models. • 3 items • Updated 9 days ago • 32

upvoted a paper about 1 year ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 45