VISIONx @ NYU

university

https://www.sainingxie.com/

AI & ML interests

None defined yet.

Recent Activity

AustinWang0330 new activity about 3 hours ago

nyu-visionx/siglip2_decoder:RAE repo fails when using google/siglip2-so400m-patch14-224 as encoder

bytetriper new activity 1 day ago

nyu-visionx/siglip2_decoder:RAE repo fails when using google/siglip2-so400m-patch14-224 as encoder

AustinWang0330 updated a collection 3 days ago

View all activity

Papers

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding

View all Papers

nyu-visionx 's Papers 4

Submitted by

BoYang Zheng

Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

nyu-visionx

Submitted by

Ellis Brown

SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding

nyu-visionx

Submitted by

Jihan Yang

Benchmark Designers Should "Train on the Test Set" to Expose Exploitable Non-Visual Shortcuts

nyu-visionx

2

Submitted by

Peter Tong

Diffusion Transformers with Representation Autoencoders

nyu-visionx