new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jun 19

Submitted by

Uyoung

Moebius: 0.2B Lightweight Image Inpainting Framework with 10B-Level Performance

·
6 authors

Submitted by

SteveZeyuZhang

DragMesh-2: Physically Plausible Dexterous Hand-Object Interaction with Articulated Objects

PekingUniversity

Peking University

Submitted by

Junyi42

Playful Agentic Robot Learning

Berkeley

Submitted by

dllllb

Multi-LCB: Extending LiveCodeBench to Multiple Programming Languages

·
8 authors

Submitted by

lifuguan

S-Agent: Spatial Tool-Use Elicits Reasoning for Spatial Intelligence

ropedia-ai

Submitted by

DhavalPatel

Beyond Static Leaderboards: Predictive Validity for the Evaluation of LLM Agents

ibm

Submitted by

ChengYou305

DF3DV-1K: A Large-Scale Dataset and Benchmark for Distractor-Free Novel View Synthesis

·
9 authors

Submitted by

wchengad

FreeStyle: Free Control of Style-Content Dual-Reference Generation from Community LoRA Mining

Fudan-University

Fudan University

Submitted by

yulunliu

JanusMesh: Fast and Zero-Shot 3D Visual Illusion Generation via Cross-Space Denoising

NYCU

National Yang Ming Chiao Tung University

Submitted by

danielgilo

FlowBender: Feedback-Aware Training for Self-Correcting Conditional Flows

Technion

Technion Israel institute of technology

Submitted by

taesiri

ImageWAM: Do World Action Models Really Need Video Generation, or Just Image Editing?

SJTU

Shanghai Jiao Tong University

Submitted by

taesiri

ENPIRE: Agentic Robot Policy Self-Improvement in the Real World

nvidia

Submitted by

taesiri

Current World Models Lack a Persistent State Core

·
11 authors

Submitted by

JunkaiZ

Thinking with Visual Grounding

UCLA

University of California, Los Angeles

Submitted by

paulkass

FAPO: Fully Autonomous Prompt Optimization of Multi-Step LLM Pipelines

fdtn-ai

Cisco Foundation AI

Submitted by

xupy21

Context-Aware RL for Agentic and Multimodal LLMs

princetonu

Princeton University

Submitted by

sahsaeedi

LedgerAgent: Structured State for Policy-Adherent Tool-Calling Agents

Arizona-State-University

Arizona State University

Submitted by

yfdeng10

HumanScale: Egocentric Human Video Can Outperform Real-Robot Data for Embodied Pretraining

·
22 authors

Submitted by

jbarrow

Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States

Submitted by

kenchan0226

Understanding the Behaviors of Environment-aware Information Retrieval

LCO-Embedding

Submitted by

taesiri

Holo-World: Unified Camera, Object and Weather Control for Video World Model

·
9 authors

Submitted by

shariqfarooq

LooseControlVideo: Directorial Video Control using Spatial Blocking

adobe

1

Submitted by

rishitdagli

Adaptive Volumetric Mechanical Property Fields Invariant to Resolution

nvidia

Submitted by

lalitdv9

LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI

Independent Research

Submitted by

nicolas-dufour

The FID Lottery: Quantifying Hidden Randomness in Generative-Model Evaluation

kyutai

Submitted by

im0qianqian

Rethinking Shrinkage Bias in LLM FP4 Pretraining: Geometric Origin, Systemic Impact, and UFP4 Recipe

inclusionAI

2

Submitted by

osmalpkoras

Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why

ikim-uk-essen

Submitted by

Zhongzhu

Taylor-Calibrate: Principled Initialization for Hybrid Linear Attention Distillation

togethercomputer

Submitted by

taesiri

JAMER: Project-Level Code Framework Dataset and Benchmark on Professional Game Engines

·
8 authors

Submitted by

koulakis

The Data Manifold under the Microscope

·
2 authors

Submitted by

WJ0830

Selective Synergistic Learning for Video Object-Centric Learning

SUNGKYUNARCH

Sungkyunkwan University

Submitted by

nielsr

Duration Aware Scheduling for ASR Serving Under Workload Drift

·
4 authors

Submitted by

Devy1

No Resource, No Benchmarks, No Problem? Evaluating and Improving LLMs for Code Generation in No-Resource Languages

·
3 authors

Submitted by

mrseongminkim

ReSyn: A Generalized Recursive Regular Expression Synthesis Framework

·
5 authors