Zujie Liang's picture

3

Zujie Liang

jokieleung

·

https://jokieleung.github.io/

AI & ML interests

LLM/VLM Agents, reasoning

Recent Activity

upvoted a paper 23 days ago

Cache-to-Cache: Direct Semantic Communication Between Large Language Models

upvoted a paper about 1 month ago

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

upvoted a paper about 2 months ago

Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents

View all activity

Organizations

Papers 11

arxiv:2503.03588

arxiv:2502.14693

arxiv:2502.14662

arxiv:2502.12110

models 0

None public yet

datasets 0

None public yet