GuoLiangTang's picture

GuoLiangTang

Tommy930

·

https://github.com/TommyTang930

AI & ML interests

LLM，NLP，ML

Recent Activity

upvoted a paper 37 minutes ago

Reward Hacking in Rubric-Based Reinforcement Learning

upvoted a paper 37 minutes ago

Continual Harness: Online Adaptation for Self-Improving Foundation Agents

upvoted a paper 37 minutes ago

ToolCUA: Towards Optimal GUI-Tool Path Orchestration for Computer Use Agents

View all activity

Organizations

None yet

Tommy930 's datasets

None public yet