Zhisong Qiu's picture

Zhisong Qiu

consultantQ

·

consultantQ

AI & ML interests

None yet

Recent Activity

liked a Space 2 days ago

upvoted a paper 3 days ago

How LoRA Remembers? A Parametric Memory Law for LLM Finetuning

upvoted a paper 3 days ago

When Should Models Change Their Minds? Contextual Belief Management in Large Language Models

View all activity

Organizations

liked a Space 2 days ago

DABstep Leaderboard

DABstep Reasoning Benchmark Leaderboard

upvoted 2 papers 3 days ago

How LoRA Remembers? A Parametric Memory Law for LLM Finetuning

Paper • 2605.30260 • Published 4 days ago • 29

When Should Models Change Their Minds? Contextual Belief Management in Large Language Models

Paper • 2605.30219 • Published 4 days ago • 20

upvoted 2 papers 4 days ago

MemTrace: Tracing and Attributing Errors in Large Language Model Memory Systems

Paper • 2605.28732 • Published 5 days ago • 37

Rethinking Memory as Continuously Evolving Connectivity

Paper • 2605.28773 • Published 5 days ago • 27

upvoted a paper 7 days ago

SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

Paper • 2605.22878 • Published 12 days ago • 58

upvoted a paper 16 days ago

Self-Distilled Agentic Reinforcement Learning

Paper • 2605.15155 • Published 18 days ago • 111

upvoted 3 papers 19 days ago

From Context to Skills: Can Language Models Learn from Context Skillfully?

Paper • 2604.27660 • Published 29 days ago • 166

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Paper • 2605.06130 • Published 25 days ago • 111

Qwen-Image-2.0 Technical Report

Paper • 2605.10730 • Published 21 days ago • 110

upvoted a paper 27 days ago

OceanPile: A Large-Scale Multimodal Ocean Corpus for Foundation Models

Paper • 2605.00877 • Published Apr 25 • 15

updated a collection about 1 month ago

DataMind

15 items • Updated about 15 hours ago • 3

published a model about 1 month ago

zjunlp/DataPRM-DABStep

updated a collection about 1 month ago

DataMind

15 items • Updated about 15 hours ago • 3

upvoted 2 papers about 1 month ago

World-R1: Reinforcing 3D Constraints for Text-to-Video Generation

Paper • 2604.24764 • Published Apr 27 • 118

Rewarding the Scientific Process: Process-Level Reward Modeling for Agentic Data Analysis

Paper • 2604.24198 • Published Apr 27 • 22

updated a collection about 1 month ago

DataMind

15 items • Updated about 15 hours ago • 3

updated a dataset about 1 month ago

zjunlp/DataPRM-ScienceAgentBench

Viewer • Updated Apr 27 • 3.13k • 46

published a dataset about 1 month ago

zjunlp/DataPRM-ScienceAgentBench

Viewer • Updated Apr 27 • 3.13k • 46

updated a collection about 1 month ago

DataMind

15 items • Updated about 15 hours ago • 3