2 338 19

Chan Kim

chanmuzi

chanmuzi

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

upvoted a paper 2 days ago

GLM-5: from Vibe Coding to Agentic Engineering

upvoted a paper 4 days ago

SQuTR: A Robustness Benchmark for Spoken Query to Text Retrieval under Acoustic Noise

View all activity

Organizations

upvoted a paper about 16 hours ago

Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents

Paper • 2602.16855 • Published 7 days ago • 32

upvoted a paper 2 days ago

GLM-5: from Vibe Coding to Agentic Engineering

Paper • 2602.15763 • Published 4 days ago • 71

upvoted a paper 4 days ago

SQuTR: A Robustness Benchmark for Spoken Query to Text Retrieval under Acoustic Noise

Paper • 2602.12783 • Published 9 days ago • 140

upvoted a paper 7 days ago

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Paper • 2602.10604 • Published 11 days ago • 179

upvoted a paper 8 days ago

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Paper • 2602.05400 • Published 17 days ago • 320

upvoted a paper 11 days ago

QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining

Paper • 2602.07085 • Published 16 days ago • 184

upvoted an article 12 days ago

Article

Community Evals: Because we're done trusting black-box leaderboards over the community

18 days ago

•

upvoted a paper 15 days ago

ERNIE 5.0 Technical Report

Paper • 2602.04705 • Published 17 days ago • 253

upvoted a paper 20 days ago

Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives

Paper • 2601.20833 • Published 24 days ago • 177

upvoted a paper 23 days ago

Advancing Open-source World Models

Paper • 2601.20540 • Published 24 days ago • 127

upvoted a paper 24 days ago

LongCat-Flash-Thinking-2601 Technical Report

Paper • 2601.16725 • Published 29 days ago • 175

upvoted 5 papers about 1 month ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 126

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 212

Solar Open Technical Report

Paper • 2601.07022 • Published Jan 11 • 65

User-Oriented Multi-Turn Dialogue Generation with Tool Use at scale

Paper • 2601.08225 • Published Jan 13 • 52

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 226

upvoted an article about 1 month ago

Article

NVIDIA Cosmos Reason 2 Brings Advanced Reasoning To Physical AI

Jan 5

•

upvoted 2 papers about 1 month ago

Entropy-Adaptive Fine-Tuning: Resolving Confident Conflicts to Mitigate Forgetting

Paper • 2601.02151 • Published Jan 5 • 109

Can LLMs Predict Their Own Failures? Self-Awareness via Internal Circuits

Paper • 2512.20578 • Published Dec 23, 2025 • 86

upvoted a paper about 2 months ago

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Paper • 2512.16093 • Published Dec 18, 2025 • 95