Zhongwei Wan

Email-1:
wan.512[at]osu.edu

Email-2:
wanzhongwei666[at]gmail.com

Zhongwei Wan 万中威

I get my CS Ph.D. degree (graduation in May 2026) at The Ohio State University🌰 in Computer Science and Engineering, advised by Prof. Mi Zhang. My research focuses on Foundation Model Reasoning (Test-time Scaling, RL for LLMs/MLLMs/Agents/VLAs), Efficient Foundation Models (Long-context LLMs, MLLMs, VLAs), and Domain-specific Foundation Models. My work has been published at NeurIPS, ICLR, ICML, EMNLP, ACL, NAACL, CVPR, TMLR, ACM TOIS, and ICASSP, and I am the recipient of the ECCV CADL Workshop Best Paper Award 🏆 and the IEEE Internet Computing Magazine Best Paper Award 🏆.

Previously, I worked as a research scientist intern at Bytedance Seed (Multimodal Pre-training Team) at San Jose, Tencent AI Lab (NLP Group), and Noah’s Ark Lab (Speech and Language Group). I received my M.S. degree from the University of Chinese Academy of Sciences and my B.S. degree from Southern University of Science and Technology. Feel free to contact me if you are interested in my work or potential collaborations :P

Google Scholar / LinkedIn / X / GitHub

What's New

May 2026: Four papers have been accepted by ICML 2026..
Feb 2026: We release MMDeepResearch-Bench, the first benchmark designed to evaluate end-to-end multimodal deep research agent, please see MMDR-Bench.
Feb 2026: One paper have been accepted by CVPR 2026, please see QuantVLA.
Jan 2026: Two papers have been accepted by ICLR 2026 Oral and Poster.
Seq 2025: Two papers have been accepted by NeurIPS 2025, please see SRPO for MLLMs reasoning.
August 2025: Three papers have been accepted by EMNLP 2025.
May 2025: Released paper PhyX: Does Your Model Have the "Wits" for Physical Reasoning?, the dataset of PhyX at Huggingface Dataset, and the evaluation code.
May 2025: Four papers have been accepted by ACL 2025.
Feb 2025: One papers have been accepted by ICML 2025.
Feb 2025: Two papers have been accepted by ICLR 2025, please see D2O for optimizing Long-context LLMs.
Nov 2024: I joined Bytedance Seed in the U.S. as a Research Scientist Intern.

Education

The Ohio State University, United States
Ph.D. in Computer Science and Engineering
Advised by Prof. Mi Zhang

University of the Chinese Academy of Sciences, China
MPhil in Control Science & Engineering
(2020.9 - 2023.6)

Southern University of Science and Technology, China
B.S. in Computer Science
(2016.9 - 2020.6)

Services

Reviewer: ICML, ICLR, NeurIPS, ACL, EMNLP, NAACL,TKDE, TMLR

Talks

Towards Fundamental Biomedical AI: Integrating Vision, Language, and Signals
Zhongwei Wan, Che Liu, 2024.3

Recent Research

See Official Publications.

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents
Peizhou Huang*, Zixuan Zhong*, Zhongwei Wan*, Donghao Zhou*, Samiul Alam, Xin Wang, Zexin Li, Zhihao Dou, Li Zhu, Jing Xiong, Chaofan Tao, Yan Xu, Dimitrios Dimitriadis, Tuo Zhang, Mi Zhang
Under Review 2026, *Co-first Author
Leaderboard / Project Page / Paper

DSDR: Dual-Scale Diversity Regularization for Exploration in LLM Reasoning
Zhongwei Wan, Yun Shen, Zhihao Dou, Donghao Zhou, Yu Zhang, Xin Wang, Hui Shen, Jing Xiong, Chaofan Tao, Zixuan Zhong, Peizhou Huang, Mi Zhang
Under Review 2026
Code / Paper

SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning
Haoyu Huang, Jinfa Huang, Zhongwei Wan, Xiawu Zheng, Rongrong Ji, Jiebo Luo
Under Review 2026
Code / Paper

MathGen: Revealing the Illusion of Mathematical Competence through Text-to-Image Generation
Ruiyao Liu, Hui Shen, Ping Zhang, Yunta Hsieh, Yifan Zhang, Jing Xu, Sicheng Chen, Junchen Li, Jiawei Lu, Jianing Ma, Jiaqi Mo, Qi Han, Zhen Zhang, Zhongwei Wan, Jing Xiong, Xin Wang, Ziyuan Liu, Hangrui Cao, Ngai Wong
Under Review 2026
Code / Paper

MMSpec: Benchmarking Speculative Decoding for Vision-Language Models
Hui Shen, Xin Wang, Ping Zhang, Yunta Hsieh, Qi Han, Zhongwei Wan, Ziheng Zhang, Jingxuan Zhang, Jing Xiong, Ziyuan Liu, Yifan Zhang, Hangrui Cao, Chenyang Zhao, Mi Zhang
Under Review 2026
Code / Paper

Attention Sink in Transformers: Utilization, Interpretation, and Mitigation
Zunhai Su, Hengyuan Zhang, Wei Wu, Yifan Zhang, Yaxiu Liu, He Xiao, Qingyao Yang, Yuxuan Sun, Rui Yang, Chao Zhang, Keyu Fan, Weihao Ye, Jing Xiong, Hui Shen, Chaofan Tao, Taiqiang Wu, Zhongwei Wan, Yulei Qian, Yuchen Xie, Ngai Wong
Technical Report 2026
Code / Paper

Plan Then Action: High-level Planning Guidance Reinforcement Learning for LLM Reasoning
Zhihao Dou*, Qinjian Zhao*, Zhongwei Wan*, Dinggen Zhang, Weida Wang, Towsif Raiyan, Benteng Chen, Qingtao Pan, Yang Ouyang, Zhiqiang Gao, Shufei Zhang, Sumon Biswas
ICML 2026 *Co-first Author
Code / Paper

Dynamic Linear Attention
Xin Wang, Hui Shen, Boyuan Zheng, Xueshen Liu, Minkyoung Cho, Zhongwei Wan, Zesen Zhao, Zhuoqing Mao, Mi Zhang, Shen Yan
ICML 2026
Paper

Swordsman: Entropy-Driven Adaptive Block Partition for Efficient Diffusion Language Models
Yu Zhang, Xinchen Li, Jialei Zhou, Hongnan Ma, Zhongwei Wan, Yiwei Shi, Duoqian Miao, Qi Zhang, Longbing Cao
ICML 2026
Paper

MedREK: Retrieval-Based Editing for Medical LLMs with Key-Aware Prompts
Shujun Xia, Haokun Lin, Yichen Wu, Yinan Zhou, Zixuan Li, Zhongwei Wan, Xingrun Xing, Yefeng Zheng, Xiang Li, Caifeng Shan, Zhenan Sun, Quanzheng Li
ICML 2026
Paper

QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models
Jingxuan Zhang, Yunta Hsieh, Zhongwei Wan, Haokun Lin, Xin Wang, Ziqi Wang, Yingtie Lei, Mi Zhang
CVPR 2026
Project Page / Code / Paper

MMFormalizer: Multimodal Autoformalization in the Wild
Jing Xiong, Qi Han, Yunta Hsieh, Hui Shen, Huajian Xin, Chaofan Tao, Chenyang Zhao, Hengyuan Zhang, Taiqiang Wu, Zhen Zhang, Haochen Wang, Zhongwei Wan, Lingpeng Kong, Ngai Wong
Under Review 2026
Code / Paper

ATTS: Asynchronous Test-Time Scaling via Conformal Prediction
Jing Xiong, Qiujiang Chen, Fanghua Ye, Zhongwei Wan, Chuanyang Zheng, Chenyang Zhao, Hui Shen, Alexander Hanbo Li, Chaofan Tao, Haochen Tan, Haoli Bai, Lifeng Shang, Lingpeng Kong, Ngai Wong
ICLR 2026
Code / Paper

SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving
Wendong Xu, Jing Xiong, Chenyang Zhao, Qiujiang Chen, Haoran Wang, Hui Shen, Zhongwei Wan, Jianbo Dai, Taiqiang Wu, He Xiao, Chaofan Tao, Z Morley Mao, Ying Sheng, Zhijiang Guo, Hongxia Yang, Bei Yu, Lingpeng Kong, Quanquan Gu, Ngai Wong
ICLR 2026, Oral
Code / Paper

SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning
Zhongwei Wan, Zhihao Dou, Che Liu, Yu Zhang, Dongfei Cui, Qinjian Zhao, Hui Shen, Jing Xiong, Yi Xin, Yifan Jiang, Yangfan He, Mi Zhang, Shen Yan
NeurIPS 2025
Project Page / Data / Code / Paper

PhyX: Does Your Model Have the "Wits" for Physical Reasoning?
Hui Shen, Taiqiang Wu, Qi Han, Yunta Hsieh, Jizhou Wang, Yuyue Zhang, Yuxin Cheng, Zijian Hao, Yuansheng Ni, Xin Wang, Zhongwei Wan, Kai Zhang, Wendong Xu, Jing Xiong, Ping Luo, Wenhu Chen, Chaofan Tao, Zhuoqing Mao, Ngai Wong
Under Review 2025
Code / Paper

R2-LLMs: Enhancing Test-Time Scaling of Large Language Models with Hierarchical Retrieval-Augmented MCTS
Zhihao Dou*, Zhongwei Wan*, Dongfei Cui, Xin Wang, Jing Xiong, Haokun Lin, Chaofan Tao, Shen Yan, Mi Zhang
Under Review 2025, *Co-first Author
Paper

Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning
Yu Zhang, Jialei Zhou, Xinchen Li, Qi Zhang, Zhongwei Wan, Tianyu Wang, Duoqian Miao, Changwei Wang, Longbing Cao
NeurIPS 2025
Code / Paper

Beyond Distillation: Pushing the Limits of Medical LLM Reasoning with Minimalist Rule-Based RL
Che Liu, Haozhe Wang, Jiazhen Pan, Zhongwei Wan, Yong Dai, Fangzhen Lin, Wenjia Bai, Daniel Rueckert, Rossella Arcucci
NeurIPS 2025@GenAI4Health
Code / Paper

Enhancing Code LLMs with Reinforcement Learning in Code Generation
Junqiao Wang, Zeng Zhang, Yangfan He, Zihao Zhang, Yuyang Song, Tianyu Shi, Yuchen Li, Hengyuan Xu, Kunyu Wu, Xin Yi, Zhongwei Wan, Xinhang Yuan, Kuan Lu, Menghao Huo, Tang Jingqun, Guangwu Qian, Keqin Li, Qiuwu Chen, Lewei He
Technical Report 2025
Paper

Low-Cost Test-Time Adaptation for Robust Video Editing
Jianhui Wang, Yinda Chen, Yangfan He, Xinyuan Song, Yi Xin, Dapeng Zhang, Zhongwei Wan, Bin Li, Rongchao Zhang
Under Review 2025
Paper

UNComp: Can Matrix Entropy Uncover Sparsity? -- A Compressor Design from an Uncertainty-Aware Perspective
Jing Xiong, Jianghan Shen, Fanghua Ye, Chaofan Tao, Zhongwei Wan, Jianqiao Lu, Xun Wu, Chuanyang Zheng, Zhijiang Guo, Min Yang, Lingpeng Kong, Ngai Wong
EMNLP 2025
Code / Paper

Recent Advances in Large Langauge Model Benchmarks against Data Contamination: From Static to Dynamic Evaluation
Simin Chen, Yiming Chen, Zexin Li, Yifan Jiang, Zhongwei Wan, Yixin He, Dezhi Ran, Tianle Gu, Haizhou Li, Tao Xie, Baishakhi Ray
EMNLP 2025
Code / Paper

Knowledge-enhanced Multimodal ECG Representation Learning with Arbitrary-Lead Inputs
Che Liu, Cheng Ouyang, Zhongwei Wan, Haozhe Wang, Wenjia Bai, Rossella Arcucci
EMNLP 2025 Findings
Paper

D2O: Dynamic Discriminative Operations for Efficient Long-Context Inference of Large Language Models
Zhongwei Wans, Xinjian Wu, Yu Zhang, Yi Xin, Chaofan Tao, Zhihong Zhu, Xin Wang, Siqi Luo, Jing Xiong, Mi Zhang
ICLR 2025
Code / Paper

SVD-LLM: Truncation-aware Singular Value Decomposition for Large Language Model Compression
Xin Wang, Yu Zheng, Zhongwei Wan, Mi Zhang
ICLR 2025
Code / Paper

ParallelComp: Parallel Long-Context Compressor for Length Extrapolation
Jing Xiong, Jianghan Shen, Chuanyang Zheng, Zhongwei Wan, Chenyang Zhao, Chiwun Yang, Fanghua Ye, Hongxia Yang, Lingpeng Kong, Ngai Wong
ICML 2025
Code / Paper

MEDA: Dynamic KV Cache Allocation for Efficient Multimodal Long-Context Inference
Zhongwei Wan, Hui Shen, Xin Wang, Che Liu, Zheda Mai, Mi Zhang
NAACL 2025
Code / Paper

SVD-LLM V2: Optimizing Singular Value Truncation for Large Language Model Compression
Xin Wang, Samiul Alam, Zhongwei Wan, Hui Shen, Mi Zhang
NAACL 2025
Code / Paper

MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation
Zhongwei Wan, Che Liu, Xin Wang, Chaofan Tao, Hui Shen, Zhenwu Peng, Jie Fu, Rossella Arcucci, Huaxiu Yao, Mi Zhang
ACL 2025 Findings
Code / Paper

Can Medical Vision-Language Pre-training Succeed with Purely Synthetic Data?
Che Liu, Zhongwei Wan, Haozhe Wang, Yinda Chen, Talha Qaiser, Chen Jin, Fariba Yousefi, Nikolay Burlutskiy, Rossella Arcucci
ACL 2025 Findings
Paper

Argus: Benchmarking and Enhancing Vision-Language Models for 3D Radiology Report Generation
Che Liu, Zhongwei Wan, Yuqi Wang, Hui Shen, Haozhe Wang, Kangyu Zheng, Mi Zhang, Rossella Arcucci
ACL 2025 Findings
Paper

Can We Trust AI Doctors? Medical Hallucination in Large Language and Large Vision-Language Models
Zhihong Zhu, Yunyan Zhang, Xianwei Zhuang, Fan Zhang, Zhongwei Wan, Yuyan Chen, Qingqing Long, Yefeng Zheng, Xian Wu
ACL 2025 Findings
Paper

LongEmotion: Measuring Emotional Intelligence of Large Language Models in Long-Context Interaction
Weichu Liu, Jing Xiong, Yuxuan Hu, Zixuan Li, Minghuan Tan, Ningning Mao, Chenyang Zhao, Zhongwei Wan, Chaofan Tao, Wendong Xu, Hui Shen, Chengming Li, Lingpeng Kong, Ngai Wong
Under Review 2025
Code / Paper

Autoregressive Models in Vision: A Survey
Jing Xiong, Gongye Liu, Lun Huang, Chengyue Wu, Taiqiang Wu, Yao Mu, Yuan Yao, Hui Shen, Zhongwei Wan, Jinfa Huang, Chaofan Tao, Shen Yan, Huaxiu Yao, Lingpeng Kong, Hongxia Yang, Mi Zhang, Guillermo Sapiro, Jiebo Luo, Ping Luo, Ngai Wong
TMLR 2025
Code / Paper

Efficient diffusion models: A survey
Hui Shen, Jingxuan Zhang, Boning Xiong, Rui Hu, Shoufa Chen, Zhongwei Wan, Xin Wang, Yu Zhang, Zixuan Gong, Guangyin Bao, Chaofan Tao, Yongfeng Huang, Ye Yuan, Mi Zhang
TMLR 2025
Code / Paper

Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection
Jinfa Huang, Jinsheng Pan, Zhongwei Wan, Hanjia Lyu, Jiebo Luo
COLING 2025
Code / Paper

UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation
Zixuan Li, Jing Xiong, Fanghua Ye, Chuanyang Zheng, Xun Wu, Jianqiao Lu, Zhongwei Wan, Xiaodan Liang, Chengming Li, Zhenan Sun, Lingpeng Kong, Ngai Wong
Under Review 2024
Code / Paper

LOOK-M: Look-Once Optimization in KV Cache for Efficient Multimodal Long-Context Inference
Zhongwei Wan, Ziang Wu, Che Liu, Jinfa Huang, Zhihong Zhu, Peng Jin, Longyue Wang, Li Yuan
EMNLP 2024 Findings
Code / Paper

DGLF: A Dual Graph-based Learning Framework for Multi-modal Sarcasm Detection
Zhihong Zhu, Kefan Shen, Zhaorun Chen, Yunyan Zhang, Yuyan Chen, Xiaoqi Jiao, Zhongwei Wan, Shaorong Xie, Wei Liu, Xian Wu, Yefeng Zheng
EMNLP 2024
Paper

Famba-V: Fast Vision Mamba with Cross-Layer Token Fusion
Hui Shen, Zhongwei Wan, Xin Wang, Mi Zhang
ECCV 2024 @ Computational Aspects of Deep Learning (Best Paper Award🏆)
Code / Paper

Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies
Chaofan Tao, Qian Liu, Longxu Dou, Niklas Muennighoff, Zhongwei Wan, Ping Luo, Min Lin, Ngai Wong
NeurIPS 2024
Code / Paper

NeuroClips: Towards High-fidelity and Smooth fMRI-to-Video Reconstruction
Zixuan Gong, Guangyin Bao, Qi Zhang, Zhongwei Wan, Duoqian Miao, Shoujin Wang, Lei Zhu, Changwei Wang, Rongtao Xu, Liang Hu, Ke Liu, Yu Zhang
NeurIPS 2024 Oral
Code / Paper

V-PETL bench: A Unified Visual Parameter-efficient Transfer Learning Benchmark
Yi Xin, Siqi Luo, Xuyang Liu, Haodi Zhou, Xinyu Cheng, Christina E Lee, Junlong Du, Haozhe Wang, MingCai Chen, Ting Liu, Guimin Hu, Zhongwei Wan, Aoxue Li, Mingyang Yi, Xiaohong Liu
NeurIPS 2024
Code / Paper

ClinicalBench: Can LLMs Beat Traditional ML Models in Clinical Prediction?
Canyu Chen, Jian Yu, Shan Chen, Che Liu, Zhongwei Wan, Danielle Bitterman, Fei Wang, Kai Shu
NeurIPS 2024@ GenAI4Health
Code / Paper

Efficient Large Language Models: A Survey
Zhongwei Wan, Xin Wang, Che Liu, Samiul Alam, Yu Zheng, Jiachen Liu, Zhongnan Qu, Shen Yan, Yi Zhu, Quanlu Zhang, Mosharaf Chowdhury, Mi Zhang
TMLR 2024
Code / Paper

Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement
Che Liu, Zhongwei Wan, Cheng Ouyang, Anand Shah, Wenjia Bai, Rossella Arcucci
ICML 2024
Code / Paper

Structure-based Drug Design Benchmark: Do 3D Methods Really Dominate?
Kangyu Zheng, Yingzhou Lu, Zaixi Zhang, Zhongwei Wan, Yao Ma, Marinka Zitnik, Tianfan Fu
ICML 2024@AI4Science
Code / Paper

The Internet of Things in the Era of Generative AI: Vision and Challenges
Xin Wang, Zhongwei Wan, Arvin Hekmati, Mingyu Zong, Samiul Alam, Mi Zhang, Bhaskar Krishnamachari
IEEE Internet Computing Magazine 2024 (Best Paper Award🏆)
Code / Paper

ETP: Learning Transferable ECG Representations via ECG-Text Pre-training
Che Liu*, Zhongwei Wan*, Sibo Cheng, Mi Zhang, Rossella Arcucci
ICASSP 2024 *Co-first Author
Code / Paper

Med-UniC: Unifying Cross-Lingual Medical Vision-Language Pre-Training by Diminishing Bias
Zhongwei Wan, Che Liu, Mi Zhang, Jie Fu, Benyou Wang, Sibo Cheng, Lei Ma, César Quilodrán-Casas, Rossella Arcucci
NeurIPS 2023
Code / Paper

Spatio-Temporal Contrastive Learning Enhanced GNNs for Session-based Recommendation
Zhongwei Wan, Xin Liu, Benyou Wang, Jiezhong Qiu, Boyu Li, Ting Guo, Guangyong Chen, Yang Wang
ACM TOIS 2023
Code / Paper

G-map: general memory-augmented pre-trained language model for domain tasks
Zhongwei Wan, Yichun Yin, Wei Zhang, Jiaxin Shi, Lifeng Shang, Guangyong Chen, Xin Jiang, Qun Liu
EMNLP 2022
Code / Paper

Self-consistent reasoning for solving math word problems
Jing Xiong, Zhongwei Wan, Xiping Hu, Min Yang, Chengming Li
Technical Report 2022
Paper

Contact

Email: wan.512 [at] osu [dot] edu

Visit Statistic