About Me

I am currently a senior algorithm engineer at the Decision Intelligence Lab, Alibaba DAMO Academy. Prior to that, I obtained my Ph.D. degree from the Chinese University of Hong Kong, under the supervision of Prof. Wai Lam. My research mainly lies in LLM/MLLM Reasoning, Data Augmentation/Synthesis, and Agent.

Education

Aug. 2020 - July 2024, Ph.D.
Department of Systems Engineering and Engineering Management,
The Chinese University of Hong Kong
Sep. 2015 - Jun. 2019, B.E.
Computer Science from Yingcai Honors College,
University of Electronic Science and Technology of China

Selected Publications

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced Multimodal Reasoning [paper]
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, Jianyu Wang, Long Li, Weiwen Xu, Hou Pong Chan, Deli Zhao, Tingyang Xu, Zhongyu Wei, Hao Zhang, Yu Rong
ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning [paper] [dataset]
Yu Sun, Xingyu Qian, Weiwen Xu, Hao Zhang, Chenghao Xiao, Long Li, Yu Rong, Wenbing Huang, Qifeng Bai, Tingyang Xu
Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [paper][model]
Weiwen Xu, Hou Pong Chan, Long Li, and 15 other authors
Chain of ideas: Revolutionizing research via novel idea development with LLM agents [paper][code]
Long Li, Weiwen Xu, Jiayan Guo, and 11 other authors
FINEREASON: Evaluating and Improving LLMs’ Deliberate Reasoning through Reflective Puzzle Solving [paper][code]
Guizhen Chen, Weiwen Xu, Hao Zhang, Hou Pong Chan, Chaoqun Liu, Lidong Bing, Deli Zhao, Anh Tuan Luu, Yu Rong
ACL 2025
Can We Further Elicit Reasoning in LLMs? Critic-Guided Planning with Retrieval-Augmentation for Solving Challenging Tasks [paper]
Xingxuan Li, Weiwen Xu, Ruochen Zhao, Fangkai Jiao, Shafiq Joty, Lidong Bing
ACL 2025
Auto-Arena: Automating LLM Evaluations with Agent Peer Battles and Committee Discussions [paper][demo]
Ruochen Zhao, Wenxuan Zhang, Yew Ken Chia, Weiwen Xu, Deli Zhao, Lidong Bing
ACL 2025
Reasoning Paths Optimization: Learning to Reason and Explore From Diverse Paths [paper][code]
Yew Ken Chia, Guizhen Chen, Weiwen Xu, Luu Anh Tuan, Soujanya Poria, Lidong Bing
EMNLP 2024 Findings
Reasons to Reject? Aligning Language Models with Judgments [paper][code]
Weiwen Xu, Deng Cai, Zhisong Zhang, Wai Lam, Shuming Shi
ACL 2024 Findings
From Clozing to Comprehending: Retrofitting Pre-trained Masked Language Model to Pre-trained Machine Reader [paper][code]
Weiwen Xu, Xin Li, Wenxuan Zhang, Meng Zhou, Wai Lam, Luo Si, Lidong Bing
NeurIPS 2023
mPMR: A Multilingual Pre-trained Machine Reader at Scale [paper][code]
Weiwen Xu, Xin Li, Wai Lam, Lidong Bing
ACL 2023
PeerDA: Data Augmentation via Modeling Peer Relation for Span Identification Tasks [paper][code]
Weiwen Xu, Xin Li, Yang Deng, Lidong Bing, Wai Lam
ACL 2023
ConReader: Exploring Implicit Relations in Contracts for Contract Clause Extraction [paper][code]
Weiwen Xu, Yang Deng, Wenqiang Lei, Wenlong Zhao, Tat-Seng Chua, Wai Lam.
EMNLP 2022
Exploiting reasoning chains for multi-hop science question answering [paper][code]
Weiwen Xu, Yang Deng, Huihui Zhang, Deng Cai, Wai Lam.
EMNLP 2021 Findings
Dynamic Semantic Graph Construction and Reasoning for Explainable Multi-hop Science Question Answering [paper][code]
Weiwen Xu, Huihui Zhang, Deng Cai, Wai Lam.
ACL 2021 Findings
Addressing the Vulnerability of NMT in Input Perturbations [paper]
Weiwen Xu, Ai Ti Aw, Yang Ding, Kui Wu, Shafiq Joty.
NAACL 2021 Industry Track

Professional Service

Conference Reviwer: NeurIPS 2025, ICLR2025, ACL2021-2025, EMNLP2021-2025, NAACL2021-2022, SIGIR2023, IJCAI2023, ECIR2023
Journal Reviewer: TACL, Knowledge-Based Systems, ACM Trans. on Web, Neurocomputing

Weiwen Xu

About Me

Education

Selected Publications

Professional Service