Publications

In this page, you can find the our publications in 2026, 2025, 2024, 2023, 2022, 2021, before 2021, which can also be found in Google Scholar.

^* indicates equal contribution. ^† indicates corresponding author.

Highlights

A visually grounded language model for fetal ultrasound understanding

Ultrasound imaging is one of the most widely used diagnostic tools in prenatal care, but also one of the most operator dependent. Trainee sonographers often face steep learning curves, lack of confidence, and limited access to supervision in busy clinical settings. Sonomate aims to change this. It is a visually grounded language model that ‘listens’ to the sonographer’s instructions, interprets real-time ultrasound video, and offers real-time assistance for instance, identifying fetal anatomies and standard planes, checking image quality, reminding clinicians of missed anatomical views or assessing sonographer’s skill.

Xiaoqing Guo†, Mohammad Alsharid, He Zhao, Yipei Wang, Jayne Lander, Aris T. Papageorghiou, Alison Noble.

Nature Biomedical Engineering (NBME), 2026.

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

U2-BENCH is the first comprehensive benchmark to evaluate LVLMs on ultrasound understanding. U2-BENCH aggregates 7,241 cases spanning 15 anatomical regions and defines 8 clinically inspired tasks, such as diagnosis, view recognition, lesion localization, clinical value estimation, and report generation, across 50 ultrasound application scenarios. Our results reveal strong performance on image-level classification, but persistent challenges in spatial reasoning and clinical language generation.

Anjie Le, Henan Liu, Yue Wang, Zhenyu Liu, Rongkun Zhu, Taohan Weng, Jinze Yu, Boyang Wang, Yalun Wu, Kaiwen Yan, Quanlin Sun, Jialun Pei, Siya Liu, Haoyun Zheng, Zhoujun Li, Alison Noble, Jacques Souquet, Xiaoqing Guo†, Manxi Lin†, Hongcheng Guo†.

International Conference on Learning Representations (ICLR), 2026, Rio de Janeiro, Brazil.

MMSummary: Multimodal Summary Generation for Fetal Ultrasound Video

MMSummary is the first automated multimodal summary generation system for medical imaging video, particularly with a focus on fetal ultrasound analysis. Imitating the examination process performed by a human sonographer, MMSummary is designed as a three-stage pipeline, progressing from keyframe detection to keyframe captioning and finally anatomy segmentation and measurement. This system provides comprehensive summaries for fetal ultrasound examinations to enhance clinical workflow efficiency (reduce scanning time by approximately 1/3%).

Xiaoqing Guo†, Qianhui Men, Alison Noble.

International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2024), Marrakesh, Morocco.

Pose-GuideNet: Automatic Scanning Guidance for Fetal Head Ultrasound from Pose Estimation

We investigate how estimating 3D fetal pose from freehand 2D ultrasound scanning can guide a sonographer to locate a head standard plane. Fetal head pose is estimated by the proposed Pose-GuideNet, a novel 2D/3D registration approach to align freehand 2D ultrasound to a 3D anatomical atlas without the acquisition of 3D ultrasound. Evaluations with probe motions demonstrate the feasibility of adopting Pose-GuideNet for freehand ultrasound-assisted navigation in a sensor-free environment.

Qianhui Men, Xiaoqing Guo, Aris Papageorghiou, Alison Noble.

International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2024), Marrakesh, Morocco.

2026

A visually grounded language model for fetal ultrasound understanding
Xiaoqing Guo†, Mohammad Alsharid, He Zhao, Yipei Wang, Jayne Lander, Aris T. Papageorghiou, Alison Noble.
Nature Biomedical Engineering (NBME), 2026.
U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding
Anjie Le, Henan Liu, Yue Wang, Zhenyu Liu, Rongkun Zhu, Taohan Weng, Jinze Yu, Boyang Wang, Yalun Wu, Kaiwen Yan, Quanlin Sun, Jialun Pei, Siya Liu, Haoyun Zheng, Zhoujun Li, Alison Noble, Jacques Souquet, Xiaoqing Guo†, Manxi Lin†, Hongcheng Guo†.
International Conference on Learning Representations (ICLR), 2026, Rio de Janeiro, Brazil.
Ultrasound-CLIP: Semantic-Aware Contrastive Pre-training for Ultrasound Image-Text Understanding
Jiayun Jin, Haolong Chai, Xueying Huang, Xiaoqing Guo, Zengwei Zheng, Zhan Zhou, Junmei Wang, Xinyu Wang, Jie Liu, Binbin Zhou.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2026, Denver, USA.
Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation
Ruoyu Chen, Xiaoqing Guo, Kangwei Liu, Siyuan Liang, Shiming Liu, Qunli Zhang, Laiyuan Wang, Hua Zhang, Xiaochun Cao.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2026, Denver, USA.
Research Design Considerations for Empirical User Studies in MICCAI (Early Accept)
Catalina Gomez, Sue Min Cho, Katharina Breininger, Francis Creighton, Xiaoqing Guo, Dean Ho, Masaru Ishii, Pierre Jannin, Marta Kersten, Seong Tae Kim, Nassir Navab, Cheng Ouyang, Shandong Wu, Paul Yi, Maria A. Zuluaga, Mathias Unberath.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI), 2026, Strasbourg, France.
FOCUS: Towards Fetal Obstetric Corrective UltraSound Guidance
Hala Lamdouar, Angela Feixue Wang, Xiaoqing Guo, Qianhui Men, Jayne Lander, Aris Papageorghiou, Alison Noble.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI), 2026, Strasbourg, France.
PIPA: Prior-Driven Prompting with Diagnosis-Oriented Retrieval-Augmentation for 3D Radiology Report Generation
Qiushi Yang, Wuyang Li, Xiaoqing Guo, Maymay Cerys Harwood, Peter Y. M. Woo, Jingyang Zhang, Yang Chen, Ke Zhang, Yixuan Yuan.
IEEE Transactions on Medical Imaging (TMI), 2026.

2025

On the Public Dissemination and Open Sourcing of Ultrasound Resources, Datasets and Deep Learning Models
Mohammad Alsharid, Xiaoqing Guo, Qianhui Men, Pramit Saha, Divyanshu Mishra, Rahul Ahuja, Cheng Ouyang, Alison Noble.
npj Digital Medicine, 2025.
ToothMaker: Realistic Panoramic Dental Radiograph Generation via Disentangled Control
Weihao Yu, Xiaoqing Guo, Wuyang Li, Xinyu Liu, Hui Chen, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2025.
IterMask3D: Unsupervised Anomaly Detection and Segmentation with Test-Time Iterative Mask Refinement in 3D Brain MR
Ziyun Liang, Xiaoqing Guo, Wentian Xu, Yasin Ibrahim, Natalie Voets, Pieter M Pretorius, Alzheimer’s Disease Neuroimaging Initiative, Alison Noble, Konstantinos Kamnitsas.
Medical Image Analysis (MedIA), 2025. The MICCAI MedIA Best Paper Award
GaussianReg: Rapid 2D/3D Registration for Emergency Surgery via Explicit 3D Modeling with Gaussian Primitives
Weihao Yu, Xiaoqing Guo, Xinyu Liu, Yifan Liu, Hao Zheng, Yawen Huang, Yixuan Yuan.
International Conference on Computer Vision (ICCV 2025), Honolulu, Hawaii.
GeoT: Geometry-guided Instance-dependent Transition Matrix for Semi-supervised Tooth Point Cloud Segmentation
Weihao Yu, Xiaoqing Guo, Chenxin Li, Yifan Liu, Yixuan Yuan.
Information Processing in Medical Imaging (IPMI 2025), Kos Island.
Decoupled Representation Learning for Difference Medical Report Generation
Chen Yang, Xiaoqing Guo, Yixuan Yuan.
International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC 2025), Copenhagen, Denmark.
UterUS-CLIP: Semantic Similarity-Enhanced Vision-Language Model for Uterine Ultrasound in 5G Mobile Edge Computing
Binbin Zhou, Jiayun Jin, Haolong Chai, Xueying Huang, Xiaoqing Guo, Zengwei Zheng, Jie Liu, Junmei Wang, Xinyu Wang.
15th EAI International Conference on Mobile Networks and Management (MONAMI 2025), Chongqing, China. Best Paper Award
Dolphin v1.0 Technical Report
Taohan Weng, Kaibing Hu, Henan Liu, Siya Liu, Xiaoyang Liu, Zhenyu Liu, Jiren Ren, Boyan Wang, Boyang Wang, Yiyu Wang, Yalun Wu, Chaoran Yan, Kaiwen Yan, Jinze Yu, Chi Zhang, Duo Zhang, Haoyun Zheng, Xiaoqing Guo, Jacques Souquet, Hongcheng Guo, Anjie Le.
Initial submission, 2025.

2024

Infproto-powered Adaptive Classifier and Agnostic Feature Learning for Single Domain Generalization in Medical Images
Xiaoqing Guo, Jie Liu, Yixuan Yuan.
International Journal of Computer Vision (IJCV), 2024.
Disentangle Then Calibrate with Gradient Guidance: A Unified Framework for Common and Rare Disease Diagnosis
Yuanyuan Chen, Xiaoqing Guo, Yong Xia, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2024.
Integrated Lithium Niobate Microwave Photonic Processing Engine [CityU News]
Hanke Feng^*, Tong Ge^*, Xiaoqing Guo, Benshan Wang, Yiwen Zhang, Zhaoxi Chen, Sha Zhu, Ke Zhang, Wenzhao Sun, Chaoran Huang, Yixuan Yuan, Cheng Wang.
Nature, 2024.
Dynamic Attribute-guided Few-shot Open-set Network for Medical Image Diagnosis
Yiwen Luo, Xiaoqing Guo, Li Liu, Yixuan Yuan.
Expert Systems With Applications, 2024.
MMSummary: Multimodal Summary Generation for Fetal Ultrasound Video
Xiaoqing Guo†, Qianhui Men, Alison Noble.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2024), Marrakesh, Morocco.
Pose-GuideNet: Automatic Scanning Guidance for Fetal Head Ultrasound from Pose Estimation
Qianhui Men, Xiaoqing Guo, Aris Papageorghiou, Alison Noble.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2024), Marrakesh, Morocco.
IterMask^2: Iterative Unsupervised Anomaly Segmentation via Spatial and Frequency Masking for Brain Lesions in MRI [code] (Early Accept, Oral)
Ziyun Liang, Xiaoqing Guo, Alison Noble, Konstantinos Kamnitsas.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2024), Marrakesh, Morocco.
Diversified and Personalized Multi-rater Medical Image Segmentation [code] (Highlight)
Yicheng Wu, Xiangde Luo, Zhe Xu, Xiaoqing Guo, Lie Ju, Zongyuan Ge, Wenjun Liao, Jianfei Cai.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2024), Seattle, USA.
Bridge the Gap Between Visual and Linguistic Comprehension for Generalized Zero-shot Semantic Segmentation
Xiaoqing Guo^*, Wuyang Li^*, Yixuan Yuan.
arXiv, 2024

2023

Handling Open-set Noise and Novel Target Recognition in Domain Adaptive Semantic Segmentation [code]
Xiaoqing Guo, Jie Liu, Tongliang Liu, Yixuan Yuan.
IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE TPAMI), 2023.
Dynamic Feature Splicing for Few-Shot Rare Disease Diagnosis
Yuanyuan Chen^*, Xiaoqing Guo^*, Yongsheng Pan, Yong Xia, Yixuan Yuan. (^* indicates equal contribution)
Medical Image Analysis (MedIA), 2023.
Novel Scenes & Classes: Towards Adaptive Open-set Object Detection [code] (Oral)
Wuyang Li, Xiaoqing Guo, Yixuan Yuan.
IEEE International Conference on Computer Vision (ICCV 2023), Paris, France.

2022

Semantic-oriented Labeled-to-unlabeled Distribution Translation for Image Segmentation [code] [知乎]
Xiaoqing Guo, Jie Liu, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2022.
Non-equivalent Images and Pixels: Confidence-aware Resampling with Meta-learning Mixup for Polyp Segmentation
Xiaoqing Guo, Zhen Chen, Jun Liu, Yixuan Yuan.
Medical Image Analysis (MedIA), 2022.
D2-Net: Dual Disentanglement Network for Brain Tumor Segmentation with Missing Modalities [code]
Qiushi Yang, Xiaoqing Guo, Zhen Chen, Peter Y. M. Woo, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2022.
Graph-based Surgical Instrument Adaptive Segmentation via Domain-Common Knowledge [code]
Jie Liu, Xiaoqing Guo, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2022.
Source Free Domain Adaptation for Medical Image Segmentation with Fourier Style Mining [code]
Xiaoqing Guo, Chen Yang, Zhen Chen, Yixuan Yuan.
Medical Image Analysis (MedIA), 2022.
SimT: Handling Open-set Noise for Domain Adaptive Semantic Segmentation [code] [知乎]
Xiaoqing Guo, Jie Liu, Tongliang Liu, Yixuan Yuan.
IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2022), New Orleans, Louisiana, USA.
Joint Class-Affinity Loss Correction for Robust Medical Image Segmentation with Noisy Labels [code]
Xiaoqing Guo, Yixuan Yuan.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2022), Singapore.
Unknown-Oriented Learning for Open Set Domain Adaptation
Jie Liu, Xiaoqing Guo, Yixuan Yuan.
European Conference on Computer Vision (ECCV 2022), Tel-Aviv.
Disentangle then Calibrate: Selective Treasure Sharing for Generalized Rare Disease Diagnosis (Early Accept)
Yuanyuan Chen, Xiaoqing Guo, Yong Xia, Yixuan Yuan.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2022), Singapore.

2021

Learn to Threshold: ThresholdNet with Confidence-Guided Manifold Mixup for Polyp Segmentation [code] [MICS中文推送] (Early Accept)
Xiaoqing Guo, Chen Yang, Yajie Liu, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2021.
Dynamic-weighting Hierarchical Segmentation Network for Medical Images [code]
Xiaoqing Guo, Chen Yang, Yixuan Yuan.
Medical Image Analysis (MedIA), 2021.
Super-Resolution Enhanced Medical Image Diagnosis with Sample Affinity Interaction [code]
Zhen Chen, Xiaoqing Guo, Peter Y. M. Woo, Yixuan Yuan.
IEEE Transactions on Medical Imaging (IEEE TMI), 2021.
Consolidated Domain Adaptive Detection and Localization Framework for Cross-device Colonoscopic Images [code] [video]
Xinyu Liu, Xiaoqing Guo, Yajie Liu, Yixuan Yuan.
Medical Image Analysis (MedIA), 2021.
Mutual-Prototype Adaptation for Cross-Domain Polyp Segmentation [code]
Chen Yang, Xiaoqing Guo, Meilu Zhu, Bulat Ibragimov, Yixuan Yuan.
IEEE Journal of Biomedical and Health Informatics (JBHI), 2021.
A Morphometric Analysis of Commonly Used Craniometric Approaches for Freehand Ventriculoperitoneal Shunting
Peter Y. M. Woo, Desiree KK Wong, Yixuan Yuan, Xiaoqing Guo, Michael KW See, Matthew Tam, Alain KS Wong, Kwong-Yau Chan.
Operative Neurosurgery, 2021.
MetaCorrection: Domain-aware Meta Loss Correction for Unsupervised Domain Adaptation in Semantic Segmentation [code] [video] [MICS中文推送]
Xiaoqing Guo^*, Chen Yang^*, Baopu Li, Yixuan Yuan. (^* indicates equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2021), Virtual.
COINet: Adaptive Segmentation with Co-Interactive Network for Autonomous Driving
Jie Liu, Xiaoqing Guo, Baopu Li, Yixuan Yuan.
IEEE International Conference on Intelligent Robots and Systems (IROS 2021), Prague, Czech Republic.
Prototypical Interaction Graph for Unsupervised Domain Adaptation in Surgical Instrument Segmentation [code] [video] (Early Accept)
Jie Liu, Xiaoqing Guo, Yixuan Yuan.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2021), Strasbourg, France.
Joint Polyp Detection and Segmentation with Heterogeneous Endoscopic Data (Ranked 1st place in polyp detection)
Wuyang Li, Chen Yang, Jie Liu, Xinyu Liu, Xiaoqing Guo, Yixuan Yuan.
The 3rd International Endoscopy Computer Vision Challenge and Workshop (EndoCV) of ISBI 2021 (MICCAI 2021), Nice, France.

Before 2021

Semi-supervised WCE Image Classification with Adaptive Aggregated Attention [code]
Xiaoqing Guo, Yixuan Yuan.
Medical Image Analysis (MedIA), 2020.
RNN-stega: Linguistic steganography based on recurrent neural networks [code]
Zhongliang Yang, Xiaoqing Guo, Ziming Chen, Yongfeng Huang, Yujin Zhang.
IEEE Transactions on Information Forensics and Security (IEEE TIFS), 2018.
Triple ANet: Adaptive Abnormal-aware Attention Network for WCE Image Classification [code] (Early Accept)
Xiaoqing Guo, Yixuan Yuan.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2019), Shenzhen, China.
Complementary Network with Adaptive Receptive Fields for Melanoma Segmentation [code]
Xiaoqing Guo, Zhen Chen, Yixuan Yuan.
IEEE International Symposium on Biomedical Imaging (ISBI 2020), Iowa City, Iowa, USA.
Domain Knowledge Based Brain Tumor Segmentation and Overall Survival Prediction
Xiaoqing Guo, Chen Yang, Pak Lun Lam, Peter Y. M. Woo, Yixuan Yuan.
Brain Lesion (BrainLes) workshop of MICCAI 2019, Shenzhen, China.
Joint Spatial-Wavelet Dual-Stream Network for Super-Resolution [code] (Early Accept)
Zhen Chen, Xiaoqing Guo, Chen Yang, Bulat Ibragimov, Yixuan Yuan.
International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2020), Lima, Peru.
Prostate Segmentation with Encoder-Decoder Densely Connected Convolutional Network (ED-DenseNet)
Yixuan Yuan, Wenjian Qin, Xiaoqing Guo, Mark Buyyounouski, Steve Hancock, Bin Han, Lei Xing.
IEEE International Symposium on Biomedical Imaging (ISBI 2019), Venice, Italy.
Unsupervised end-to-end learning for deformable medical image registration
Siyuan Shan, Wen Yan, Xiaoqing Guo, Eric I-Chao Chang, Yubo Fan, Yan Xu.
arXiv, 2017.