4月15日,北京邮电大学引进的优秀人才王光宇老师(特聘研究员、博导)在顶级国际学术期刊《自然》子刊 (Nature Biomedical Engineering)在线发表文章——《研发真實世界場景下肺部疾病的通用智能識別框架》,并推出全球最大规模的胸部X光片数据集,提出了基于X-ray影像的肺部疾病通用智能识别框架,并对肺炎进行检测和严重水平评估。此智能系统通过了多中心、真实世界场景的临床验证,而且在新冠肺炎的智能分诊的科技应对疫情历程中发挥作用。此项事情的代码和数据集宣布到了国家生物信息中心云平台,是目前世界上最大规模的高质量X光片数据集,希望进一步推动信息领域与生物医学的创新交织研究事情。
本论文由北京邮电大学联合清华大学、中山大学、四川大学华西医院等海内外多家机构相助完成,其中王光宇老师为第一作者及通讯作者,北京邮电大学是第一完成单元,这也是我校首次以第一单元在《自然》子刊 (Nature Biomedical Engineering)发文。

圖1. 真實世界場景下肺部疾病的通用智能識別框架
目前,基于数据驱动的人工智能要领在医学影像的领域中不停突破。然而在庞大、开放的真实场景下进行临床验证时,仍存在诸多挑战。尤其是在新冠疫情期间,各国的盘算机科学家们宣布了上千种机械学习算法,认为这些算法能凭据胸部 X 光片、CT 圖像诊断或预测新冠肺炎。然而剑桥大学Michael Roberts的另外一项研究发现,由于算法偏见和不行重复性等问题,科学论文和预印本提到的相关机械学习算法很少具有潜在的临床应用价值。
爲解決智慧醫療場景中所面臨的這些挑戰,團隊從魯棒的AI框架設計、高質量的數據集構建,多中心臨床驗證等層面開展深入的研究事情,並經過了嚴格的同行評議過程。王光宇博士對上述研究结果在Nature Portfolio Community 以《Building an intelligent diagnosis system for the real-world clinical applications using chest X-ray images》为题发表评论文章。国际著名的智慧医疗专家Eric Topol称这是“One of the best the best studies of deep learning #AI for aiding the diagnose of pneumonia… among hundreds that have been performed to date”。
具體地,對放射科醫師來說,要在胸片上發現肺炎並進一步鑒別診斷是很困難的。尤其在疫情期間,影像是重要的輔助診斷工具。相較在標准實驗室裏進行的分子檢測,X-ray掃描的速度快,也能更直觀地觀察到肺部的病理學特征及變化。開發智能影像AI系统可以资助放射科医生和医生进行快速诊断并预测危重品级,这在医疗系统超负荷的情况下具有尤其重要的临床应用价值。在要领层面,研究团队提出了基于胸部X-ray圖像的通用处置惩罚框架。由于X-ray拍摄容易泛起扭曲、变形、饰物遮挡等问题,通过要害点检测,智能矫正和肺部-病灶支解等模块,可以将X-ray圖像进行自动的预处置惩罚和尺度化。此外,临床影像陈诉的叙述中包罗许多身体部位和康健状况的要害信息,是临床诊断簣D膊≈瘟浦ぞ莸闹饕槌刹棵拧N颐腔谟跋癯滤撸ü匀挥镅源χ贸头#Natural language processing, NLP)技術抽取了影像發現(Radiologist findings)簣D膊”昵, 包罗肺炎、胸腔積液、肺腫塊等等。由于同一張X-ray影像中多種影像發現/疾病经常並存,研究團隊設計了新穎的多標簽分類模型,可以對臨床場景下的肺部疾病進行精准識別。最終,該智能識別系統經受住了真實世界研究的考驗--在來自4個隊列的差异臨床場景,及多國家的數千張外部影像數據上,進行回顧性和前瞻性測試均具有良好的泛化性能。

圖2. AI 系統輔助臨床流程
在这项事情中,科研团队接纳了多源多中心的14万张胸部X-ray圖像构建了深度学习系统。这是海内乃至世界上最大规模的多临床场景胸部X-ray影像数据集。已有的开源胸部X-ray数据来源于外洋住院人群,如斯坦福大学的吴恩达团队宣布的ChestX-ray14。相比力于已有开源数据集,我们这个数据集包罗了多种临床真实场景和人群,如住院、门诊、体检。好比,其中的体检数据集包罗大量康健数据,门诊包罗差异肺部异常的轻症患者,可以供研究者对康健人群建模,构建疾病异常检测AI系统。该研究数据集已经通过国家生物信息中心平台宣布,以协助来自差异国家和地域的研究团队和临床医生开展研究。
王光宇老師入職後發揮其本人的醫工交织領域綜合優勢,以5G技術爲內核,針對全場景的綜合智能醫療康健應用整合多種新興技術,解決當前利用人工智能技術在臨床真實世界研究中的重大挑戰,致力于取得重要技術和理論突破。如,在科技抗疫中實行了新冠病毒性肺炎的智能診斷及重症預測技術,引領了全球在這個偏向的創新研究;開展面向多源異構的醫學電子病曆的跨醫院、跨科室的信息智能抽取等重大技術挑戰的研究,相關结果已經發表在國際頂級期刊與會議上。
王光宇老師是信通院引進的A類優秀人才,隸屬張平院士團隊。張平院士團隊作爲我國網絡通信領域的優勢團隊,面向國家戰略需求和交织學科發展需要,凝聚多學科力量,開展信息科學前沿交织研究,在工業互聯網、智慧醫療“新基建”及培育我國經濟發展的新動能方面正不斷做出重要貢獻。
文章鏈接:https://www.nature.com/articles/s41551-021-00704-1
信息與通信工程學院
2021年4月28日