近日,年医学人工智能大会(CMAI)暨第二届“中国医学学术期刊发展”高端论坛召开。
本次高峰论医院的放射科主任及人工智能技术的权威专家,雷峰网《医健AI掘金志》作为本次大会的支持单位全程参与报道。
大会上,首都医科医院医学影像中心主任李宏*教授以《医学影像在医疗大数据中的作用与价值》为主题作了分享,着重介绍“AI+”影像基因组学的发展与应用。
会后,雷峰网《医健AI掘金志》与李宏*教授进行了一次对话。李宏*教授表示,影像组学反映了疾病的外在表型特征,基因组学反映了疾病的内在的微观分子特征,一内一外的数据模型结合,才能够较全面反映疾病生理病理演变过程,实现精准诊疗的效果。
他认为,医学影像AI经历近10年的发展,疯狂投入和研发的时期已经过去,现正处于理性阶段。在这个阶段,主要有两个表现:
一是对数据的标准化提出了更高的要求;
二则是影像基因组学设计理念得到推广,即基于影像数据特征与个性化疾病相关的多元异构数据特征相结合,实现多模型融合,全面客观反映疾病的病理生理过程。
目前,更多AI模型都是仅基于单一的影像组学数据特征建立。以影像基因组学模型融合理念为指导,医学影像AI的发展历程已经经历了第一步,即基于医疗影像单一数据的模型;
第二步将是医疗影像组学与多源异构数据融合模型;
第三步则是医疗影像基因组学与多源异构数据模型融合建立的AI产品。第二步和第三步的模型研发进程均为刚刚起步,尚处于科研阶段。
在谈及医学影像AI的发展时,李宏*教授特别提到医工结合和多学科交叉融合对产品落地的重要作用。
“前期AI为什么得不到很好的应用,主要原因是生物医学工程学科学家在建立模型的医院医生结合,对医疗数据的同质化没有标准化统一的要求,对病灶分割精确度也没有统一的标准,从数据的采集到处理过程当中都没有一个标准化的规范体系和技术体系。”
李宏*教授从年医院牵头建立重大传染病影像学的标准大数据库,与企业合作主导传染病诊疗的AI产品的开发。其中,有三项AI开发工作已显现出成果。
李宏*教授与深圳智影医疗合作建立的肺结核病原学和医疗影像融合AI模型,以及耐药性肺结核杆菌AI模型,已经获得三类证,并应用到全国医院中,各项指标获得美国NIH计算机信息中心评价达到国际标准参数要求。
此外,他还与推想医疗成功合作研发了针对新冠肺炎的AI模型,与汇医慧影成功研发了AI肺炎病原体三级分类辅助诊断产品。
尽管国内已有30余款AI产品拿到了三类证,但企业们如何活下来依然是重要的命题。当前,全球一级市场投资热情下降,医学影像AI企业融资遇冷,正面临生存挑战。
在与医工科打交道的过程中,李宏*教授发现,业界都已意识到医工结合的重要性,在研发方向上和模型建立方面不存在大问题,但由于融不到资金,企业显得心有余而力不足。
李宏*教授指出,目前国内针对医学影像AI产品还没有统一的收费项目,医院采买AI产品的积极性。他呼吁,针对医学影像AI产品,相关部门应尽快出台鼓励*策,成熟的产品可以纳入医保的收费项目中,让AI企业找到一条自身造血的出路。
医院的实践来看,国内已有不少成熟的AI产品应用到临床中。李宏*介绍,医院放射科部署了包括颈部、心血管、肺部、肝脏以及科研平台等AI产品,在肺结节筛查、心血管、颈部动脉和肝脏影像方面,对AI的使用率几乎是%。
“特别是在冠脉成像和血管重建方面大大节约了我们的时间,过去我们做一个肝脏血管的重建,一个大夫需要坐25~30分钟去勾画,现在一键就能瞬间成像。”
李宏*教授对医学影像AI的发展表露了十足的信心,其申请的科技部重点研发和国家自然科学基金重点项目等大部分科研项目都与AI相关。
同时,他担忧正在遭遇融资和商业化困境的企业,“越是在最艰难的时候挺过来、活下来,就是一种伟大。”
以下为李宏*教授大会演讲的全部内容,雷峰网《医健AI掘金志》做了不改变原意的编辑和整理。
李宏*:我是李宏*,来自于首都医科医院。
今天,从4个方面和大家共同分享医学影像在医疗大数据中的重要作用与应用价值,包括医学影像学的发展,医学影像学的数据内涵,医学影像在大数据的应用价值,医学影像大数据的挖掘与利用。
医学影像学的30年发展
首先是医学影像学的发展。
近30年来,医学影响技术的飞速发展,从最早的X透视到数字DR、CT、核磁共振、PET-CT、PET-核磁,催生了临床医学的二级学科医学影像学的飞速发展,在为临床提供循证医学证据方面扮演了重要角色。
随着诊查技术手段的出现、诊查能力的提升,以及多模态影像数据的综合利用,大大地提升了临床诊断的准确率、符合率,对疗效的评估和预后的管理都发挥了重要的价值和作用。
医学影像学作为临床医学的二级学科,在近30年来逐步完整完善,发生了质的变化,从单一学科的诊断,到多学科、多模态、多部位的数据综合利用、综合预测并做出客观评估。
消化神经、心血管、泌尿、生殖、头颈、骨肌、呼吸这一系列的系统理论体系指南和标准,都是由西方医学专家利用医学影像技术建立起来的。
唯独传染病这个独立病人群体的影像学理论体系指南和标准,是由我们中国放射学专家带领团队所建立起来的,在重大传染病的影像学理论体系、指南和标准方面,为世界的医学影像学方面作出了重要的贡献。
近年来,人工智能的概念,以及AI算法的升级,带动整个医学影像学进入了一个新阶段。
包括兴趣区的选定、分割与图像处理减少了图像的干扰体素,算法效率得到了提高,使结果更加精准。
在冠脉树的提取方面,AI对全局结构的理解、有效信息的补偿,以及对弱信号断裂的修复,能够达到最有效果的生成,主动去除和修复伪影,全方位三维立体地展示整个冠脉图像的形态。
血管的完整性也得到了很好的显示,多重模型的融合有效修复断裂并延长血管;动静脉的预测技术,以及动静脉交汇点的识别和分离技术,都能够更加精准、全面的显示冠脉血管的形态和真实长度。
通过计算机的深度学习,加上传统的算法,使检测的模型完成了初步的概念和命名,特别是在利用心肌分割来修正初步命名的结果。
在病灶检测方面,达到病灶精准、无缝的混合,使弱特征集联提取、难发现斑块的识别和量化情况得到了有效的解决。
在病灶分类识别方面,使多维图像实现综合分类准确分类,使弱监督、无监督的分类信息增益,实现数据样本全自动进行病灶分类识别。
从传统影像形态学向功能影像学过渡
医学影像数据的内涵是什么?
医学影像数据的内涵,从组织、骨骼、血管向器官方面的发展和延伸,从病灶的大小、形态、位置与周围组织之间的关系,到对病灶的定量、定性,这都是一系列数据的充分利用和技术的催化,使我们从形态的判断发展到对疾病病灶的定量定性,这是一个革命性的技术进步。
此外,从病灶的局部发现,向疾病的全面评估,也是我们在影像技术飞速发展的背景下所发生的一个新变化。
我们从发现局部发生巨大的病变,到整体冠脉全方位综合评估来进行定量、定性,为临床既提供了局部病灶定量,又提供了整体的、全面的冠脉病理、生理变化,为临床的整体干预、制定客观治疗方案提供了全面的真正医学证据信息,从传统的形态学诊断,向功能影像学和分子影像学的诊断过渡。
在单位组织器官内,当形成占位病变的时候,病变往往处于晚期或者中晚期,那么在临床前期机体功能代谢发生异常的时候,我们通过影像技术的手段去推测和评估病变,势必将对早期预警以及疗效评估和预后管理方面起到重要的价值和作用。
除了对于冠脉形态学的影像诊断,还可以对于冠脉的功能变化,也能够进行客观的分析,来判断冠脉血管的病理生理功能变化。比如说,冠脉周围的脂肪组织分析,以及血管浓度梯度的分析等等。
除了发现冠脉与器质性病变之外,功能型改变的一些指标,也能够为临床既提供形态学变化的诊断依据,又提供了功能型变化的医学证据。
基于影像,除了满足临床的诊断治疗需求之外,还要应用于科研。
在科研方面,我们建立了纵向研究的大数据队列,从大数据队列当中进行数据的同质化、标准化,通过深度学习发现疾病的机制和演变规律,以及早期预警指标体系的建立,这对疾病的早期预警预测和治疗方案的制定,以及预后的评估都有重要的价值和临床意义。这些技术和方法已经部分应用在临床实践中,并收到了很好的应用效果。
多元数据模型的融合有助于疾病早期预警
那么,医学影像学数据的真实临床价值如何?
我们首先要了解整个疾病发生发展的过程:每个疾病的发生都要经过基因异常,细胞表达的生物分子异常,新陈代谢异常和器官结构的异常这三步棋。
基因异常,也就是正常细胞发生了基因异常。在这个时候,基因组学会发生相应的数据特征的变化,在细胞开始增殖,甚至形成癌前期病变,形成癌灶的时候,在影像组学方面会出现可疑性的数据特征。
在晚期的时候,形成了癌灶,出现了转移,甚至死亡,在这一阶段往往是既有新陈代谢的异常,又有器官结构的异常。这一时期是“亡羊补牢”,及时诊断和治疗的收效是非常小的,患者的收益也是非常小的。
为了提高患者的生存效益,我们要在细胞表达的生物分子异常,甚至是基因异常的阶段,进行数据特征的深度挖掘、提取,在早期对疾病进行预测预警,这样势必对提高病人的生存质量,延长其生命具有重要的价值。
每一个疾病的发生和发展,都不是单一数据的表现变化,而是多组学的变化。
比如说,我们的影像组学,要与临床数据特征,蛋白质组学、基因组学、代谢组学、社会组学等等多元数据模型融合,才能够全面、客观的反映个体性的疾病发生和发展,以及预后评估,做出诊疗。
为了实现多元异构数据的有效融合,要建立纵向研究队列的大数据,并进行多中心数据均质化与过滤等等,以对数据质量进行控制,才能够保证我们在数据模型当中得到接近真实世界的数据。
以肺部感染为例,我们在形态学上,为了验证影像学的特征,一定要进行解剖和病理,验证影像学的发生、发展和结局,并且要意识到在同一器官多病原体感染的这种现象。
在免疫低下或缺陷的情况下,往往会出现多病原体同时感染。比如说,既有真菌感染,又有巨细胞病*感染。我们通过解剖和病理的交叉验证,要知道哪一种病原体感染是目前患者的主要矛盾,需要临床上亟待去干预的。
所以要透过现象看本质,要抓住影像表现的特征,与临床数据、实验室数据综合预测预警。
以HIV感染相关认知障碍的研究方向为例,在临床可逆转期时,因为没有发生形态学的改变,我们无法做出形态学的诊断。
我们通过深度学习的办法研究发现,HIV神经元损伤是“先轴索,后髓鞘”的神经损伤机理新学说,突破了传统的神经元损伤机理“先髓鞘,后轴索”的学说,这一成果重新塑造了HIV神经元损伤机制学说。
那么在传染病防治学领域内,我们目前也开展了HIV相关神经认知障碍方面的深度研究——基于HIV感染灵长类恒和猴的透明脑技术模型,以及影像基因组学技术的模型而开展。
这样的话,我们从形态影像学、功能影像学、分子影像学,到透明脑的高通量3D可视化的成像方面,进行了一个全长轴、全链条的完整数据链的系统研究。
这是我们脑成像的集行为学,形态影像与分子影像的一个融合,来反映出不同功能脑区和基因表达之间的关联,这样更有效地分析脑区在临床时期所发生的病理、生理变化和数据特征,来对HIV脑组织损伤的不同临床阶段进行预警预测。
那么在HIV感染灵长类模型透明脑技术方面,我们进行高通量的3D可视化成像,与中科院的深圳脑院研究院对灵长类的混合模型进行有效的结合,这样来实现对神经元的3D可视化成像,了解神经元损伤的结果进行定量和定性,那么我们能够更好地去理解神经元损伤的一些机制和变化。
第二个案例是针对H1N1甲型流感肺炎影像学多元异构数据的交叉融合。
我们通过多模态的数据分析进行交叉验证,来验证基于临床分期以病原病理为基础的影像学分级诊断模式——不管这个疾病在任何一个临床分期来就诊,我们都可以通过形态学的诊断来作出判断。
加上深度学习和AI的融合,这样避免了人为的诊断,我们能够更加高效、快速、精准地通过AI来实现对甲型流感肺炎的分级诊断。
案列三是COVID-19病理影像特征的关联机制验证。
在第一时间,我也亲自解剖了三具新冠肺炎患者捐献者的尸体,让我们通过解剖尸体和病理组织分析来验证病灶的大小、形态、位置,以及在早期、进展期、重症期不同阶段,它的影像学变化和病理变化的关联性,来寻找这个疾病发生、发展的演变规律,为在任何一个临床时间节点给临床提供一个干预的客观证据。
影像基因组学与AI的结合
接下来,是医学影像学大数据的挖掘与有效利用。
医学影像学大数据价值的深度挖掘,包括三个方面。
第一个方面是管理智能化,对于数据库的管理实现智能化、流程化、程序化,避免因为惯例、人为因素所导致的数据误差;
挖掘智能,包括病灶的自动分割以及特征的自动提取;
分析应用智能,是通过对特征的分析以及统计模型的训练,从而实现对个性化病案的预测,且对于疗效的评估、生存的预后曲线显示都发挥了重要的临床作用。
我们要想做好正确的、客观的、科学严谨的综合临床评估,就必须要有一个规范、标准的数据信息集。
以肝癌为例,我们要建立一个研究队列,通过研究队列,包括临床队列和社区队列来采集相关的原始数据,包括流行病学、家族遗传病史、临床症候学、检验学、影像学、病理学等等这些信息。
对于这些多元异构数据信息进行聚合,建立模型进行处理,然后才能够筛查出来新的预警指标体系、替代指标体系,产生对机制的解释,发现新的药物干预靶点,以及疗效评估和预后评估。这些都是临床大数据样本数据信息的重要临床价值和作用。
核心关键问题是影像多元异构数据的质量控制,没有有效的质量控制,就不可能建立一个正确的模型,也不可能训练出来一个很好的临床象征。
因此,我们从制定方案开始,到参与研究人员的培训,质控计划,质控指标,督导整改,指标复查,专项梳理和持续改进,通过这样一个闭环管理模式,来实现对于医疗大数据的质量控制。
我们建立大数据,并引入人工智能技术,在AI的辅助下,进行深度学习的大数据分析,这样势必将提高我们的工作效率,提高我们的临床效能,能够及时、高效地受益患者。
在此基础上,影像大数据深度利用,包括对基因组学的研究。
因为传统形态影像学的诊断模式已经不能够满足精准医学治疗条件的要求,所以我们将无创深度学习放射组学技术与基因组学技术,整合成放射基因组学技术,并与AI结合,形成了一个非传统的数据分析技术模式和临床应用模式,来实现对疾病的无创精准治疗。
下面这个模型,就是基于CT、MRI、PET的多模态影像,与DNA基因组学、核酸代谢组学,蛋白质组学等等进行交叉验证,发现它们的关联性,交叉验证,最后得出一个新的对综合预测的替代指标体系,对疾病进行定量、定性。
影像基因组学与AI结合,是形态影像学的发展和延伸,它的好处主要是能够提高我们的工作效率,解决肉眼看不见的疾病,并且能够实现在没有症状没有体征的情况下也能够诊断疾病,提升筛查与诊断的精准度,提升治疗效果的评价指标,对于提升我们的治疗效能发挥了重要的作用。
传染病影像基因组学的研究方向方面,同样也需要数据的有效采集,包括ROI的选取,相关基因组学模型的融合交叉验证,进行融合模型的分析。这对机制通路的解释,生存率的评估,精神分级诊断的实现,或者是对疾病的预测,都发挥重要的价值和作用。
传染病放射影像学基因组学,它是基于图像信息与基因组学信息,蛋白质组学信息的宏观表型假设,但单纯的大量高通量特征偏离了生物学的意义。
因此,影像组学和基因组学的融合,从生物学的意义方面,包括基因组学,影像组学,局部的病理组学,以及最原始的生物标志物表达等等这些信息的融合,才能够全面反映整体的生物学临床意义,才能够全面客观的反映疾病的特征。
也因此,我们前期的AI仅仅是基于影像与数据特征对疾病进行预警预测,要想实现精准诊疗是不可能的,它是偏离了生物学的意义。
在传染病影像基因组学与AI结合的同时,我们也在传染病防控方面进行了靶向探针合成的研究。
第一项靶向探针合成研究,我们针对HBV乙肝病*相关的肝纤维化的早期诊断方面,合成靶向HSC的光学和MR双模探针体外及体内试验验证。
第二项,我们就肝癌诊疗一体化的探针合成进行研究,体外与体内实验验证了探针对纤维化、对肝癌都有较好的效果,最终将实现诊断和治疗一体化的诊疗模式,减少病人的周转环节,高效地提升患者的生存质量,延长其生命,具有重要的价值和临床意义。
最后,进行概括总结:
对于个性化的疾病,要想实现精准诊疗,诊断必须先行,没有精准的诊断,治疗是盲目、无效的。
宏观影像和微观分子水平数据特征可视化的有效结合,才能够全面客观地反映疾病的生理、病理以及不同临床分期的全程变化。
对于疾病的早期预警,是我们一致梦寐以求的目标,只有早期预警诊断,才能够使病情逆转和治愈,此外对于预后评估、临床的干预措施,也是发挥重要的价值和作用。
多元数据所蕴含的信息量要远远大于单一的临床数据信息。多元异构数据的结合融合,模型的融合,通过深度学习能够实现对于疾病的一致解释,以及预警指标体系的替代指标体系的建立,才能够实现对疾病的综合预测。
最终,我们所有的工作都将受益于我们的患者,谢谢!雷峰网雷峰网