天天看点

中国人工智能学会通讯——人工智能在各医学亚专科的发展现状及趋势 1.3 人工智能在各医学亚专科的发展态势...

1.3 人工智能在各医学亚专科的发展态势

1. 人工智能在眼科领域的应用

2016年11月,Google的研究者Gulshan博士等人在美国医学协会杂志“Journal of the American Medical Association”上发表的一篇文章,运用deep learning算法(卷积神经网络(convolutional neural network,CNN))诊断糖尿病视网膜病变(diabetic retinopathy, DR),并对其进行分级[7]。经过专业测试,该算法的工作效率远远超过眼科医生,且准确度达到高年资眼科专家的水平。在美国以及全球范围内,DR是导致视力丧失的主要原因。世界卫生组织(World Health Organization,WHO)报道,全球有超过1亿的糖尿病患者面临双眼失明威胁。自动分级筛查DR益处在于,提高效率,具有可重复性,覆盖筛查程序;通过早期检查和治疗,可改善患者预后。为最大限度提高自动分级的临床实用性,开发针对筛查DR的算法是必要的。该研究首先使用训练数据集(n=128 175)训练机器学习算法,然后采用2个独立的数据集(EyePACS-1,Messidor-2)来“测试”这一算法。EyePACS-1数据集由4 997名患者(平均年龄为54.4岁,62.2%为女性)的9 963张图像组成;Messidor-2数据集由874名患者(平均年龄为57.6岁,46.2%为女性)的1 748张图像组成。根据WHO临床分型,DR分为5种类型,即无明显DR、轻度非增生性DR、中度非增生性DR、重度非增生性DR以及增生性DR。该算法系统通过2个基准(一个选择高特异性,则另一个选择高灵敏度),来评估该算法在筛查DR时的灵敏度和特异性[7]。

Gulshan博士等人与美国、印度的医生合作,组建用于算法模型训练的图片开发数据集(>128 000张)和用于测试的图片验证数据集(9 963张),并与8位眼科专家的诊断结果对比。经过F-Measure(召回率和准确率的加权调和平均值),8位眼科医生F-Score的中位数值是0.91,经过训练的计算机系统获得的F-Score值(maximum value:1)是0.95。基于深度学习算法筛查DR具有相当高的准确性(特异性和灵敏度)。该研究真正开启了“AI+医疗”的新世界。这一研究的优势显著,包括高端技术的应用、大量视网膜图像的数据集、基本优于指南推荐的性能指标(灵敏度、特异性和准确性)[7]。

2017年1月,中国中山大学中山眼科中心林浩添等在“Nature Biomedical Engineering”期刊上撰文公布研究成果。研究者利用CNN算法识别先天性白内障(Congenital Cataract, CC)。用于算法模型训练的图片开发数据集:正常照片476张,CC照片410张(根据不同严重程度进行了严格区分,并给出了详细的治疗意见)。之后进行了电脑模拟测试、临床试验(57个样本)、网络图片测试(53个样本)多项验试。该算法系统的测试成绩非常出色。

2. 人工智能在皮肤科领域的应用

2017年1月,来自斯坦福大学电子工程科的Esteva教授与皮肤科Novoa教授等在世界顶级期刊“Nature”杂志撰文并登上当期Nature的封面[8]。他们的研究采用了深度学习(deep learning,DL)卷积神经网络(convolutional neural network,CNN)算法,来识别诊断皮肤图片。该研究大致分为3个步骤:①预训练,即利用网络在线开源图片识别数据集ImageNet(>128万张)初步训练算法系统。②本地图片调整(129 450张照片其中包括3 374张皮肤镜图片)。该算法的训练只有照片标签和原始图片数据,属于end-to-end模式,用一种统一的模式同时辨别一般照片和皮肤镜图片。③算法系统的测试和验证(用新的经过取活检病理证实为皮肤癌的病灶照片和正常照片)[8]。该AI算法系统与皮肤病学专家进行诊断比试,首先鉴别诊断脂溢性角化病与角化细胞癌,然后鉴别诊断皮肤痣与皮肤恶性黑色素瘤。两场比赛中,AI系统的表现都胜过皮肤病学专科医生[8]。

3. 人工智能在呼吸科领域的应用

来自比利时鲁汶大学的Wim Janssens学者等在2016欧洲呼吸协会国际大会(European Respiratory Society's International Congress)上发表的一篇最新研究成果表示,AI可大大完善肺功能检查(pulmonary function test, PFT)的结果分析——准确度。所涉及的指标包括用力肺活量(FVC)、第一秒用力呼气容积(FEV1)、第一秒用力呼气量占用力肺活量比值(FEV1/FVC)、呼气峰值流速(PEF)、用力呼气中期流速(MMEF75/25)、50%肺活量时的最大呼气流速(MEF50)、最大通气量(MVV)、最大肺活量(VCmax)、肺总量(TLC)、残气量肺总量比值(RV/TLC)、每分钟静息通气量(MV)、通气储备功能(BR)、气道阻力(Raw eff)和比气道传导(sGaw eff)等。此类检查结果的分析,绝大多数依照国际统一标准,并遵照呼吸科专家的共识,最后从分析结果中找出最优化的诊断模式。

此新研究共收集986名测试者接受首次完整肺功能测试的所有测试数据,诊断分析采用所有测试者的肺功能测试和其他相关必要检查(如CT、ECG等)的综合分析结果,最终由临床专家统一作出一致的诊断结论。同时,此研究团队研发了一种新的算法,它能将肺功能测试和临床变量数据(吸烟史、BMI以及年龄等)进行系统处理,是以肺功能数据和临床数据的模式为基础,指导诊断并提高诊断的准确率。这项研究成果的亮点在于,此算法能够模拟临床专家复杂的临床推理过程,使其能够用来作出临床诊断,具有标准化、客观、消除偏差等优势。应用此方法最大的好处是使肺功能检测结果分析的过程更加自动化、准确化、效率化,它不仅能够帮助经验不足的临床住院医生,更能减少不必要的临床检查、检测费用,使得到最终临床诊断结果的过程更快、更准,进而提高整个医疗过程的效率。这个研究团队将应用这个算法在不同的病人群体中进行测试,进而使验证的肺功能检测数据不断更新,提高这一系统的临床决策能力。

4. 人工智能在放射科领域的应用

所谓AI在医疗放射科领域的应用主要是将AI技术应用在具体的医疗影像的诊断分析上,它包括两个组成部分。首先是图像识别,主要应用在感知环节,提取医疗影像这一非结构化数据中具有临床意义的信息数据;然后是深度学习,主要应用在分析学习环节,此为AI技术医疗影像应用的核心环节,它可以集成应用大量的影像和临床诊断数据,不断地深度学习训练神经网络,可以使其掌握“医疗诊断”的能力。具体而言,AI技术在医疗影像数据的挖掘和分析过程主要包括数据预处理、图像分割、特征提取和匹配判断。临床医生在读片的过程中,首先是对医疗影像图像的认知。在心理学上看来,这个过程的关键是模式和识别能力。模式是将当前看到的图像与记忆中有关的参照物(模板、原型、特征等)进行对比,典型的模式有模板匹配模式、原型匹配模式、特征分析模式、傅里叶模式等。具体而言,放射科医生在读片时,会快速搜索大脑中的典型医学影像学形态,做出判断。放射科医生的阅片经验相当于他大脑中对每一张图像的记忆存储,AI实际上是模仿人类医生阅片模式[9-10]。

放射科领域成为医疗AI进军的突出领域的优势在于:①影像数据获取更容易。医院放射科一般会存储患者历次影像学资料(CT、MRI、MRA、DSA、PET-CT等),调取容易,费时少,数据量大。通常完成一份完整的结构化病历需要花费很长的时间,耗费更多的人力和精力,难度大;何况我国大部分的病历数据为非结构化数据,将其结构化处理是一项非常棘手耗时的工作。②影像数据处理难度更小。一份完整的住院病历至少要包括入院记录(病人基本信息、主诉、现病史、既往史、婚育史、家族史、过敏史、手术史、系统回顾、体格检查、初步印象等),首次病程、查房记录、治疗记录、手术记录、术后病程、恢复情况等多个方面,而放射科领域的数据仅仅是一张CT片子或核磁共振片子。③放射科数据重要。放射科影像信息可以在客观上直观反映病人病情,是临床医生做出诊断和临床决策的重要且较直接的依据[9]。

5. 人工智能在病理科领域的应用

用深度神经网络来识别病理图片,即使不考虑并行处理和计算加速,阅读一张病理图片不超过40 秒。受能力限制,人类病理医生的读片量有限,经验的积累也有限。一张病理图片的阅读时间可能是几分钟,也可能一整天。贝斯以色列女执事医学中心(Beth Israel Deaconess Medical Center, BIDMC)与哈佛医学院合作研发的人工智能系统,对乳腺癌病理图片中癌细胞的识别准确率能达到92%,虽然还是低于人类病理学家96%的准确率,但当这套技术与病理学家的分析结合在一起时,它的诊断准确率可以高达99.5%,国内的DeepCare对于乳腺癌细胞识别的准确率也达到了92%。据悉尼先驱晨报的报道,Enlitic凭借深度学习技术超越了4位顶级的放射科医生,包括诊断出了人类医生无法诊断出的7%的癌症,以及在人类医生高达66%的癌症误诊率的情况下,Enlitic的误诊率只有47%[11]。

2017年,来自美国密歇根大学医学院神经外科的Orringer教授等在“Nature Biomedical Engineering”上发表了一项关于脑瘤术中快速诊断的研究。研究者采用一项叫做受激拉曼散射显微镜(Stimulated Raman Scattering, SRS)的技术,生成高度模拟传统的HE染色病理切片的新图像,称之为受激拉曼组织学(Stimulated Raman Histology, SRH)图像。病理医生对SRH图像和传统HE图像做了比较,确认了SRH的诊断作用。算法叫做多层感知机(Multilayer Perceptron, MLP),更适应目前常用的计算机的处理能力。研究者用来自101名患者的12 897张SRH高倍视野图片建立训练库,同时也加入了一个外部的开源图像数据库WND-CHRM的2 919张图片,让MLP进行迭代,直到诊断的预测值和观察值差距最小。MLP根据神外医生做出决策的需要,对图像进行非病变组织、低级别胶质瘤、高级别胶质瘤和非胶质肿瘤(包括转移瘤、脑膜瘤、淋巴瘤和成神经管细胞瘤)四种分类。用了30个案例对MLP进行验证,结果它在样本层面能做到100%区分病变和非病变;对单个显微视野的识别则能达到94.1%的特异性和94.5%的灵敏度。在病变样本中,MLP能以90%的准确率区分胶质瘤和非胶质瘤。