利用计算机辅助黑色素瘤检测
最致命的皮肤癌是黑色素瘤,2017年美国将有9000多人死于黑色素瘤。黑色素瘤在癌症中是独特的,因为它出现在皮肤表面,是一个可见和可识别的标记,不像乳腺癌、肺癌或结肠癌,它们的发展是隐藏在我们的视线之外的。这将表明,计算机视觉在面部和物体识别等视觉识别任务中已经证明与人类相当,将非常适合用于帮助黑色素瘤的早期检测。然而,医生和患者仍然依靠他们的肉眼来识别黑色素瘤。这就引出了一个显而易见的问题:为什么计算机不能辅助人眼检测黑色素瘤呢?
原因,在我看来,不是由于计算机视觉技术的不足或先天的复杂性黑素瘤检测。相反,迄今为止最大的障碍是医学界无法生成大型、设计良好的公共皮肤图像数据集,以及训练系统进行准确检测所需的元数据。这一数据集瓶颈阻碍了大规模、有意义的计算机辅助黑色素瘤检测研究,也阻碍了对那些有幸获得非公开皮肤图像数据集的研究人员开发的少数算法进行比较研究。在这种环境下发表的研究助长了当今医学界存在的持续的“复制危机”;如果数据集隐藏在私人竖井中,独立研究人员就不可能再现(或改进)结果。
国际皮肤成像合作组织(ISIC)正在着手解决这一未满足的需求,方法是创建一个大型、开源、高质量、带注释的皮肤图像公共档案。目前,ISIC档案包含超过13000张图片皮肤损伤其中包括1000多张黑色素瘤图像,其长期目标是收集来自多种成像方式的数百万张图像,供:(a)医生和教育工作者用于改善皮肤癌的教学和识别,(b)普通公众用于自我教育,以及(c)计算机视觉科学家用于开发和测试皮肤癌检测算法。
使用来自ISIC档案的数据集,我们来自纪念斯隆凯特琳癌症、埃默里大学、IBM研究中心和Kitware, Inc.的学术-行业团队在捷克共和国布拉格举行的2016年生物医学成像国际研讨会上组织了第一次国际黑素瘤图像检测挑战。25个团队参与其中,我们最近在《美国皮肤病学会杂志》上发表了我们的研究结果,将自动化计算机算法的表现与专门从事皮肤癌检测的皮肤科医生进行了比较。在这项挑战中,皮肤科医生的平均表现与顶级计算机算法的黑色素瘤诊断准确性相当,但被使用16种算法预测的机器学习融合算法超越。
基于这些结果,我是否预计在未来5-10年内会被电脑取代?不,有两个原因:1)这项研究有一些局限性,包括没有对人类人口和可能的疾病进行完全多样化的代表,2)临床医生使用和使用图像识别以外的技能。我们的研究有许多局限性,并且是在高度人工的环境中进行的,与涉及患者的日常临床实践不太接近。
例如,在检查可疑的皮肤病变时,皮肤科医生不仅会考虑相关的临床资料,如年龄、病变史/症状、过去的个人或家族史皮肤癌以及病变相对于患者其他皮肤病变的外观的情况,但也可能触诊其质地,用外用酒精擦拭,调整照明,或重新放置患者。这些额外的病史和体格检查因素对黑色素瘤诊断的贡献尚不清楚,但可能是重要的,不幸的是,我们无法将这些数据纳入我们的研究。皮肤科医生在检查患者时也会考虑数十种可能的诊断(以及他们的决定可能带来的医学、心理、美容、财务和法律后果),在计算机挑战中,我们只测试了两种诊断,黑色素瘤和痣。
尽管如此,在将我们的数据集提供给更广泛的科学界之后,我希望我们的努力代表了一条新的、透明的前进道路,可以激发医学专家对黑色素瘤检测的兴趣电脑视觉的社区。与此同时,我将继续与我的同事们合作,在ISIC档案中建立更大、更多样化的数据集,这将加速黑色素瘤检测深度学习方法的发展,并更紧密地复制检查时遇到的挑战皮肤患者的病变。我们最近结束的2017年挑战是朝着这个方向迈出的一小步,但还有很多工作要做。
更多信息:Michael A. Marchetti等人。2016年国际皮肤成像合作国际生物医学成像研讨会的结果:比较计算机算法与皮肤科医生从皮肤镜图像诊断黑色素瘤的准确性,美国皮肤病学会杂志(2017)。DOI: 10.1016 / j.jaad.2017.08.016