基于MATLAB的医学影像数据迁移学习的实现
胸腔,积液,阴性,1资料与方法,1研究对象,2实验环境,3选择卷积神经网络模型,4加载图像并读取数据集,5分割数据集与建立网络,6训练网络,2结果,1数据集,2混淆矩阵分析,3AUC计算,3讨论
黄夏璇,黄 韬,袁师其,何宁霞,武文韬,吕 军1. 暨南大学附属第一医院神经内科(广州 510630)
2. 暨南大学附属第一医院临床研究部(广州 510630)
3. 西安交通大学公共卫生学院(西安 710061)
近年来,基于深度学习的计算机视觉技术越来越多地应用于临床影像数据的分类和识别。在深度学习和机器学习领域,不论是数据还是模型都可进行一定的迁移,尤其是在某些应用场景下,如目标数据量较大但标注的数据样本较少时,机器可依靠模型的迁移捕捉到其他数据集中与目标数据集共享的参数信息,并将其迁移至目标数据集中,进而加强深度学习训练模型识别图像的能力[1]。迁移学习(transfer learning)作为一种机器学习方法,可将模型学习到的知识从源领域迁移至另一个目标领域,使得模型可以更好地获取目标领域的知识。迁移学习的方式包括基于样本的迁移、基于特征的迁移、基于模型的迁移以及基于关系的迁移四类。目前应用相对广泛的是通过源领域的数据和目标领域的数据空间模型对共同参数实现知识的迁移,即在已有的数据集中把训练好的数据集进行初始化,把结果迁移到需要学习的数据集中,并通过卷积神经网络(convolutional neural networks,CNN)提取图像特征(包括颜色或边缘等)进行训练,以达到提高识别图像准确率的目的[2]。MATLAB作为一款科学计算软件,拥有丰富的数据类型和结构、精良的图形可视化界面以及针对图像数据进行分析等的应用工具。相对于难以实现图像数据准确分析的传统计算机辅助诊断(computer-aided diagnosis,CAD)[3],基于传统机器学习方法的MATLAB迁移学习,更易对图像进行特征提取和自动化分类,从而为医学图像共性提取提供更好的平台。本研究以具体的图像数据为例,介绍如何使用MATLAB软件实现迁移学习。
1 资料与方法
1.1 研究对象
本研究以MIMIC公共数据库中的MIMIC-CXR数据库为例,该数据库是由Johnson等于2019年1月发布的一个包含放射学报告的大型胸部X射线影像公开数据集,其不仅将DICOM的影像格式转换为 JPEG格式 ......
您现在查看是摘要页,全文长 8620 字符。