融合空间和多尺度特征的乳腺癌免疫组化Ki-67指数定量分析9293.pdf

上传人:得** 文档编号:75454029 上传时间:2023-03-03 格式:PDF 页数:17 大小:2.02MB
返回 下载 相关 举报
融合空间和多尺度特征的乳腺癌免疫组化Ki-67指数定量分析9293.pdf_第1页
第1页 / 共17页
融合空间和多尺度特征的乳腺癌免疫组化Ki-67指数定量分析9293.pdf_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《融合空间和多尺度特征的乳腺癌免疫组化Ki-67指数定量分析9293.pdf》由会员分享,可在线阅读,更多相关《融合空间和多尺度特征的乳腺癌免疫组化Ki-67指数定量分析9293.pdf(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、融合空间和多尺度特征的乳腺癌免疫组化Ki-67 指数定量分析 国际癌症研究机构发布的 2020 年全球癌症统计数据显示,乳腺癌已成为女性最高发的恶性肿瘤(新增病例在所有肿瘤中占比 11.7%),每年可导致 68.5 万病例死亡1。准确诊断是精准治疗的前提。Ki-67 是乳腺癌诊断过程中常用的免疫组化标志物,是评估肿瘤细胞增殖活性的关键指标,Ki-67 指数可作为乳腺肿瘤良恶性及其恶性程度的辅助诊断指标。一般情况下,乳腺癌的 Ki-67 指数高于 10%,随 Ki-67 指数升高,肿瘤生长加快、组织分化能力降低,患者预后较差2。目前临床工作中,Ki-67 指数大多需病理医生通过显微镜对肿瘤细胞进

2、行人工计数获得3;部分研究通过浏览整张免疫组化染色的全视野数字图像(WSI),采用视觉评估法计算 Ki-67 指数2。上述方法工作量大、效率低、准确率差且具有主观性。2019 年 10 月,国际乳腺癌 Ki-67 工作组(IKWG)召开会议,讨论了 Ki-67 免疫组化检测在乳腺癌诊断与治疗中的应用现状4,指出基于机器学习的自动化评估可能有助于解决当前 Ki-67 免疫组化判读中的难题2,4-5。当前,深度学习在病理图像处理领域已取得了显著成效6-8,自动化评估Ki-67 指数亦取得重要进展。根据病理图像的处理方式,大致可分为两类:一类是基于图像处理技术,一类是基于机器学习和神经网络。Xing

3、 等9提出了一种基于全卷积网络的 KiNet 模型,对Ki-67 细胞核进行检测和识别,并在胰腺神经内分泌肿瘤数据集中得到了良好的分类效果验证,曲线下面积(AUC)为0.724。Negahbani 等10利用点标注的方式制作了SHIDC-B-Ki-67 数据集,并提出一种用于 Ki-67 细胞检测和分类的模型,对免疫阳性细胞、免疫阴性细胞和淋巴细胞检测和分类的精确度为 77.66%。Shete 等11将基于染色强度的阈值化和分水岭分割方法相结合,依据细胞染色区域面积、细胞形态学特征、纹理特征等实现了对乳腺肿瘤细胞恶性程度自动化检测。Ko 等12对图像进行染色归一化,分离染色区域后实现重叠细胞核

4、分离,改善了不同实验室或环境中由染色变化引起的图像处理问题。但上述研究均是在单个图块上对 Ki-67 指数进行定量分析,并将部分区域定量分析的结果代替整张 WSI 的 Ki-67 指数。本研究提出一种智能化定量分析 Ki-67 指数的方法,可识别整张 WSI 中的 Ki-67 指数,提高 Ki-67 指数评估的准确性和客观性。1 资料与方法 1.1 研究材料与数据集分组 回顾性纳入 2020 年 1 12 月北京协和医院乳腺癌患者的病理切片。纳入标准:根据组织病理和免疫组化结果,确诊为乳腺浸润性癌;排除标准:切片质量不合格。采用德国 Leica 公司 Aperio AT2 高通量切片扫描仪将病

5、理切片以 40 倍率扫描为 WSI 图像。由 2 名病理科医生根据 2019 年 IKWG 制定的指南4对所有 WSI 中的 Ki-67 指数进行人工判读后,按 5:8 的比例随机将 WSI 图像分为 A、B 两个数据集。2 名病理科医生选取 WSI 中 Ki-67 阳性肿瘤细胞最集中且分布均匀的区域(热点区域,图 1)对 A 数据集进行标注,用于 WSI 热点区域识别模型训练与测试;B 数据集用于评估模型对 Ki-67 指数计算结果的准确性,并采用Bland-Altman 法13对人工判读与智能定量分析结果进行一致性评价。图 1 乳腺癌 Ki-67 指数免疫组化病理图像标注示例 A.热点区域

6、;B、C.正常组织区域 本研究已通过北京协和医院伦理审查委员会审批(审批号:S-K311),并豁免患者知情同意。1.2 方法 1.2.1 整体研究框架 本研究提出的 Ki-67 指数智能化定量分析方法主要包括2 个部分(图 2):(1)提出一种融合空间和多尺度特征的高精度乳腺癌 WSI 热点区域识别模型;(2)在识别出的热点区域内,40 倍视野下随机选取每张 WSI 的 10 个视野进行自动细胞识别、分类、计数,计算 10 个视野下的 Ki-67 指数均值,为整张 WSI 的 Ki-67 指数。图 2 Ki-67 指数智能化定量分析方法整体框架 WSI:全视野数字图像 1.2.2 图像预处理

7、由于 WSI 制作、扫描过程中可因抖动、电子脉冲干扰等因素的影响,导致图像失真、模糊,在分析前需进行预处理。结合实际情况和预试验比较结果,借助 Opencv-Python 库并采用高斯滤波对图像进行去噪、平滑图像、去除空白背景等处理14。由于在 HSV(Hue,Saturation,Value)颜色空间中分析更方便,首先根据公式(1)将原始图像从 RGB 颜色空间转换至 HSV 颜色空间,然后基于 Otsu 算法15获取二值化的组织掩码,并进行形态学开闭运算,提取组织区域图像。其中,R、G、B 分别表示红色、绿色、蓝色,取值范围均为0,255;H 为色调,取值范围为0,1;V 为明度,取值范围

8、为0,255。1.2.3 提取热点区域掩码与图块 按 7:1:2 的比例将 A 数据集随机分为训练集、验证集和测试集。采用 ASAP(Automated Slide Analysis Platform)软件对热点区域进行标注,然后提取热点区域掩码图像。用组织区域图像减去热点区域即可获取正常区域掩码图像。在2 种图像内部,将原始 WSI 图像于 40 倍视野下随机裁剪为2000 个 512512 像素的图块(patch)。在上述图块中随机选取 50 个,对其中的 Ki-67 阳性肿瘤细胞、阴性肿瘤细胞和非肿瘤细胞进行标注(Ki-67 指数的计算仅包括肿瘤细胞,若不排除非肿瘤细胞,Ki-67 指数

9、将偏低),见图 3。标注后,计算 Ki-67 指数16。图 3 热点区域内图块标注示例 A.热点区域内随机选取的图块;B.标注结果,其中实心圆为 Ki-67 阳性肿瘤细胞,实心矩形为 Ki-67 阴性肿瘤细胞,“X”为非肿瘤细胞 1.2.4 热点区域识别 WSI 可完全保留病理切片上的原始组织特征信息,对于数据量巨大且缺乏像素级的标注,病理医生可通过缩放、拖拽、平移图像的方式浏览整张 WSI 图像。在作出诊断决策时,需同时考虑单个区域相邻的信息和不同区域之间的相关性信息,最后确定整张 WSI 图像的 Ki-67 指数8。常用的病理图像分类深度学习方法,一般是将一张数万数万像素的 WSI 切分为

10、数万张图块,通过病理医生对热点区域的粗标注引入医学先验知识17,此时数万张图块对应一个标签,然后采用 VGG18、ResNet19、MobileNet20等卷积神经网络模型对图块进行分类21。此种分类方法会导致图块在整张 WSI 图像中的空间位置信息丢失,无法融合相邻图块的信息和空间位置信息。针对该问题,本研究采用一种融合空间和多尺度特征的乳腺癌WSI热点区域识别方法,即条件随机场模型22(图4A)。条件随机场模型是 Lafferty 等23于 2001 年提出的将最大熵模型和隐马可夫模型相结合的一种概率无向图模型。该模型在自然语言处理中的命名实体识别任务以及计算机视觉中的图像分割任务等领域均

11、有广泛应用。图 4 图块之间的概率无向图模型示意图 在概率无向图模型中,随机变量之间的关系较直观,易于理解。在实际应用时,目的是计算联合概率分布。为简化计算,假设将 WSI 中的图块设置为 X1、X2、X3Xn,若一个图块为热点区域,则其相邻图块为热点区域的概率很大(图 4B)。进一步对图块的关系简化(图 4C),并根据公式(2)计算模型的联合概率分布。1.2.5 模型构建与相关参数设置 经图像预处理获取热点区域和正常组织区域的图块后,将训练集和验证集图块输入至 ResNet34 预训练模型19进行特征提取。每个图块被编码为固定长度的 Embedding,作为概率无向图模型中的节点进行空间特征

12、维度建模。模型可输出每个图块的位置分布概率,用以判定特定图块是否位于热点区域。高精度乳腺癌 WSI 热点区域识别模型框架见图 5。图 5 乳腺癌 WSI 热点区域识别模型整体框架图 WSI:同图 2 硬件参数:Linux 版本为 CentOS 3.10.0693.el7.x86_64,CPU 版本为Intel(R)Xeon(R)*,显卡为 NVIDIA GeForce RTX 2080 Ti(显存容量 11 GB,显存位宽 352 b,显存频率 14 000 MHz),内存为 32GB 2666 MHz DDR4。软件环境:编程语言为 Python 3.6.5,相关的深度学习框架为 Torch

13、,CUDA 及 cuDNN 环境分别为 10.0 和 7.4,CPU环境运行下的编译器为 GCC 4.8。Python 计算包:Torchvision 0.4.2,Opencv-Python 4.5.1.48,Openpyxl 3.0.9,Openslide-Python1.1.2。模型训练时的参数:Batch Size 为 32,优化器为 Adam,学习率为 0.001,损失函数为 Cross Entropy,Epoch 为 30。1.2.6 热点区域识别与肿瘤细胞自动计数 WSI 输入经过训练的 ResNet34 热点区域识别模型,获取热点区域概率热力图,其中概率高于 0.5 的区域认定为

14、热点区域。在热点区域内,40 倍视野下随机选取 10 个视野进行Ki-67 指数计算。首先对输入的 RGB 图像进行预处理,然后按照公式(3)将 RGB 值转换成光密度(OD)空间:其中,I 为 RGB 空间的颜色矢量,为其归一化后的结果,即标准化 OD 矩阵24,取值范围为0,1。OD 矩阵的逆矩阵即为所需的反卷积矩阵。Ki-67 免疫组化染色图像中感兴趣的颜色为蓝色(H)和棕色(DAB),其中棕色由黄色或橙色(红色+绿色)与较低比例的黑色或蓝色混合组成。由于棕色的主要成分为红色和绿色,与 H 相关的颜色以蓝色为主,因此可采用颜色反卷积法25分离、区分 DAB 和 H 染色。由于细胞之间存在

15、重叠现象,需采用基于距离变换的分水岭算法对颜色反卷积法获取的二值化图像进行处理,具体算法如下:首先将颜色反卷积后的图像转换为灰度图并进行开闭操作,以消除边界上的干扰;然后对灰度图进行距离变换,将粘连的细胞“打断”;最后进行膨胀和填充等操作,采用基于连通分量的方法分别对 Ki-67 阳性肿瘤细胞、Ki-67 阴性肿瘤细胞和非肿瘤细胞进行自动标记和计数,计算 Ki-67指数(图 6)。图 6 肿瘤细胞计数方法 1.3 统计学处理 采用 SPSS 23.0 软件进行统计学分析。以病理科医生人工判读结果为金标准,计算模型对热点区域识别的准确率以及识别的 Ki-67 指数误差,误差在0.2 之间视为模型

16、计算结果正确。采用 Bland-Altman 法评价人工判读和模型计算Ki-67 指数的一致性。2 结果 2.1 数据集 共入选符合纳入和排除标准的乳腺癌患者病理切片 132张。其中 A 数据集 50 张(训练集、验证集和测试集 WSI 图像分别 35 张、5 张、10 张,分别包含图块 70 000 个、10 000个、20 000 个),B 数据集 82 张。2.2 热点区域智能化识别结果 训练后的 ResNet34 模型对测试集热点区域识别的平均准确率为 81.5%。热点区域可视化结果见图 7。图 7 热点区域可视化识别结果 A.病理科医生人工标注;B.模型预测的热点区域概率热力图;C.

17、模型预测的二值热力图;D.模型预测的热点区域 2.3 Ki-67 指数定量结果 在热点区域识别的基础上,模型可根据选取的视野,自动对细胞进行分类、计数(图 8),最终计算整张 WSI 中的Ki-67 指数。以病理科医生人工判读结果为金标准,本研究该模型对 B 数据集 82 张切片 Ki-67 指数计算准确率为 90.2%(74/82)。图 8 模型对细胞分类计数结果 A.Ki-67 阳性肿瘤细胞(标注红“+”);B.Ki-67 阴性肿瘤细胞(标注绿“”);C.非肿瘤细胞(标注红“*”)2.4 Ki-67 指数一致性评价 采用 Bland-Altman 法对人工判读与模型计算的 Ki-67指数进

18、行一致性评价。Bland-Altman 法的基本思想是以原始数据的均值、差值分别为横轴、纵轴绘制散点图,计算二者差值的均数及标准差,并得出 95%一致性界限(LOA),即一致性较好的标准为 95%的差值位于该 LOA 内。如图 9 所示,82 个 Ki-67 指数差值中,78 个(95.12%)位于 LOA 范围内,4 个(4.88%)位于 LOA 范围外,均数值为-0.033 90,标准差为 0.161 882,标准误为 0.01,LOA 范围为-0.34600.2831。两种方法测定的 Ki-67 指数结果一致性较好24。图 9 Ki-67 指数一致性评价结果的 Bland-Altman

19、图 3 讨论 乳腺癌免疫组化 Ki-67 指数在治疗方案制订和预后风险评估中占据重要地位,临床意义显著。目前在临床工作中,人工判读 Ki-67 指数工作量大,结果具有主观性,亟需探寻一种高效、易操作且准确率高的 Ki-67 指数评估方法。本研究基于 ResNet34 算法,首次构建针对乳腺癌 WSI图像可自动识别并输出 Ki-67 指数的智能化判读系统,结果显示该方法对 Ki-67 指数计算结果的准确率为 90.2%,与人工判读结果一致性较好,有望应用于临床,辅助临床决策。组织病理是肿瘤确诊的金标准,病理科医生通过对病理切片进行观察,可为肿瘤诊断提供最重要的依据。免疫组化是组织病理学与细胞病理

20、学的关键组成部分,在肿瘤诊断、分子分型、精准治疗等方面均具有极大的影响力,但实际应用过程中,受判读区域选择、计数细胞总和、计数方法等因素的影响,其结果准确性、可重复性方面仍存在诸多挑战。近年来,人工智能技术快速崛起,其在医学中的应用越来越广泛,医工结合、医工交叉已成为研究的新趋势26。但既往主要针对病理图像的图块进行研究,尚缺乏直接可识别整张 WSI 图像中 Ki-67 指数的方法9-12。本研究基于深度学习技术建立的整张 WSI 图像中 Ki-67指数智能定量方法,在判读区域选择、计数细胞总和、计数方法 3 个方面均有明显改进,在保障了 Ki-67 指数判读结果的高准确率和可重复性的同时,可

21、快速(识别一张 WSI 图像平均耗时 60 s)输出结果,优势明显。3.1 判读区域选择 由于肿瘤细胞具有较高的异质性,在乳腺癌免疫组化WSI 图像中,Ki-67 阳性肿瘤细胞多呈不均匀分布,存在明显的热点区域、冷点区域和边缘区域,不同区域内的 Ki-67指数存在较大差异,其中以热点区域最高,边缘区域次之,冷点区域最低。因此,判读区域选取不同,必然导致 Ki-67指数判读结果不一致,影响结果的准确性。IKWG 建议,乳腺癌 Ki-67 指数免疫组化 WSI 中,若存在热点区域,则判读区域应选择在热点区域内26。本研究建立的融合空间和多尺度特征的高精度乳腺肿瘤 WSI 热点区域识别模型,对热点区

22、域具有较高的识别能力(平均准确率为81.5%)且速度较快,结果重复性好,是 Ki-67 指数计算结果具有高准确率的前提和重要保障。3.2 计数细胞总和 判读区域选定后,需对区域内细胞进行识别与分类,以计算 Ki-67 指数。对于细胞较少的区域,Ki-67 指数判读结果稳定性差。部分国家的指南指出,应在热点区域计数 200个肿瘤细胞进行 Ki-67 指数判读27。IKWG 建议,免疫组化 Ki-67 指数定量分析中,每个区域内以计数 1000 个肿瘤细胞为宜,至少不应低于 500 个肿瘤细胞。本研究 Ki-67 指数智能化量系统在计算 Ki-67 指数前,首先对区域内肿瘤细胞进行计数,若 Ki-

23、67 阳性肿瘤细胞数量不足 500 个,则需重新选择判读区域,因此保障了结果的准确性、稳定性和客观性。3.3 计数方法 显微镜下人工阅片对肿瘤细胞进行分类,易发生“误数”或“漏数”的现象,导致计算结果不准确。本研究构建的模型可程序化自动分类与计数,不仅结果准确(准确率为90.2%)、省时高效,且避免主观因素的影响。Bland-Altman法一致性评价结果显示,人工判读与模型计算 Ki-67 指数的一致性良好,提示该智能定量方法对 Ki-67 指数判读结果的误差较小,可达到人工阅片水平,再次验证了其具有准确性高和可重复性好的优势。本研究局限性:(1)受限于样本量,虽然模型对 Ki-67指数的评估具有较高的准确性,但模型仍可能存在过拟合现象;(2)缺乏多中心数据对模型的性能进行外部验证。综上,本研究提出的融合空间和多尺度特征的乳腺癌免疫组化 Ki-67 指数智能定量分析方法,可快速、准确、客观对 Ki-67 指数进行判读,辅助病理科医生完成乳腺癌诊断,提升了工作效率,为乳腺癌患者进行精准分子分型和个体化治疗提供科学可信的理论依据和技术支持。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com