不同基因状态的乳腺癌治疗方式和预后结局差异显著。其中,人表皮生长因子受体 2(human epidermal growth factor receptor,HER-2)状态是乳腺癌个体化治疗方案制定的主要依据指标之一,也是重要的预后预测指标[1]。目前临床在治疗前对 HER-2 状态检测主要是基于穿刺活检的免疫组织化学(immunohistochemistry,IHC)或原位杂交(in situ hybridization,ISH)检测,存在有创性和因取材不准造成的假阴性等问题。国内外学者开发了多种预测 HER-2 状态的无创生物学指标[2-7]。但这些生物学指标的准确性有待提高,且大多数尚未验证,仍需继续开发预测 HER-2 状态的生物学新指标。影像组学通过提取影像图像的海量特征,经特征筛选、构建组学标签等[8],在多种肿瘤的基因状态预测方面具有重要价值[9-15]。而超声图像是乳腺癌患者治疗前常规获取的图像资料[9, 16],具有检测方便、无创和费用较低的优点。因此,开发基于超声的影像组学标签预测乳腺癌 HER-2 状态的临床价值较高。本研究拟采用影像组学的研究方法,开发超声影像组学标签,并评价和验证超声影像组学标签预测乳腺癌 HER-2 状态的价值,以期为临床提供一种预测 HER-2 状态的生物学新指标。
1 资料与方法
1.1 资料来源
回顾性连续性收集 2020 年 1 月~2020 年 8 月我院手术后病理证实为浸润性乳腺癌的患者资料。纳入标准:① 手术前 1~2 周行超声检查且提示病灶可见;② 病理检查结果证实为乳腺癌,且报告中详细记载病灶的相关超声特征;③ 有完善的术后病理结果。本研究的开展已获我院医学伦理委员会批准(编号:GDREC 2018349H)。
1.2 超声影像采集
术前超声检查采用 SuperSonic Imagine Aixplorer 和 GE VolusonE82 多普勒超声诊断仪,实时线阵高频探头频率设置为 5~14 MHz,患者呈仰卧位,双手上举,使乳房及双侧腋窝区域充分呈现,行双侧乳腺彩色多普勒超声检查,对乳腺做纵向、横向及斜切面扫描,并对乳腺病灶区域进行多角度查扫,存储为 DICOM 格式的图像。
1.3 影像组学分析
1.3.1 病灶分割
将获得的超声影像导入 Image J 软件,分别由 2 名高年资超声诊断医师,沿肿瘤边界勾画感兴趣区域,如图 1 所示。

图 a、b 为乳腺癌 HER-2 阳性患者;c、d 为乳腺癌 HER-2 阴性患者;a、c 为原始图像,b、d 为分割图像。
1.3.2 影像组学特征提取
使用基于 python3.0 的开源软件包 pyradiomics(version 3.0)提取感兴趣区域的超声影像组学特征。特征可分为四类:① 用于描述超声图像像素强度分布情况的一阶统计量特征,如峰度、偏度、能量等;② 用于描述肿瘤病灶形状、大小的形态学特征,如病灶周长、最大 2D 直径、球形度等;③ 用于描述像素强度的空间分布或灰度的相对位置信息情况,本研究包括从灰度的空间关系表征物体纹理的灰度共生矩阵(GLCM)、计算相同灰度在不同方向上连续移动来表征图像纹理的灰度游程矩阵(GLRLM)、计算各灰度连通域的分布情况来描述纹理的灰度空间区域矩阵(GLSZM)及量化图像中灰度依赖性的灰度依赖矩阵(GLDM);④ 利用小波变换对图像进行分解与重构得到的小波特征。
针对每一个患者的超声图像,提取 1 820 个影像特征,其中包括:14 个形态学特征、18 个一阶统计量特征,68 个纹理特征和 1 720 个小波特征。
1.3.3 特征筛选与模型构建及评价
根据超声检查时间顺序,分成训练组和验证组,为保持数据的独立性,特征筛选、标签构建等流程仅在训练组中执行,验证组用于评估标签的效能。影像组学特征的筛选流程如下:① 采用组内相关系数法(intraclass correlation coefficient,ICC)评价影像组学特征的可重复性,并以 ICC>0.85 作为重复性高的评价标准;② 采用 Spearman 相关系数(r)对特征间的相关性进行评估,并以高于 0.75 视为特征间高相关;③ 采用线性核支持向量机递归特征消除算法(L-SVM-RFE),并进行五折交叉验证,选取关键、稳定特征用于构建模型。选出关键影像特征后,利用 logistic 回归构建预测 HER-2 状态的超声影像组学标签,采用使用受试者工作特征曲线(receiver operating characteristic,ROC)下的面积(area under curve,AUC)、特异度、灵敏度及准确度、校准曲线、决策曲线等指标,对标签效能在训练组和验证组中进行评价。
1.4 统计分析
采用 R 软件(version 3.5.2)进行统计分析,Kolmogoro-Smirnov 检验用于连续变量的正态分布检测,对于正态分布的连续变量以平均值±标准差表示。P<0.05 视为差异具有统计学意义。
2 结果
本研究共纳入 230 例患者,包括 HER-2 阳性 73 例,阴性 157 例。按检查时间分为两组:训练组(n=115,平均年龄:48.75±9.31 岁,HER-2 阳性 35 例)和验证组(n=115 例,平均年龄:50.77±10.92 岁,HER-2 阳性 38 例)。对每一例患者的超声影像提取 1 820 个影像组学特征,先经过可重复性分析,其中 507 个特征被剔除(0.034<ICC<0.850);对剩余的 1 313 个(0.850≤ICC<0.999)影像特征进行相关性分析,其中 1 027 个特征被剔除(0.75<r<0.96);再经 SVM-RFE 算法对剩余的 286 个特征进行筛选后,选出 9 个关键影像组学特征(表 1)。

对上述的 9 个关键影像组学特征利用 logistic 回归在训练组中构建 HER-2 状态的标签,并在验证组上进行评估。其中,超声影像组学标签在训练组中 AUC 值为 0.82[95%CI(0.74,0.90)](图 2),敏感性为 92%,特异性为 68%,预测 HER-2 状态准确性为 76%;在测试组中 AUC 值为 0.81[95%CI(0.72,0.89)](图 2),敏感性为 79%,特异性为 74%,预测 HER-2 状态准确性为 75%(表 2)。

a:影像组学标签预测 HER-2 状态的 ROC 曲线;b:影像组学标签在组内的校准曲线;c:影像组学标签在训练组中的决策曲线;d:影像组学标签在验证组中的决策曲线。

校准曲线显示超声影像组学标签在训练组和验证组中对 HER-2 状态的预测概率与真实值一致性好(P=0.13、0.31),决策分析曲线显示超声影像组学标签具有一定的临床实用性(图 2)。
3 讨论
近年来,基于超声的影像组学研究取得了迅速发展,其中以乳腺超声的影像组学研究最为多见[16]。超声影像组学在乳腺肿瘤的良恶性鉴别、分子分型、区域淋巴结转移和新辅助治疗疗效等方面显示出巨大预测价值,对临床医师制定和调整乳腺肿瘤个体化治疗方案具有重要的辅助作用[16-23]。本研究探索了超声影像组学在预测乳腺癌 HER-2 状态的应用价值,研究结果显示影像组学标签可准确预测 HER-2 状态,研究结果进一步补充了超声影像组学在乳腺肿瘤领域的应用潜能。
本研究发现,超声影像组学标签对乳腺癌 HER-2 状态的具有一定的预测价值。在训练组和验证组中,超声影像组学标签的 AUC 相似,均超过 0.80。这与邱小英等[24]研究结果不一致,该研究基于 201 个乳腺癌病灶,采用小波变换的方法提取超声图像等 843 个特征,最终选择 16 个特征构建了超声影像组学标签,结果显示基于超声的影像组学标签与 HER-2 状态没有显著相关性。而本研究采用 4 种图像特征提取方法,不但包括小波变换,还包括一阶统计学特征、形态学特征和纹理特征等。因此,本研究提取的超声影像学特征可更全面反应肿瘤的异质性,从而构建出了可用于预测 HER-2 状态的超声影像组学标签。
本研究结果显示,超声影像组学标签预测乳腺癌 HER-2 状态的效能和目前文献报道的大多数生物学指标相似[2-4, 25]。多个研究显示基于 MRI 的影像组学标签预测乳腺癌 HER-2 状态的 AUC 约为 0.79~0.81[2-4],本研究结果中超声影像组学标签的 AUC 为 0.81~0.82。Fan 等[25]研究显示基于动态增强磁共振(DCE-MRI)的影像组学标签预测乳腺癌 HER-2 状态的 AUC 达 0.86,但其样本量不足 100 例,其预测效能仍需进一步验证。此外,我们的研究基于临床术前常规超声影像检查,具有成本低、可重复性强、无创等优点。
本研究的创新点在于基于常规超声图像而构建了预测乳腺癌 HER-2 状态的影像组学标签,具有无创性、无辐射性、成本低等优点,可重复多次检测,如在治疗前、治疗后、病灶复发时,有望用于乳腺癌诊疗的整个过程。本研究的局限性为研究设计为回顾性,可能存在选择、实施、测量等偏倚,且受条件所限,未分析偏倚对结果影响。
总之,基于超声的影像组学标签对乳腺癌 HER-2 状态预测具有良好的准确性和稳定性,有望应用于临床实践。
不同基因状态的乳腺癌治疗方式和预后结局差异显著。其中,人表皮生长因子受体 2(human epidermal growth factor receptor,HER-2)状态是乳腺癌个体化治疗方案制定的主要依据指标之一,也是重要的预后预测指标[1]。目前临床在治疗前对 HER-2 状态检测主要是基于穿刺活检的免疫组织化学(immunohistochemistry,IHC)或原位杂交(in situ hybridization,ISH)检测,存在有创性和因取材不准造成的假阴性等问题。国内外学者开发了多种预测 HER-2 状态的无创生物学指标[2-7]。但这些生物学指标的准确性有待提高,且大多数尚未验证,仍需继续开发预测 HER-2 状态的生物学新指标。影像组学通过提取影像图像的海量特征,经特征筛选、构建组学标签等[8],在多种肿瘤的基因状态预测方面具有重要价值[9-15]。而超声图像是乳腺癌患者治疗前常规获取的图像资料[9, 16],具有检测方便、无创和费用较低的优点。因此,开发基于超声的影像组学标签预测乳腺癌 HER-2 状态的临床价值较高。本研究拟采用影像组学的研究方法,开发超声影像组学标签,并评价和验证超声影像组学标签预测乳腺癌 HER-2 状态的价值,以期为临床提供一种预测 HER-2 状态的生物学新指标。
1 资料与方法
1.1 资料来源
回顾性连续性收集 2020 年 1 月~2020 年 8 月我院手术后病理证实为浸润性乳腺癌的患者资料。纳入标准:① 手术前 1~2 周行超声检查且提示病灶可见;② 病理检查结果证实为乳腺癌,且报告中详细记载病灶的相关超声特征;③ 有完善的术后病理结果。本研究的开展已获我院医学伦理委员会批准(编号:GDREC 2018349H)。
1.2 超声影像采集
术前超声检查采用 SuperSonic Imagine Aixplorer 和 GE VolusonE82 多普勒超声诊断仪,实时线阵高频探头频率设置为 5~14 MHz,患者呈仰卧位,双手上举,使乳房及双侧腋窝区域充分呈现,行双侧乳腺彩色多普勒超声检查,对乳腺做纵向、横向及斜切面扫描,并对乳腺病灶区域进行多角度查扫,存储为 DICOM 格式的图像。
1.3 影像组学分析
1.3.1 病灶分割
将获得的超声影像导入 Image J 软件,分别由 2 名高年资超声诊断医师,沿肿瘤边界勾画感兴趣区域,如图 1 所示。

图 a、b 为乳腺癌 HER-2 阳性患者;c、d 为乳腺癌 HER-2 阴性患者;a、c 为原始图像,b、d 为分割图像。
1.3.2 影像组学特征提取
使用基于 python3.0 的开源软件包 pyradiomics(version 3.0)提取感兴趣区域的超声影像组学特征。特征可分为四类:① 用于描述超声图像像素强度分布情况的一阶统计量特征,如峰度、偏度、能量等;② 用于描述肿瘤病灶形状、大小的形态学特征,如病灶周长、最大 2D 直径、球形度等;③ 用于描述像素强度的空间分布或灰度的相对位置信息情况,本研究包括从灰度的空间关系表征物体纹理的灰度共生矩阵(GLCM)、计算相同灰度在不同方向上连续移动来表征图像纹理的灰度游程矩阵(GLRLM)、计算各灰度连通域的分布情况来描述纹理的灰度空间区域矩阵(GLSZM)及量化图像中灰度依赖性的灰度依赖矩阵(GLDM);④ 利用小波变换对图像进行分解与重构得到的小波特征。
针对每一个患者的超声图像,提取 1 820 个影像特征,其中包括:14 个形态学特征、18 个一阶统计量特征,68 个纹理特征和 1 720 个小波特征。
1.3.3 特征筛选与模型构建及评价
根据超声检查时间顺序,分成训练组和验证组,为保持数据的独立性,特征筛选、标签构建等流程仅在训练组中执行,验证组用于评估标签的效能。影像组学特征的筛选流程如下:① 采用组内相关系数法(intraclass correlation coefficient,ICC)评价影像组学特征的可重复性,并以 ICC>0.85 作为重复性高的评价标准;② 采用 Spearman 相关系数(r)对特征间的相关性进行评估,并以高于 0.75 视为特征间高相关;③ 采用线性核支持向量机递归特征消除算法(L-SVM-RFE),并进行五折交叉验证,选取关键、稳定特征用于构建模型。选出关键影像特征后,利用 logistic 回归构建预测 HER-2 状态的超声影像组学标签,采用使用受试者工作特征曲线(receiver operating characteristic,ROC)下的面积(area under curve,AUC)、特异度、灵敏度及准确度、校准曲线、决策曲线等指标,对标签效能在训练组和验证组中进行评价。
1.4 统计分析
采用 R 软件(version 3.5.2)进行统计分析,Kolmogoro-Smirnov 检验用于连续变量的正态分布检测,对于正态分布的连续变量以平均值±标准差表示。P<0.05 视为差异具有统计学意义。
2 结果
本研究共纳入 230 例患者,包括 HER-2 阳性 73 例,阴性 157 例。按检查时间分为两组:训练组(n=115,平均年龄:48.75±9.31 岁,HER-2 阳性 35 例)和验证组(n=115 例,平均年龄:50.77±10.92 岁,HER-2 阳性 38 例)。对每一例患者的超声影像提取 1 820 个影像组学特征,先经过可重复性分析,其中 507 个特征被剔除(0.034<ICC<0.850);对剩余的 1 313 个(0.850≤ICC<0.999)影像特征进行相关性分析,其中 1 027 个特征被剔除(0.75<r<0.96);再经 SVM-RFE 算法对剩余的 286 个特征进行筛选后,选出 9 个关键影像组学特征(表 1)。

对上述的 9 个关键影像组学特征利用 logistic 回归在训练组中构建 HER-2 状态的标签,并在验证组上进行评估。其中,超声影像组学标签在训练组中 AUC 值为 0.82[95%CI(0.74,0.90)](图 2),敏感性为 92%,特异性为 68%,预测 HER-2 状态准确性为 76%;在测试组中 AUC 值为 0.81[95%CI(0.72,0.89)](图 2),敏感性为 79%,特异性为 74%,预测 HER-2 状态准确性为 75%(表 2)。

a:影像组学标签预测 HER-2 状态的 ROC 曲线;b:影像组学标签在组内的校准曲线;c:影像组学标签在训练组中的决策曲线;d:影像组学标签在验证组中的决策曲线。

校准曲线显示超声影像组学标签在训练组和验证组中对 HER-2 状态的预测概率与真实值一致性好(P=0.13、0.31),决策分析曲线显示超声影像组学标签具有一定的临床实用性(图 2)。
3 讨论
近年来,基于超声的影像组学研究取得了迅速发展,其中以乳腺超声的影像组学研究最为多见[16]。超声影像组学在乳腺肿瘤的良恶性鉴别、分子分型、区域淋巴结转移和新辅助治疗疗效等方面显示出巨大预测价值,对临床医师制定和调整乳腺肿瘤个体化治疗方案具有重要的辅助作用[16-23]。本研究探索了超声影像组学在预测乳腺癌 HER-2 状态的应用价值,研究结果显示影像组学标签可准确预测 HER-2 状态,研究结果进一步补充了超声影像组学在乳腺肿瘤领域的应用潜能。
本研究发现,超声影像组学标签对乳腺癌 HER-2 状态的具有一定的预测价值。在训练组和验证组中,超声影像组学标签的 AUC 相似,均超过 0.80。这与邱小英等[24]研究结果不一致,该研究基于 201 个乳腺癌病灶,采用小波变换的方法提取超声图像等 843 个特征,最终选择 16 个特征构建了超声影像组学标签,结果显示基于超声的影像组学标签与 HER-2 状态没有显著相关性。而本研究采用 4 种图像特征提取方法,不但包括小波变换,还包括一阶统计学特征、形态学特征和纹理特征等。因此,本研究提取的超声影像学特征可更全面反应肿瘤的异质性,从而构建出了可用于预测 HER-2 状态的超声影像组学标签。
本研究结果显示,超声影像组学标签预测乳腺癌 HER-2 状态的效能和目前文献报道的大多数生物学指标相似[2-4, 25]。多个研究显示基于 MRI 的影像组学标签预测乳腺癌 HER-2 状态的 AUC 约为 0.79~0.81[2-4],本研究结果中超声影像组学标签的 AUC 为 0.81~0.82。Fan 等[25]研究显示基于动态增强磁共振(DCE-MRI)的影像组学标签预测乳腺癌 HER-2 状态的 AUC 达 0.86,但其样本量不足 100 例,其预测效能仍需进一步验证。此外,我们的研究基于临床术前常规超声影像检查,具有成本低、可重复性强、无创等优点。
本研究的创新点在于基于常规超声图像而构建了预测乳腺癌 HER-2 状态的影像组学标签,具有无创性、无辐射性、成本低等优点,可重复多次检测,如在治疗前、治疗后、病灶复发时,有望用于乳腺癌诊疗的整个过程。本研究的局限性为研究设计为回顾性,可能存在选择、实施、测量等偏倚,且受条件所限,未分析偏倚对结果影响。
总之,基于超声的影像组学标签对乳腺癌 HER-2 状态预测具有良好的准确性和稳定性,有望应用于临床实践。