GRADE 工作组针对网状 Meta 分析(NMA)制订了 GRADE 证据总结(SoF)表,目的是规范 NMA 结果的证据分级过程和结果展示。本文对 NMA-SoF 表的主要内容进行详细介绍,并举例说明 SoF 表的使用方法和注意事项。
引用本文: 王巍巍, 杨智荣, 孙凤, 詹思延. 网状 Meta 分析 GRADE 证据总结表的制订、解读与应用. 中国循证医学杂志, 2020, 20(12): 1471-1476. doi: 10.7507/1672-2531.202008163 复制
面对一个具体的临床问题,临床医生或决策者通常需要从众多的干预措施中选择对患者最安全有效的措施。传统 Meta 分析(meta-analysis,MA)基于直接比较方法展开研究,如果缺少直接比较的研究证据或者直接比较研究的质量低,则需要间接比较方法获取证据进行补充,因此网状 Meta 分析(network-meta-analysis,NMA)应运而生,其可实现对同一证据体的所有干预措施进行相互比较和综合排序。
临床医生或决策者在使用证据时,根据不同用途对研究结果的呈现形式有不同的需求。证据推荐分级的评估、制订与评价(The Grading of Recommendations,Assessment,Development,and Evaluation,GRADE)系统的证据总结(Summary of Findings,SoF)表可直观、简洁地呈现传统系统评价的主要结果[1-3],例如重要结局的证据确定性和疗效大小等关键信息[1, 2, 4-6]。SoF 在传统系统评价中的实用性已经得到了证明,其对总结证据非常有帮助。NMA 综合了直接比较和间接比较证据,产生的研究结果更多。关于如何报告 NMA 结果更有助于决策者和临床医生高效作出决策,虽然已有学者[7-10]进行探讨,但未达成统一共识,最佳呈现方式难以确定[11],为解决此问题,GRADE 工作组于 2012 年启动 GRADE NMA-SoF 表格制订工作,历经 7 年并于 2019 年正式发布。
1 制订过程
采用质性研究的方法和基本原则进行资料收集和调查分析,全面总结使用者对 NMA-SoF 表的看法和改进计划。NMA-SoF 表的制订分为 3 个阶段:① 成立专家指导小组,在 2012 年 GRADE 工作组会议上提议 NMA-SoF 表格初稿,并根据工作组成员的反馈进行修订;② 2013 年到 2016 年间,工作组与 42 名 MA 和 NMA 方面经验丰富的卫生保健研究人员召开 4 次头脑风暴会议,根据与会者提出的改进意见对 NMA-SoF 表格进行修订;③ 使用者测试(或可用性测试)阶段,从使用者角度出发,了解其意见并据此进行更新[12, 13],主要焦点是探讨 NMA-SoF 的格式是否满足使用者的需求,提高用户对报告信息的理解。使用者测试目标人群分为 3 类:系统评价作者、方法学家、临床医生或卫生保健相关专业人员[13]。采用质性研究中常用的目的性抽样方法选择访谈研究对象[13],抽样策略采用效标抽样[14, 15],即为抽样设定一个标准或条件,然后选择所有符合标准的个案进行研究,确保最终的研究对象能够代表 NMA-SoF 表用户(MA 或 NMA 的使用者)。
经过 4 轮头脑风暴和使用者测试,研究者们对 SoF 涵盖内容和呈现形式(单个结局或多个结局)进行了全面考量和取舍,内容涉及到 PICO、网状关系图、研究数量、研究对象数量、干预措施数量及表现形式、效应估计值(直接效应估计及其可信区间、间接效应估计及其可信区间、相对效应值、绝对效应值)、证据质量、累积排名曲线下面积(surface under the cumulative ranking curve,SURCA)及其可信区间、基线风险纳入等 NMA 报告结果,最终确定了适用于二分类变量的 NMA-SoF 表(表 1)。由于工作组尚未对连续性变量的 NMA-SoF 进行测试,因此本文只介绍二分类变量的 NMA-SoF 表。NMA-SoF 表格的开发过程和最终的格式版本见 Yepes-Nuñez 等[16]在 Journal of Clinical Epidemiology 上发表的文章。

2 GRADE NMA-SoF 解读
最终的 NMA-SoF 表格由三部分构成。
2.1 第一部分
位于表格上部,显示研究问题拆解为 PICO 组分的详细信息,其中,P 代表研究对象(patient/population),I 代表干预措施(intervention),C 代表对照组或参照组(comparator/reference),O 代表结局指标(outcome),通常还需提供研究地点(setting)。每个 NMA-SoF 表格展示一个结局的关键研究信息,一项干预措施作为“参照组”,其他干预措施列在“干预措施”标签下。这部分的研究信息可以从 NMA 的结构化摘要部分和研究方法部分获得。另外,NMA 的网状关系图在第一部分的右侧展示,建议用不同颜色表示不同干预措施,避免使用红色和绿色等常见色觉障碍颜色。网状关系图可以从 NMA 的结果部分获得。
2.2 第二部分
位于表格中部,报告信息由 6 列构成。
第 1 列是详细描述针对特定结局的干预措施直接比较的研究数量和研究对象数量。每一种干预措施在网状关系图中用哪一种颜色展示,需要在第 1 列用相应颜色圆点示意。研究数量和样本量信息可以从纳入研究特征表格中获得。
第 2 列填写干预措施基于参照组计算的的相对效应估计,并标识相对效应的贡献是来自直接证据、间接证据还是网状估计,建议展示三种估计中确定性最高的效应估计值。推荐使用 CINeMA 平台(https://cinema.ispm.unibe.ch/),该平台交互性强,可以指定任一干预措施作为参照组,高效计算来自直接估计、间接估计以及混合估计的相对效应估计值及其可信区间。
第 3 列分别填写参照组和干预组的绝对效应信息和两组风险差异的绝对效应信息及 95% 可信区间。
第 4 列填写证据质量以及证据群降级因素。证据质量通常采用 GRADE 证据分级体系来进行评级,以评价不同干预措施对重要结局产生影响的可信程度。对于干预效果估计,随机对照试验被认为是高质量证据,观察性研究是低质量证据,但有 5 种因素可导致证据质量下降,3 种因素可以提升证据质量。降级因素包括纳入研究的偏倚风险(risk of bias)[11],研究人群、干预措施和结局指标的间接性(indirectness)[17],不同研究合并结果的不精确性(imprecision)[18],不同研究间结果的不一致性(inconsistency)[19],发表偏倚(publication bias)[20]。由于 NMA 同时纳入直接比较和间接比较的证据,除上述 5 个降级因素外,还需考虑 2 个降级因素:间接比较不同组别在研究人群基线特征、共同对照以及结局测量方面的不可传递性(intransitivity)和直接比较与间接比较结果的不同质性(incoherence)[21]。研究的偏倚风险指的是研究设计或实施过程中的缺陷,可能导致估计结果系统性偏离真实值,建议使用 Cochrane 偏倚风险评估工具[22]进行评价。间接性在成对 MA 中指的是纳入研究与研究问题的相关性,研究人群干预措施、结局和地点可能无法代表系统评价作者要进行推断的研究要素[17]。间接性在一定程度上提出了可传递性的问题,可传递性意味着通过治疗措施 C 来估计治疗措施 A 和治疗措施 B 的相对效应时,在 A vs. C 和 B vs. C 的研究中的效应修饰因子分布是可比的。不精确性的评估需要定义具有临床意义的阈值,治疗效应可以是任意有益的效应,即使微小的差异,一旦超过阈值,可以认为一种治疗优于另外一种,也可以将治疗相对效应划分为三类,分别是 X 更优、X 和 Y 没有差异、Y 更优,中间的范围又叫等效范围,建议根据对患者有意义的绝对风险差异值确定等效范围。不一致性指的是研究结果的变异性会影响对治疗效应的点估计,而非随机变异造成。在 NMA 中,不仅研究之间治疗效果可能存在差异,直接或间接来源的证据之间也可能存在差异,后者也叫不同质性。发表偏倚指的是系统评价报告结果不能代表符合标准研究的结果而出现的偏倚,产生原因可能在于阴性结果的不易发表或延迟发表[23-25]。升级因素包括效应量大、剂量反应关系和混杂因素使效应降低。证据质量评级可划分为高、中、低和极低四个等级。
GRADE 工作组建议针对 NMA 的证据等级评价可分为以下操作步骤[26, 27]:① 分别列出直接比较和间接比较的效应估计及可信区间。② 分别对每一组直接比较和间接比较的证据质量进行分级。对于间接比较的证据质量分级首先要遴选最佳比较路径,公共对照数量越多,结果可信度越差。选定路径后,对路径中的单组分别进行证据质量评级,以其中证据水平低的等级为准。另外,需考虑不同组别间人群特征、公共对照以及结局测量是否存在明显差异,不可传递性也会降低间接比较的可信程度。③ 确定和呈现 NMA 基于直接比较和间接比较的证据质量,对于网状估计,直接比较和间接比较证据共存的情况,以证据级别较高的证据等级为准。④ 直接比较和间接比较的结果是否存在不一致性,判断方法有不同质性模型、回测法等[28-33],若存在严重不一致性,则需要再降低一级。
第 5 列填写排序信息,考虑到排序有较大程度的不精确性[34],建议采用中位数排序或 SUCRA 及其可信区间,如果区间过宽且存在重叠线性,则提示排名的准确性需要慎重对待。贝叶斯方法可估计平均排序和 SUCRA 值的 95% 可信区间,进而计算得到中位数排序及四分位数区间。
第 6 列填写结果概述,基于效应估计、证据质量和排名或 SURCA 等综合信息,描述每项干预相对于参照组的优劣程度,分为 4 类:确定优效(definitely superior)、可能优效(probably superior)、可能劣效(probably inferior)、确定劣效(definitely inferior)。
2.3 第三部分
位于下部,由 3 个单元构成,分别是:① 关于 NMA 术语和缩写的定义;② 每一种最终 GRADE 证据确定性判断的描述;③ 关于详细描述证据评估确定性理由的解释性脚注。
3 案例展示与解读、总结(实例分析)
以 2019 年 10 月 10 日发表在 BMJ 上的 NMA 举例说明 NMA-SoF 的应用,填写说明见表 2,单个结局和多结局的 NMA-SoF 示例见 https://www.jianguoyun.com/p/DUJvRqMQn5TsBhizocAD。该研究目的在于评价不同口服抗血栓药物对冠状动脉旁路移植术后大隐静脉移植失败的预防效果[35],安全性主要结局指标为大出血。该研究除正式发表的方案和试验结果文章外,还附有补充结果作为附件,并在 PROSPERO 网站进行了注册(CRD42017065678)。虽然实例发表在 NMA-SoF 表格公开发表之前,但文中对主要结局指标的研究结果进行了汇总,提供了 NMA-SoF 表格所需的绝大部分要素,包括参照组、研究数量、研究对象数量、相对效应值(标注了是否来源于间接估计)、绝对效应值和差值、证据的确定性和 SUCRA。文中还提供了 2 个网状关系图,分别针对有效性主要结局指标和安全性主要结局指标。然而,这篇 NMA 在结果报告方面存在的问题包括:① 网状关系图中的干预措施未用不同颜色进行区分;② 未提供中位数排序或排序的可信区间;③ 未提供结果概述。

4 展望
4.1 NMA-SoF 表格的优缺点
NMA-SoF 的优点:① 在网状关系图中采用不同颜色表示不同干预措施,标识醒目,方便识别图表中的干预措施,并且考虑色觉障碍用户的需求,规避使用红色和绿色;② 仅呈现直接估计或间接估计中确定性最高的效应估计,列出对应的相对效应估计和绝对效应估计值,标明估计是来自直接证据还是间接证据;③ 提供 GRADE 证据评估的确定性;④ 考虑到排序的误导性,建议提供中位数排序或者可信区间。
NMA-SoF 的局限性在于:① 参照组的选择对于表格呈现的信息至关重要,取决于不同决策场景需求,可以考虑安慰剂、金标准治疗手段、成本-效益最高的干预措施、成本-效益最差的干预措施等方面。② 每个结局指标需要 1 个 NMA-SoF 表格呈现所有干预措施的研究结果,如果关注的结局指标较多,则需要多个表格才能呈现完整的结果。另一种备选格式,单个 NMA-SoF 表格对有效性和安全性的结局显示相同的前三名干预措施。对于系统评价作者而言,在报告结果的时候需要作出选择,而无论选择哪种,对于证据的使用者和决策者可能都不是全面的。
4.2 应用现状
NMA-SoF 于 2019 年 11 月发表后迅速成为“高被引论文”,Web of Science 上被引频次已有 10 次,被 9 个 NMA(6 个 Cochrane 系统评价)和 1 个研究方案引用,根据对应领域和出版年中的高引用阈值,被引次数可以归入其学术领域中最优秀的 1%。目前 Cochrane 协作组已推荐使用 NMA-SoF 表格,但其他杂志、网站、机构的推荐使用稍显滞后。
4.3 应用前景
NMA-SoF 的目标使用人群包括系统评价作者、指南制订者、卫生保健专业人员。对于 NMA 作者而言,NMA-SoF 的推广和应用不仅可提高 NMA 结果报告的规范性,也在一定程度上帮助研究者开展科学规范的研究设计,提升研究质量。对于指南制订者而言,NMA-SoF 不仅提供证据质量分级的信息,也提供了绝对效应值,方便指南制订者参考临床决策阈值进行判断是否给出推荐。对于卫生保健专业人员而言,NMA-SoF 可以高效地展示 NMA 的研究结果,提高证据的实用性,帮助其做出更加明智的决策。
目前,GRADE 工作组正计划制订正式的 NMA-SoF 使用手册,根据用户经验的积累进一步完善 NMA-SoF 以及开发交互式的 SoF 表格,方便纳入证据决策框架。
面对一个具体的临床问题,临床医生或决策者通常需要从众多的干预措施中选择对患者最安全有效的措施。传统 Meta 分析(meta-analysis,MA)基于直接比较方法展开研究,如果缺少直接比较的研究证据或者直接比较研究的质量低,则需要间接比较方法获取证据进行补充,因此网状 Meta 分析(network-meta-analysis,NMA)应运而生,其可实现对同一证据体的所有干预措施进行相互比较和综合排序。
临床医生或决策者在使用证据时,根据不同用途对研究结果的呈现形式有不同的需求。证据推荐分级的评估、制订与评价(The Grading of Recommendations,Assessment,Development,and Evaluation,GRADE)系统的证据总结(Summary of Findings,SoF)表可直观、简洁地呈现传统系统评价的主要结果[1-3],例如重要结局的证据确定性和疗效大小等关键信息[1, 2, 4-6]。SoF 在传统系统评价中的实用性已经得到了证明,其对总结证据非常有帮助。NMA 综合了直接比较和间接比较证据,产生的研究结果更多。关于如何报告 NMA 结果更有助于决策者和临床医生高效作出决策,虽然已有学者[7-10]进行探讨,但未达成统一共识,最佳呈现方式难以确定[11],为解决此问题,GRADE 工作组于 2012 年启动 GRADE NMA-SoF 表格制订工作,历经 7 年并于 2019 年正式发布。
1 制订过程
采用质性研究的方法和基本原则进行资料收集和调查分析,全面总结使用者对 NMA-SoF 表的看法和改进计划。NMA-SoF 表的制订分为 3 个阶段:① 成立专家指导小组,在 2012 年 GRADE 工作组会议上提议 NMA-SoF 表格初稿,并根据工作组成员的反馈进行修订;② 2013 年到 2016 年间,工作组与 42 名 MA 和 NMA 方面经验丰富的卫生保健研究人员召开 4 次头脑风暴会议,根据与会者提出的改进意见对 NMA-SoF 表格进行修订;③ 使用者测试(或可用性测试)阶段,从使用者角度出发,了解其意见并据此进行更新[12, 13],主要焦点是探讨 NMA-SoF 的格式是否满足使用者的需求,提高用户对报告信息的理解。使用者测试目标人群分为 3 类:系统评价作者、方法学家、临床医生或卫生保健相关专业人员[13]。采用质性研究中常用的目的性抽样方法选择访谈研究对象[13],抽样策略采用效标抽样[14, 15],即为抽样设定一个标准或条件,然后选择所有符合标准的个案进行研究,确保最终的研究对象能够代表 NMA-SoF 表用户(MA 或 NMA 的使用者)。
经过 4 轮头脑风暴和使用者测试,研究者们对 SoF 涵盖内容和呈现形式(单个结局或多个结局)进行了全面考量和取舍,内容涉及到 PICO、网状关系图、研究数量、研究对象数量、干预措施数量及表现形式、效应估计值(直接效应估计及其可信区间、间接效应估计及其可信区间、相对效应值、绝对效应值)、证据质量、累积排名曲线下面积(surface under the cumulative ranking curve,SURCA)及其可信区间、基线风险纳入等 NMA 报告结果,最终确定了适用于二分类变量的 NMA-SoF 表(表 1)。由于工作组尚未对连续性变量的 NMA-SoF 进行测试,因此本文只介绍二分类变量的 NMA-SoF 表。NMA-SoF 表格的开发过程和最终的格式版本见 Yepes-Nuñez 等[16]在 Journal of Clinical Epidemiology 上发表的文章。

2 GRADE NMA-SoF 解读
最终的 NMA-SoF 表格由三部分构成。
2.1 第一部分
位于表格上部,显示研究问题拆解为 PICO 组分的详细信息,其中,P 代表研究对象(patient/population),I 代表干预措施(intervention),C 代表对照组或参照组(comparator/reference),O 代表结局指标(outcome),通常还需提供研究地点(setting)。每个 NMA-SoF 表格展示一个结局的关键研究信息,一项干预措施作为“参照组”,其他干预措施列在“干预措施”标签下。这部分的研究信息可以从 NMA 的结构化摘要部分和研究方法部分获得。另外,NMA 的网状关系图在第一部分的右侧展示,建议用不同颜色表示不同干预措施,避免使用红色和绿色等常见色觉障碍颜色。网状关系图可以从 NMA 的结果部分获得。
2.2 第二部分
位于表格中部,报告信息由 6 列构成。
第 1 列是详细描述针对特定结局的干预措施直接比较的研究数量和研究对象数量。每一种干预措施在网状关系图中用哪一种颜色展示,需要在第 1 列用相应颜色圆点示意。研究数量和样本量信息可以从纳入研究特征表格中获得。
第 2 列填写干预措施基于参照组计算的的相对效应估计,并标识相对效应的贡献是来自直接证据、间接证据还是网状估计,建议展示三种估计中确定性最高的效应估计值。推荐使用 CINeMA 平台(https://cinema.ispm.unibe.ch/),该平台交互性强,可以指定任一干预措施作为参照组,高效计算来自直接估计、间接估计以及混合估计的相对效应估计值及其可信区间。
第 3 列分别填写参照组和干预组的绝对效应信息和两组风险差异的绝对效应信息及 95% 可信区间。
第 4 列填写证据质量以及证据群降级因素。证据质量通常采用 GRADE 证据分级体系来进行评级,以评价不同干预措施对重要结局产生影响的可信程度。对于干预效果估计,随机对照试验被认为是高质量证据,观察性研究是低质量证据,但有 5 种因素可导致证据质量下降,3 种因素可以提升证据质量。降级因素包括纳入研究的偏倚风险(risk of bias)[11],研究人群、干预措施和结局指标的间接性(indirectness)[17],不同研究合并结果的不精确性(imprecision)[18],不同研究间结果的不一致性(inconsistency)[19],发表偏倚(publication bias)[20]。由于 NMA 同时纳入直接比较和间接比较的证据,除上述 5 个降级因素外,还需考虑 2 个降级因素:间接比较不同组别在研究人群基线特征、共同对照以及结局测量方面的不可传递性(intransitivity)和直接比较与间接比较结果的不同质性(incoherence)[21]。研究的偏倚风险指的是研究设计或实施过程中的缺陷,可能导致估计结果系统性偏离真实值,建议使用 Cochrane 偏倚风险评估工具[22]进行评价。间接性在成对 MA 中指的是纳入研究与研究问题的相关性,研究人群干预措施、结局和地点可能无法代表系统评价作者要进行推断的研究要素[17]。间接性在一定程度上提出了可传递性的问题,可传递性意味着通过治疗措施 C 来估计治疗措施 A 和治疗措施 B 的相对效应时,在 A vs. C 和 B vs. C 的研究中的效应修饰因子分布是可比的。不精确性的评估需要定义具有临床意义的阈值,治疗效应可以是任意有益的效应,即使微小的差异,一旦超过阈值,可以认为一种治疗优于另外一种,也可以将治疗相对效应划分为三类,分别是 X 更优、X 和 Y 没有差异、Y 更优,中间的范围又叫等效范围,建议根据对患者有意义的绝对风险差异值确定等效范围。不一致性指的是研究结果的变异性会影响对治疗效应的点估计,而非随机变异造成。在 NMA 中,不仅研究之间治疗效果可能存在差异,直接或间接来源的证据之间也可能存在差异,后者也叫不同质性。发表偏倚指的是系统评价报告结果不能代表符合标准研究的结果而出现的偏倚,产生原因可能在于阴性结果的不易发表或延迟发表[23-25]。升级因素包括效应量大、剂量反应关系和混杂因素使效应降低。证据质量评级可划分为高、中、低和极低四个等级。
GRADE 工作组建议针对 NMA 的证据等级评价可分为以下操作步骤[26, 27]:① 分别列出直接比较和间接比较的效应估计及可信区间。② 分别对每一组直接比较和间接比较的证据质量进行分级。对于间接比较的证据质量分级首先要遴选最佳比较路径,公共对照数量越多,结果可信度越差。选定路径后,对路径中的单组分别进行证据质量评级,以其中证据水平低的等级为准。另外,需考虑不同组别间人群特征、公共对照以及结局测量是否存在明显差异,不可传递性也会降低间接比较的可信程度。③ 确定和呈现 NMA 基于直接比较和间接比较的证据质量,对于网状估计,直接比较和间接比较证据共存的情况,以证据级别较高的证据等级为准。④ 直接比较和间接比较的结果是否存在不一致性,判断方法有不同质性模型、回测法等[28-33],若存在严重不一致性,则需要再降低一级。
第 5 列填写排序信息,考虑到排序有较大程度的不精确性[34],建议采用中位数排序或 SUCRA 及其可信区间,如果区间过宽且存在重叠线性,则提示排名的准确性需要慎重对待。贝叶斯方法可估计平均排序和 SUCRA 值的 95% 可信区间,进而计算得到中位数排序及四分位数区间。
第 6 列填写结果概述,基于效应估计、证据质量和排名或 SURCA 等综合信息,描述每项干预相对于参照组的优劣程度,分为 4 类:确定优效(definitely superior)、可能优效(probably superior)、可能劣效(probably inferior)、确定劣效(definitely inferior)。
2.3 第三部分
位于下部,由 3 个单元构成,分别是:① 关于 NMA 术语和缩写的定义;② 每一种最终 GRADE 证据确定性判断的描述;③ 关于详细描述证据评估确定性理由的解释性脚注。
3 案例展示与解读、总结(实例分析)
以 2019 年 10 月 10 日发表在 BMJ 上的 NMA 举例说明 NMA-SoF 的应用,填写说明见表 2,单个结局和多结局的 NMA-SoF 示例见 https://www.jianguoyun.com/p/DUJvRqMQn5TsBhizocAD。该研究目的在于评价不同口服抗血栓药物对冠状动脉旁路移植术后大隐静脉移植失败的预防效果[35],安全性主要结局指标为大出血。该研究除正式发表的方案和试验结果文章外,还附有补充结果作为附件,并在 PROSPERO 网站进行了注册(CRD42017065678)。虽然实例发表在 NMA-SoF 表格公开发表之前,但文中对主要结局指标的研究结果进行了汇总,提供了 NMA-SoF 表格所需的绝大部分要素,包括参照组、研究数量、研究对象数量、相对效应值(标注了是否来源于间接估计)、绝对效应值和差值、证据的确定性和 SUCRA。文中还提供了 2 个网状关系图,分别针对有效性主要结局指标和安全性主要结局指标。然而,这篇 NMA 在结果报告方面存在的问题包括:① 网状关系图中的干预措施未用不同颜色进行区分;② 未提供中位数排序或排序的可信区间;③ 未提供结果概述。

4 展望
4.1 NMA-SoF 表格的优缺点
NMA-SoF 的优点:① 在网状关系图中采用不同颜色表示不同干预措施,标识醒目,方便识别图表中的干预措施,并且考虑色觉障碍用户的需求,规避使用红色和绿色;② 仅呈现直接估计或间接估计中确定性最高的效应估计,列出对应的相对效应估计和绝对效应估计值,标明估计是来自直接证据还是间接证据;③ 提供 GRADE 证据评估的确定性;④ 考虑到排序的误导性,建议提供中位数排序或者可信区间。
NMA-SoF 的局限性在于:① 参照组的选择对于表格呈现的信息至关重要,取决于不同决策场景需求,可以考虑安慰剂、金标准治疗手段、成本-效益最高的干预措施、成本-效益最差的干预措施等方面。② 每个结局指标需要 1 个 NMA-SoF 表格呈现所有干预措施的研究结果,如果关注的结局指标较多,则需要多个表格才能呈现完整的结果。另一种备选格式,单个 NMA-SoF 表格对有效性和安全性的结局显示相同的前三名干预措施。对于系统评价作者而言,在报告结果的时候需要作出选择,而无论选择哪种,对于证据的使用者和决策者可能都不是全面的。
4.2 应用现状
NMA-SoF 于 2019 年 11 月发表后迅速成为“高被引论文”,Web of Science 上被引频次已有 10 次,被 9 个 NMA(6 个 Cochrane 系统评价)和 1 个研究方案引用,根据对应领域和出版年中的高引用阈值,被引次数可以归入其学术领域中最优秀的 1%。目前 Cochrane 协作组已推荐使用 NMA-SoF 表格,但其他杂志、网站、机构的推荐使用稍显滞后。
4.3 应用前景
NMA-SoF 的目标使用人群包括系统评价作者、指南制订者、卫生保健专业人员。对于 NMA 作者而言,NMA-SoF 的推广和应用不仅可提高 NMA 结果报告的规范性,也在一定程度上帮助研究者开展科学规范的研究设计,提升研究质量。对于指南制订者而言,NMA-SoF 不仅提供证据质量分级的信息,也提供了绝对效应值,方便指南制订者参考临床决策阈值进行判断是否给出推荐。对于卫生保健专业人员而言,NMA-SoF 可以高效地展示 NMA 的研究结果,提高证据的实用性,帮助其做出更加明智的决策。
目前,GRADE 工作组正计划制订正式的 NMA-SoF 使用手册,根据用户经验的积累进一步完善 NMA-SoF 以及开发交互式的 SoF 表格,方便纳入证据决策框架。