引用本文: 黄耀连, 刘凡, 段玉婷, 卞兆祥, 张弛, 陈耀龙, 译. CONSORT-SPI 2018 的解释与说明:社会和心理干预措施试验报告规范. 中国循证医学杂志, 2020, 20(12): 1458-1470. doi: 10.7507/1672-2531.202008181 复制
1 背景
1.1 CONSORT-SPI 2018 的解释与说明
研发随机对照试验报告规范 CONSORT 声明旨在帮助作者报告随机对照试验(randomised controlled trials,RCTs)[1]。它改善了医学报告的质量[2-5],并已获得 600 多种期刊和知名编辑团体的正式支持[6]。少数期刊已实施 CONSORT,尤其是其扩展声明,成为稿件提交、同行评议和编辑决策过程的要求[6, 7]。CONSORT 声明的扩展版适用于特定的试验设计[8-11]、数据类型(如患者报告结局、危害和摘要信息)[12-14]和干预措施[15-17]。
许多回顾性研究表明,社会和心理干预措施的随机对照试验,通常没有报告足够的准确性、全面性和透明度以重复这些研究,没有评估其质量及了解应在何人和何种情况下使用干预措施[18-22]。此外,由于既往研究通常不会共享临床试验方案、结果数据及实施社会和心理干预措施所需的材料,行为和社会科学家可能会无法重复或综合以前的研究[23-28]。这些低效率导致有效干预措施不能理想地传播[29, 30],高估干预措施效果[31]及研究资源浪费[29]。社会和心理干预措施的 RCTs 需要透明且详细地报告,以使报告偏倚最小化,研究证据的可信度和实用性最大化[32, 33]。
我们制定了社会和心理干预措施 CONSORT 2010 声明的扩展版(CONSORT-SPI 2018)[34]。为描述 CONSORT-SPI 2018 的范围,我们通过干预措施的作用机制定义了干预措施[35, 36]。我们将社会和心理干预措施定义为旨在修改社会和心理的流程和系统(如认知、情绪、行为、规范、关系和环境)的活动,并假设对关注的结局有影响的干预措施[37, 38]。社会和心理干预措施可能会提供给有要求的个人,也可能是政策的结果,可能在不同的级别(如个人、团体、地区)运作,并且通常是“复杂的”[19]。CONSORT-SPI 2018 主要适用于 RCTs 的报告,尽管该报告规范的某些部分对于进行其他类型的临床试验的研究者[39],或对制定和评估复杂干预措施感兴趣的研究者可能有用[40]。此外,尽管此报告中的术语最适合平行随机对照试验,该报告规范亦可应用于其他设计(如阶梯随机对照试验和单病例随机对照试验)。
2 方法
我们之前曾报道过用于制定 CONSORT-SPI 2018 的方法[41]。我们首先对现有报告规范和试验报告的质量进行了系统评价[18]。其次,我们在 2013 年 9 月至 2014 年 2 月进行了国际在线德尔菲流程(Delphi process),以优先考虑系统评价中确定的 CONSORT-SPI 2018 清单和流程图的潜在条目。经德尔菲调查的条目可在 ReShare 网站(10.5255/UKDA-SN-851981)上获取。第三,我们召开了一次共识会议,以最终确定清单和流程图的内容。会议于 2014 年 3 月举行,由 31 位科学家、期刊编辑和研究资助者组成。写作小组起草了 CONSORT-SPI 2018,共识小组的参与者(见原文附录)提供了反馈意见并同意 CONSORT-SPI 2018 扩展声明[42]的最终文稿及本解释与说明(E&E)文件。
CONSORT-SPI 2018 清单扩展了 CONSORT 2010 中的 25 个条目(包括 14 个亚条目)中的 9 个(表 1;新条目在“CONSORT-SPI 2018”栏中),并包括修改后的流程图。参会者还投票通过添加有关利益相关方参与的新条目,并建议修改现有的 CONSORT 2010 清单条目(表 2)。本解释与说明文件简要概述了 CONSORT 2010 解释与说明文件中针对 CONSORT 2010 每个条目的内容[43],这些内容是针对行为和社会科学受众而量身定制的,它为 CONSORT-SPI 2018 中的新条目提供了解释与说明。具体而言,对于 CONSORT 2010 和 CONSORT-SPI 2018 中的每个条目,此解释与说明均提供了清单条目的依据及行为和社会科学受众的报告示例(见原文附录)。在整篇文章中,我们使用“受试者”一词来指代干预措施的目标“受试者单位”,这些受试者可能是个人、群体或地区(即场所或地点)[44]。虽然我们在 CONSORT 2010 清单中包括了有关每个条目的简短说明,但读者可在 CONSORT 网站(www.consort-statement.org)和 CONSORT 2010 解释与说明[43]上找到有关这些条目的更多信息。


3 结果和讨论
CONSORT-SPI 的解释与说明。
3.1 文题和摘要
3.1.1 条目 1a:文题能识别是随机试验
在文题中列明“随机”一词,会增加文章在数据库中被正确标注和在文章检索中被获取的可能性[45]。作者应考虑在文题中提供信息以帮助感兴趣的读者,如干预措施的名称和试验所解决的问题[46]。我们建议作者避免使用无信息的文题(如醒目的短语或典故),因为这减少了可用于帮助读者识别相关文稿的空间[45, 46]。
3.1.2 条目 1b:结构式摘要,包括试验设计、方法、结果和结论几个部分(有关具体指导,请参见 CONSORT 摘要扩展版)[13 , 47 ]
文章中被广泛阅读最多的部分是摘要[46],它们常被用于在电子数据库中标注索引报告[45]。作者应遵循 CONSORT 摘要扩展版的要求,该扩展版为结构化的期刊文章摘要和会议摘要提供了详细建议。基于 CONSORT 摘要扩展版,我们为社会和心理干预措施随机对照试验报告量身定制了 CONSORT-SPI 2018 摘要报告清单,包括目的、试验设计、受试者和干预措施等(表 3 和原文附录)相关条目[47]。

3.2 引言
3.2.1 条目 2a:科学背景和对试验理由的解释
有条理的引言应描述试验的基本原理及试验如何为已知的结果做出贡献[48]。特别是引言应描述目标问题或议题[49]及已知关于干预措施的内容,最好是参考系统评价[46]。
3.2.2 条目 2b:具体目的或假设
试验目的总括研究问题,包括有关干预措施效果的预期幅度和方向的任何假设[48, 50]。对具有多个干预措施单元和多个结局指标评估(如个人、团体、地点)的社会和心理干预措施,作者应预先指定每个目标和假设的适用目标。
3.2.3 CONSORT-SPI 2018 条目 2b:如果预先指定,假设干预措施如何起作用
描述所有组(即所有试验组和对照组)的干预措施预期如何影响结果,能提供有关干预措施基础理论的重要信息[46]。对于所评估的每种干预措施,作者都应描述“作用机理”[51],也称为“改变的理由”[52]、“程序理论”[53]或“因果路径”[54]。作者应说明在试验前如何考虑干预措施影响结局指标及是否预先确定了假设的作用机制,理想情况下应与其临床试验注册和临床试验方案互相参照[55]。具体而言,作者应报告:预期每种干预措施的组成部分如何影响可改变的心理和社会过程,对这些社会心理过程的被认定的影响又是如何影响关注的结局,这些过程内容的作用,干预措施实施过程中的促进因素和不良影响因素等及潜在的不良事件或意外后果[48, 56]。图示化描述,例如逻辑模型或分析框架,可能会有助于解释[19]。
3.3 方法:试验设计
3.3.1 条目 3a:描述试验设计(例如平行设计,析因设计),包括受试者分配入各组的比例
明确的试验设计细节有助于读者评估实现试验目标的试验方法的适用性[46, 57],清晰透明地报告所有试验设计特征,有助于试验的可重现性[58]。作者应解释他们对设计的选择(特别是如果它不是一个个体化的随机两组平行试验)[9];说明分配比率及其理由;并指出该试验是否旨在评估干预措施的优劣,等效性或非劣势性[10, 59, 60]。
3.3.2 CONSORT-SPI 2018 条目 3a:如果随机分配的单位不是个人,请参阅 CONSORT 群组随机对照试验
群组级别(例如学校)的随机化对于试验设计、分析、推断和报告具有重要意义。对于群组随机对照试验,作者应遵循 CONSORT 群组随机对照试验扩展版的要求。由于许多社会和心理干预措施是群组随机分组的,因此我们在表 4 和表 5 中提供了该清单的扩展条目[8]。作者还应报告随机单位,可以是社区单位(如家庭)、组织(如学校、监狱)或地点(如社区),并指定每个分析的单位,尤其是在分析单位与随机单位不一致的情况下(如在群组水平随机分组并分析个体水平评估的结果)。


3.3.3 条目 3b:试验开始后对试验方法所作的重要改变(例如合格受试者的资格标准),并说明原因
与计划的试验方法有偏差是临床试验常见的现象,不一定是研究有缺陷或有偏差。计划方法的变更对于理解和解释试验结果很重要。研究结果报告应与临床试验注册(条目 23)[61-63]及临床试验方案报告(条目 24)互相参照,而注册及试验方案报告必须在分配第一位受试者之前完成[55],同时研究结果报告亦应与预先指定的统计分析计划互相参照[64]。研究结果报告应总结对试验方案和统计分析计划的所有修订,包括何时修订及每个修订的理由。由于选择性报告临床试验结果的现象无处不在[65],因此作者应陈述在试验期间对结果定义的任何更改。
3.4 方法:受试者
3.4.1 条目 4a:受试者的合格标准
受试者的合格标准应描述如何招募受试者(即个人、团体或地点)。读者需要这些信息来了解谁可参加试验及研究结果的可推广性。作者应描述用于确定受试者的所有纳入和排除标准及用于筛选和评估受试者以确定其资格的所有方法[46, 48]。
3.4.2 CONSORT-SPI 2018 条目 4a:如适用,试验场所和其他条件提供干预措施的资格标准
除受试者的合格标准之外,社会和心理干预措施的试验通常还设有针对将招募受试者和提供干预措施的试验环境及干预措施提供者的合格标准[44]。作者应描述这些标准,以帮助读者将试验背景与干预措施可能使用的其他试验背景进行比较[48, 66, 67]。
3.4.3 条目 4b:收集数据的场所和地点
有关干预措施的实施环境和地点及数据收集的信息对于理解试验背景至关重要。重要的细节可能包括地理位置、试验活动的日期和时间、所需空间及可能影响实施的内部环境(如实施组织)和外部环境(如外部背景和环境)的特征[68]。在确定有关报告场所设置和位置的信息时,作者应参考干预措施的作用机制。
3.5 方法:干预措施
3.5.1 条目 5:每个组的干预措施都应有足够的细节允许被重复,包括如何及何时实际实施干预措施
有关全部组别(试验组和对照组)中所有干预措施内容和实施的完整而透明的信息对于理解、重复和合并干预效应至关重要[54, 69]。干预措施的基本信息包括:干预措施的名称、实际提供的干预措施(如材料和程序等)、提供干预措施的人员、以何种方式、何地、何时和多少剂量等[70]。干预措施实施者的详细信息应包括:其专业资格和教育程度、与干预措施或领域相关的专业知识或能力及提供干预措施的培训和监督[71]。显示干预措施活动顺序的表格或图表,如标准临床试验方案条目(SPIRIT)2013 声明[55]中建议的受试者时间表通常是有用的[72]。作者应避免仅使用“常规治疗”或“标准护理”之类的单一标签,因为它们在不同的时间和地点,内容并不统一[48]。
3.5.2 CONSORT-SPI 2018 条目 5a:按计划由提供者实际提供并由受试者使用实施的干预措施的程度
通常,干预措施未能完全按计划实施。作者应描述干预措施提供者实际提供的干预措施情况及受试者实际接受的干预措施程度,包括用于确保或评估干预措施是否由提供者实施及受试者是否按预期接受干预[69]。定量或定性过程评估[51]可用于评估提供者的实际行为(如记录和编码治疗次数)、受试者接受干预措施的数量(如记录参加治疗的次数)及干预组之间的交互影响[73, 74]。作者应将计划中的系统调整(如剪裁)与未预期的试验方案修改区分开来。当这些信息不能包含在一篇文章中时,作者应使用在线附录、附加报告和数据存储库来提供这些信息。
3.5.3 CONSORT-SPI 2018 条目 5b:哪里可获取有关干预措施实施的其他信息
作者应说明读者可在何处找到足够的信息来重复干预措施,如干预措施方案[75]、培训手册[48]、或其他材料(如工作表和网站)[54]。例如开放科学框架等新的在线平台,使研究人员可自由共享部分或全部研究资料(https://osf.io)。
3.5.4 CONSORT-SPI 2018 条目 5c:如适用,干预措施提供者如何被分配到各组
一些试验指定了不同条件的特定提供者,以防止专业知识和固有观点混淆结果。作者应报告是否同一个人提供试验干预措施和比较干预措施,提供者是否关联配套在干预措施组中及分配给每个干预措施提供者的受试者人数。
3.6 方法:结果
3.6.1 条目 6a:完全定义的预定结局指标,包括评估方式和时间
所有结果均应定义得足够详细,以供其他人使用试验数据重现结果[50, 76]。结果定义包括:① 领域(如抑郁症);② 测量(如贝克抑郁量表 II 认知亚量表);③ 特定指标(如某个时间点的值,相对于基线的变化);④ 聚合方法(如均值,比例);⑤ 时间点(如干预后 3 个月)[50]。此外,作者应报告收集结果数据的方法和人员、测量的性质或参考有关此信息之前的报告用来提高测量质量的方法(如对结果评估者的培训)及各试验组之间结果评估的任何差异[46]。作者还应指出读者可从何处获取用于测量结果的材料[24]。当试验包含无法公开获得的资料(如问卷)时,作者应提供副本(例如,通过在线存储库或作为在线附录)。
3.6.2 条目 6b:试验开始后对结局指标的任何改变,并说明原因
试验中所有评估的结果都应报告出来。如果报告的结局与试验注册(条目 23)或临床试验方案(条目 24)中预设的结局指标不同,则作者应说明增加了和去除了哪些结局指标。为了使读者能够评估结局转换带来的偏倚风险,作者还应确定结局指标重要程度的任何变化(如主要或次要)[77]。作者应提供所做任何更改的理由,并说明这些更改是在收集数据之前还是之后进行的。
3.7 方法:样本量
3.7.1 条目 7a:如何确定样本量
作者应指出试验的预期样本量及如何确定样本量,包括样本量的确定是使用样本量计算的先导试验还是由于实际限制。如果进行了先导试验计算样本量,作者应报告用于样本量计算的效果估计及选择它的原因(如通过对先前试验的 Meta 分析得出的最小效应量)。如果未进行预先样本量计算,那么作者不应该提出事后计算,而应该提出该样本估计的真正原因(例如时间或资金限制)及其检测每种结果的实际功效(条目 17)。
3.7.2 条目 7b:如适用,解释任何中期分析和中止准则
多种统计分析可能导致假阳性结果,尤其是在使用基于统计学意义的中止原则时。应该描述任何中期分析,包括进行了哪些分析(即分析的结果和方法)、进行时间及原因(尤其它们是否预先指定的[78])。作者还应说明停止试验的原因,包括用于确定是否应尽早停止试验的任何程序(如数据安全监控委员会的例会)[79]。
3.8 方法:随机化序列生成
3.8.1 条目 8a:产生随机分配顺序的方法
在随机对照试验中,受试者通过不可预知的随机方法分配到不同组别。作者应描述用于生成分配序列的方法(如计算机生成的随机数序列),以便读者可评估该过程是否真正随机。作者不应该仅使用“随机”一词来描述确定性的序列(如交替、招募顺序、出生日期)。
3.8.2 条目 8b:随机方法的类型;任何限定的细节(例如怎样分区组和各区组样本多小)
一些试验将随机分组设限,以限定各组的样本数及其重要特征的分布平衡。通常通过将受试者分组为区组,并在每个区组内使用随机序列分配受试者以实施随机化[46]。使用区组方案时,作者应描述如何生成区组、区组的大小、区组大小是否变化及如何变化,试验人员是否隐藏区组的大小等等。分层方案通过基于被认为会修改干预效果的位置或特性所创建的多个随机分配序列限定随机化[46]。使用分层时,作者应报告为什么使用分层,并描述用于分层的变量,包括每个分层类别的临界值。使用最小化变量时,作者应报告用于最小化的变量并包括统计代码。当对随机化没有限定时,作者应声明他们使用了“简单随机化”[43]。
3.9 方法:随机化分配隐藏机制
3.9.1 条目 9:用于实现随机分配顺序的机制,描述干预措施分配之前为隐藏序列号所采取的步骤
除了生成真正的随机序列(条目 8a)外,研究人员还应隐藏序列,以防止招募者和分配受试者的人员预知分配方案。否则,招募和分配方案可能受到因为隐藏下一受试者的分配方案而影响。作者应报告是否及如何实施分配隐藏[80, 81]。分配隐藏后,作者应描述该机制及如何监控此机制以避免分配隐藏被篡改或破解(例如集中式或“第三方”分配、自动分配系统、顺序编号的相同容器、密封的不透明信封)。虽然不是所有的受试者可进行盲法处理,但始终可进行随机分配隐藏。
3.10 方法:随机化实施
3.10.1 条目 10:谁生成随机分配序列,谁招募受试者及谁分配干预措施给受试者
在许多单独的随机对照试验中,生成随机序列和隐藏随机序列的人员与实施随机序列的人员不同。这样可防止篡改或破解随机序列隐藏[48]。在招募受试者(如小组,地点)并将其随机分组的试验中,可使用其他程序来确保试验的真正随机分组。作者应指出每个程序(即生成随机序列,注册受试者,并将受试者分配给不同的干预措施组别)的实施者及用于保护随机序列的方法。
3.11 方法:分组认知
3.11.1 条目 11a:分配后谁知道干预分配(例如,受试者、提供者和结局评价者)及如何实施隐藏
分配隐藏(盲法)是指随机分组后对于参与试验的人员中隐瞒干预措施分组的信息[46]。盲法的实施,可减少由于可能知道干预措施的分组方案而对其效果的内部效度带来的影响。作者应说明是否及如何使受试者、干预措施提供者、数据收集者和数据分析人员不知道干预措施分配方案。如果没有实施盲法(如因为不可能),作者应该描述用来评估效果和期望偏倚的方法(如隐藏试验假设,测量受试者的期望),如果有的话[82]。尽管通常不可能对干预措施提供者和受试者设盲,但对于通过访谈或观察评估的试验结局评估者施盲通常是可行的。如果对盲法成功率进行了检查,作者应报告结局评估者对参与者的干预状态保持设盲的程度。
3.11.2 条目 11b:如果相关,说明干预措施的相似性
特别是因为在许多社会和心理干预措施试验中都不可能对干预措施提供者和受试者设盲,因此作者应描述提供给每组的干预措施之间的差异,这些差异可能导致干预措施提供者和受试者的效果和期望方面产生不同。重要细节包括干预措施的组成和可接受度方面的差异、共同干预措施(或辅助干预措施)可能适用于某些组而不是其他组及组之间背景的差异(如实施干预措施地点的差异)。
3.12 方法:分析方法
3.12.1 条目 12a:用于比较各组结局指标的统计方法
完整的统计报告使读者可了解结果并重现分析[48]。对于每个结果,作者应描述其分析方法,包括对协变量的变换和调整及分析方法是预先选择还是在数据收集后确定。在美国,由美国国立卫生研究院资助的试验必须将统计分析计划及其结果保存在 ClinicalTrials.gov 上[62, 63]。其他资金来源支持的临床研究报告的作者亦应确定是否有类似的要求。对于群组随机试验,作者应说明数据分析的单位数是否不同于样本分配的单位数,如果适用,还应说明用于解释分配的单位数、干预措施水平和分析单位之间差异的分析方法等[8, 44, 46]。作者还应注意对分析数据进行的任何变换的任何程序和理由[46]。为促进研究试验的完全可重复性,作者应报告用于运行分析的软件并提供确切的统计代码[24]。
3.12.2 CONSORT-SPI 扩展条目 12a:如何处理缺失的数据及任何填补方法的细节
由于许多原因,社会和心理干预措施的随机对照试验中数据缺失很常见,如受试者中止、错过探访及受试者未能完成所有项目或测试(即使对于尚未中止试验的受试者)[46]。作者应报告缺失数据的数量,有关缺失原因的证据及有关缺失(如随机缺失)的判断基础的假设[83]。对于每个结果,作者应描述分析人群(即符合条件的受试者)和处理缺失数据的方法,包括说明缺失受试者的程序(即退出试验、未完成评估、或其他未提供数据的受试者)和说明缺少的数据项的程序(即问卷中未完成的问题)[76]。旨在基于数据集中的其他数据来估计缺失数据的填补方法可能会影响试验结果[84]。使用数据填补时,作者应描述用于填补的变量、实施的填补数量、实施填补的软件过程及为检验有关缺失数据的假设而进行敏感性分析的结果[84]。例如报告结果时不进行推论通常会很有帮助,以帮助读者评估推算数据的后果。
3.12.3 条目 12b:其他分析方法,例如亚组分析,调整后的分析和过程评估
除了分析对主要和次要结局指标的影响之外,试验通常还包括其他分析,例如亚组分析和中期分析,以调查变化过程[51, 85]。所有分析报告的详细程度应相同。作者应指出在试验注册或临床试验方案中预先指定了哪些亚组分析(条目 23 和 24),如何构建亚组,并应将确认性分析与探索性分析区分开。对于调整后的分析,作者应报告所使用的统计程序和协变量及合理性。
另外,定性分析可用于调查流程变更、实施过程、情境影响和意外结果[51]。作者应指出是否已进行或计划进行此类分析(如果这样做,将在何处报告)。作者应根据定性研究的报告规范报告定性分析的方法和结果[86]。
3.13 结果:受试者流程
3.13.1 条目 13a:随机分配到各组的受试者例数,接受已分配治疗的例数及纳入主要结局分析的例数
3.13.2 CONSORT-SPI 条目 13a:尽可能说明接触、筛选并在随机分配之前符合资格例数没有纳入的原因
随机分配后的试验受试者的流失会影响内部效度(例如:通过引入选择偏倚),而随机分配前后的流失会影响普遍性[46]。作者应报告有关试验在每个阶段受试者总数的可用信息及未纳入(即在随机分组之前)或中止(即在随机分组之后)的原因。关键阶段特別包括:接触试验参与者、筛选潜在合格者、评估并确认合格者、随机分配合格者、接受干预措施和结果评估。由于每个阶段之间可能会有延迟(例如在随机化和开始干预措施之间)[87],作者应采用流程图以描述与每个关键阶段有关的试验参与者的流失(图 1 和原文附录)。

3.13.3 条目 13b:随机分组后,各组脱落和被剔除的例数,并说明原因
作者应在每个随访时间点报告研究团队对每个随机分组的受试者损耗和数据排除情况[48]。作者应区分出偏离干预措施方案但继续接受治疗的例数、中止接受干预措施治疗但继续提供结果数据的例数及完全中止试验并被研究者排除的受试者例数。作者应提供每种数据缺失(如失去联系、死亡)和排除(如由于对干预措施方案的依从性差而被研究人员排除)的原因,并指出因未知原因而中止的例数。
3.14 结果:招募受试者
3.14.1 条目 14a:定义招募和随访时间的日期
试验日期及其相关活动为读者提供了一些有关试验的历史背景信息。SPIRIT 2013 声明包括一个表格,作者可用来提供完整的试验活动时间表,包括病例招募、随机化前的评估分析、干预措施的治疗时间、随机化后评估的时间计划表及试验何时终止[55]。在描述中,作者应定义基线评估和相对于随机分组的随访时间。例如“4 周随访”就其本身而言,内容并不清楚,可表达不同的含义,如可理解为随机分组后或理解为干预结束后。
3.14.2 条目 14b:为什么试验结束或被停止
作者应说明为何停止试验。可能出于预先确定的原因(如达到样本量并完成预定的随访期)或因结果而中止试验。对于因临时分析而提前终止的试验(条目 7b),作者应说明终止的原因(例如,出于试验的安全性或试验结果没有意义的考虑)及终止规则是否预先确定。如果适用,作者应说明其他停止试验的原因,例如实施方面的挑战(如无法招募足够的受试者)或外部因素(如自然灾害),作者也应指出是否有计划继续收集结果数据(如长期随访)。
3.15 结果:基线数据
3.15.1 条目 15:用一张表格显示每组受试者的基线特征
3.15.2 CONSORT-SPI 条目 15:如适用,应包括社会经济变量
作者应提供一张表格,汇总基线数据,并对每个随机组别进行统计性描述。该表应包括在基线测量的所有重要特征,包括有关试验结果的干预措施前数据及潜在的预后变量。作者应特别注意与社会经济和其他不对等因素有关的特定与试验主题相关的信息[88-90]。对于连续性变量,作者应报告平均值及其方差(如均值和标准差)。对于分类变量,作者应报告每个类别的分子和分母。作者不应对基线数据使用标准误和可信区间,因为它们是推论性的(而非描述性的):推论性统计信息评估观察到的差异是偶然发生的,而随机试验中的所有基线差异都是偶然事件[91]。
3.16 结果:纳入分析的例数
3.16.1 条目 16:各组纳入每种分析的受试者数目及是否按最初的分组分析
虽然流程图有助于指示每个试验阶段的受试者数量,但每个结果中包含的受试者数量通常因结果和分析而有所不同[44]。作者应报告每种分析中每个干预措施的受试者人数,以便读者可解释结果并进行数据的二次分析。对于每个分析结果,作者还应确定分析人群和用于处理缺失数据的方法(条目 12a)[76]。
3.17 结果:结果和估计
3.17.1 条目 17a:对于每个结果,每个组的试验结果及效应估计值及其精确度(例如 95%可信区间)
对于试验的每个结局指标,作者应报告所有分析的总结结果,包括每个试验组的结果及组间的对比、差异的估计量(效应值)、估计的准确性或不确定性(如 95%CI)及每个组中分析所包含的例数。P 值不能描述效果估计的精确度,即使组间差异无统计学意义,作者也应报告精确度[46]。对于分类结局指标,每个分析的总结结果应包括结局相关的受试者数量。效应值可表示为风险比,优势比或风险差异及其精确度(如 95%CI)。对于连续性变量结局指标,每个分析的总结结果应包括平均值及其方差(如均值和标准差)。效应值通常表示为平均差异及其精确度(如 95%CI)。总结结果通常更清楚地显示在表格中,而不是文字叙述。
3.17.2 CONSORT-SPI 条目 17a:说明试验数据的可用性
作为不断发展的开放科学运动的一部分,临床试验者越来越希望能够维护试验数据集,这些数据通过与试验注册链接并发布在受信任的在线存储库中(请参阅 http://www.bitss.org/resource-tag/data-repository/),以促进报告分析和将来二次数据分析的重现性。数据共享还与更高的引用率相关[92]。作者应指出是否及如何获得试验数据集,包括重复研究报告中的相关分析所需的任何源数据和分析代码[24, 93]。应描述在提供试验数据方面的任何法律或道德限制[93]。
3.17.3 条目 17b:对二分类结局,建议同时提供绝对效应值和相对效应值
就其本身而言,相对测量和绝对测量都无法提供有关干预措施效果的全面信息。作者应报告相对效应值(如风险比)以表达效应的强度,并报告绝对效应值(如风险差异)以表明干预措施之间事件的实际差异[94]。
3.18 结果:辅助分析
3.18.1 条目 18:所做的任何其他分析的结果,包括亚组分析、校正分析和过程评估,分辨预先设定的与探索性的分析
作者应报告方法中描述的每个其他分析的结果(条目 12b),指出针对每个结果实施的分析数量,哪些分析是预先指定的,哪些分析不是预先指定的。在评估亚组的效果时,作者应报告各组之间的异质性的交互作用或其他适当的测试,包括估计每个亚组之间的可信区间的干预措施效果差异。比较亚组内变化的检验差异不是评估亚组间差异的合适基础。如果报告调整后的分析,则作者也应提供未调整的测量结果。报告定性数据分析的任何结果的作者应遵循定性研究的报告规范[86],但是要充分地报告这些发现可能需要不止一篇文章[51]。
3.19 结果:危害
3.19.1 条目 19:每组中的所有重要危害或意外效应(有关具体指导,请参阅 CONSORT 危害扩展版)[14 ]
社会和心理干预措施有可能产生意想不到的影响,既可以是有害的又可以是有益的[95]。这些反应,或许在试验方案中已经确定,并与干预措施假设如何起作用的理论有关(条目 2b)[56];或许是完全未预知的结果,未预先指定进行评估。危害可能包括间接影响,例如加剧因干预措施导致的组间或地区间不对等性[89]。在报告有关意外效应的定量数据时,作者应指出如何定义和测量它们及每个试验组每个事件的发生频率。作者应报告定性调查的所有结果,以找出可能的意外效应,因为此信息可能有助于读者在未来研究和实践中使用干预措施做出明智的决定。
3.20 讨论:局限性
3.20.1 条目 20:试验的局限性,报告潜在偏倚和不精确的原因及出现多种分析结果的原因(如果有这种情况的话)
作者应就试验及其结果的优缺点进行不偏不倚的讨论。作者应考虑偏倚风险、效应估计值的精度性、多结局指标的应用和分析及干预措施是否按计划实施和被受试者接受等问题。
3.21 讨论:适用性
3.21.1 条目 21:试验结果的推广性(外部效度,实用性)
作者应论述试验结果的适用性,或作者认为在其他情况下可预期获得试验结果的程度[66]。作者应解释有关适用性的陈述与试验设计和实施之间的关系。需要考虑讨论的关键因素包括:招募、合格标准、样本特征、干预措施实施的促进因素和障碍、对照的选择、评估了什么结果及如何评估、随访时间和临床试验单位的特征等[46, 66]。
3.22 讨论:解释
3.22.1 条目 22:与结果一致的解释,权衡试验结果的利弊,并考虑其他相关证据
作者应根据试验的目的或假设[46]简要解释研究结果。作者可能就干预结果间差异以外的其他结果进行合理的替代性解释[44]。作者应对研究结果进行情景分析,并通过讨论该试验结果与其他相关文献的结果,包括先前的试验和相关的系统评价,从而得出额外的知识[96]。如果临床试验中已将理论用于干预措施的制定或评估(条目 2b),则作者应该讨论该试验的结果如何与以前有关干预措施如何起作用的理论进行比较[97, 98]。作者应考虑描述临床发现的实际意义,包括:研究结果对理论、对临床实践和政策的潜在影响、说明未来有待研究的特定领域以解决当前知识的不足[49]。在讨论试验结果时,作者应避免歪曲陈述或操控结果[99, 100]。
3.23 重要信息:试验注册
3.23.1 条目 23:临床试验注册号和试验注册的名称
试验注册是在公共数据库中发布最少量的信息集,其包括:合格标准、所有结局指标、干预方案和分析计划[101]。试验注册有利于系统评价和 Meta 分析,并对数 10 年来防止报告偏倚的呼吁做出回应[102-104]。现在,遵照国际医学杂志编辑委员会报告规范的期刊发表的所有试验、美国国立卫生研究院及美国医学研究理事会和英国国立卫生研究院资助的所有试验,都必须进行试验注册[62, 63, 105, 106]。
所有的试验,都需进行前瞻性注册。通常在正式开展受试者招募前,在由注册管理机构管理的可公开访问的网站上进行注册,以确保规范[101, 105]。作者应报告试验注册中心的名称,该注册中心提供的试验的唯一标识号及试验注册的阶段。如果作者未注册试验,则应报告此信息及未注册的原因。临床医学中使用的注册管理机构(如 ClinicalTrials.gov)适用于具有社会和心理干预措施试验[107, 108],并且有一些专门为社会和心理干预措施而设的注册机构(http://www.bitss.org/resource-tag/registry/)。
3.24 重要信息:试验方案
3.24.1 条目 24:可获取完整试验方案的地方(如果有)
有关试验设计的详细信息应在可公开访问的临床试验方案中描述(如已出版的文稿、储存库中的报告),其中应包含试验开始后所做的所有修改记录。作者应报告何处可获得该试验方案。关于制定和报告方案的指导最近已经出版[55]。难以找到出版社会和心理干预措施试验方案期刊的作者,可搜索支持注册报告格式的期刊(https://cos.io/rr/)或将其试验方案上传到相关的预印服务器(如 PsyArXiv(https://psyarxiv.com/)和 SocArXiv(https://osf.io/preprints/socarxiv)。
3.25 重要信息:资助
3.25.1 条目 25a:资助来源和其他支持;资助者的角色
有关试验资金和支持的信息对于帮助读者识别潜在的利益冲突非常重要。作者应确定并描述为试验提供金钱或物质支持的所有来源,包括为试验研究者提供工资支持及为试验的任何阶段提供或捐赠的资源(如空间、干预措施材料、评估工具)。作者应报告所支持人员或实体的名称、资助者的姓名及资助编号。他们还应具体说明这些资源在试验的设计、实施、分析和报告中是否有作用及参与或影响的性质。如果资助者没有参与或干预,则作者应具体报告。
3.25.2 CONSORT-SPI 条目 25b:声明任何其他潜在利益
除经济利益外,重要的是作者应按照既定标准声明可能被认为会影响试验设计、实施、分析或报告的任何其他潜在利益[109]。实例包括对干预措施评估方案的遵守或专业培训。作者在声明潜在利益时应谨慎。如果作者没有任何经济、专业、个人或其他潜在利益要声明,则应明确说明。
3.26 重要信息:利益相关方的参与
3.26.1 CONSORT-SPI 新条目–条目 26a:任何有关研发人员在设计、实施、分析或试验报告的参与
干预措施制定人员通常是试验报告的作者。由于干预措施制定人员参与试验可能与试验结果的效应值有关[110, 111],因此作者应报告干预措施制定人员是否参与了试验设计、提供干预措施、评估结果或解释数据。作者还应披露与干预措施制定人员的紧密合作(如曾是制定人员的学生、在与干预措施相关的咨询或顾问委员会中任职)及与干预措施相关的任何法律或知识产权,尤其是如果这些可能导致未来的经济利益。
3.26.2 CONSORT-SPI 新条目–条目 26b:其他利益相关方试验设计、实施、或分析的参与
越来越多的研究人员被要求与对试验结果有直接兴趣的人员(如提供者、客户和付款人)进行协商或合作[112]。利益相关方可能参与设计试验(如选择结果)[76],提供干预措施或解释试验结果。利益相关方的参与可能有助于更好地确保干预措施从研究转向现实环境时的可接受性、可实施性和可持续性[113]。在适用的情况下,作者应描述涉及哪些利益相关方、如何招募他们及他们如何参与试验的各个阶段[114]。作者可能会发现有关公众参与研究的报告标准是有用的[115]。
3.26.3 CONSORT-SPI 新条目–条目 26c:试验中提供的激励措施
向参与者、提供者、组织和其他参与试验的人员提供的激励措施可能会影响招募、参与干预措施及干预措施实施的质量[116]。奖励措施包括金钱补偿、礼物(如伙食、交通、获得服务)、学分和胁迫(如转移监狱)[48]。使用激励措施时,作者应明确说明在哪个试验阶段及出于何种目的提供了激励措施及这些激励措施的含义。作者还应说明激励措施是否因试验组而异,例如对受试者接受实验性干预措施而非对照措施的补偿。
4 结论
当作者准确、完整和透明地报告其方法和结果时,RCT 的结果将得到最佳利用。CONSORT-SPI 2018 清单可帮助研究人员设计和报告未来的试验,并为同行评议和编辑评估稿件的质量提供规范,为资助者设置拨款申请的报告标准提供规范,并为教育工作者提供指导试验方法的规范。每个条目的内容,都应在写作主要文章之前或文章之内解决(例如在正文中、作为在线补充、或通过参考以前的报告)。一些清单条目所需的详细程度取决于被评估的干预措施的性质[70]、试验阶段[117]及试验是否涉及对过程或实施的评估[74]。正如所有 CONSORT 规范一样,CONSORT-SPI 2018 是一个持续发展的文件,随着时间的推移不断进行评估和完善的迭代过程。欢迎研究者就清单和本解释和说明文件提供反馈,特别是作为该领域的新证据和在本报告规范中积累更多经验的反馈。例如关注的读者可就是否应将 CONSORT-SPI 2018 中适用于其他类型试验的某些新条目(如处理缺失数据和试验数据的可用性)纳入主要 CONSORT 声明的下一次更新中提供反馈。我们还鼓励行为和社会科学领域的期刊加入到支持 CONSORT 报告规范的数百种医学期刊行列,并向我们通报此类支持。这种集体努力的最终好处应该是带来更好的临床实践、更健康的生活和更好的生活质量。
1 背景
1.1 CONSORT-SPI 2018 的解释与说明
研发随机对照试验报告规范 CONSORT 声明旨在帮助作者报告随机对照试验(randomised controlled trials,RCTs)[1]。它改善了医学报告的质量[2-5],并已获得 600 多种期刊和知名编辑团体的正式支持[6]。少数期刊已实施 CONSORT,尤其是其扩展声明,成为稿件提交、同行评议和编辑决策过程的要求[6, 7]。CONSORT 声明的扩展版适用于特定的试验设计[8-11]、数据类型(如患者报告结局、危害和摘要信息)[12-14]和干预措施[15-17]。
许多回顾性研究表明,社会和心理干预措施的随机对照试验,通常没有报告足够的准确性、全面性和透明度以重复这些研究,没有评估其质量及了解应在何人和何种情况下使用干预措施[18-22]。此外,由于既往研究通常不会共享临床试验方案、结果数据及实施社会和心理干预措施所需的材料,行为和社会科学家可能会无法重复或综合以前的研究[23-28]。这些低效率导致有效干预措施不能理想地传播[29, 30],高估干预措施效果[31]及研究资源浪费[29]。社会和心理干预措施的 RCTs 需要透明且详细地报告,以使报告偏倚最小化,研究证据的可信度和实用性最大化[32, 33]。
我们制定了社会和心理干预措施 CONSORT 2010 声明的扩展版(CONSORT-SPI 2018)[34]。为描述 CONSORT-SPI 2018 的范围,我们通过干预措施的作用机制定义了干预措施[35, 36]。我们将社会和心理干预措施定义为旨在修改社会和心理的流程和系统(如认知、情绪、行为、规范、关系和环境)的活动,并假设对关注的结局有影响的干预措施[37, 38]。社会和心理干预措施可能会提供给有要求的个人,也可能是政策的结果,可能在不同的级别(如个人、团体、地区)运作,并且通常是“复杂的”[19]。CONSORT-SPI 2018 主要适用于 RCTs 的报告,尽管该报告规范的某些部分对于进行其他类型的临床试验的研究者[39],或对制定和评估复杂干预措施感兴趣的研究者可能有用[40]。此外,尽管此报告中的术语最适合平行随机对照试验,该报告规范亦可应用于其他设计(如阶梯随机对照试验和单病例随机对照试验)。
2 方法
我们之前曾报道过用于制定 CONSORT-SPI 2018 的方法[41]。我们首先对现有报告规范和试验报告的质量进行了系统评价[18]。其次,我们在 2013 年 9 月至 2014 年 2 月进行了国际在线德尔菲流程(Delphi process),以优先考虑系统评价中确定的 CONSORT-SPI 2018 清单和流程图的潜在条目。经德尔菲调查的条目可在 ReShare 网站(10.5255/UKDA-SN-851981)上获取。第三,我们召开了一次共识会议,以最终确定清单和流程图的内容。会议于 2014 年 3 月举行,由 31 位科学家、期刊编辑和研究资助者组成。写作小组起草了 CONSORT-SPI 2018,共识小组的参与者(见原文附录)提供了反馈意见并同意 CONSORT-SPI 2018 扩展声明[42]的最终文稿及本解释与说明(E&E)文件。
CONSORT-SPI 2018 清单扩展了 CONSORT 2010 中的 25 个条目(包括 14 个亚条目)中的 9 个(表 1;新条目在“CONSORT-SPI 2018”栏中),并包括修改后的流程图。参会者还投票通过添加有关利益相关方参与的新条目,并建议修改现有的 CONSORT 2010 清单条目(表 2)。本解释与说明文件简要概述了 CONSORT 2010 解释与说明文件中针对 CONSORT 2010 每个条目的内容[43],这些内容是针对行为和社会科学受众而量身定制的,它为 CONSORT-SPI 2018 中的新条目提供了解释与说明。具体而言,对于 CONSORT 2010 和 CONSORT-SPI 2018 中的每个条目,此解释与说明均提供了清单条目的依据及行为和社会科学受众的报告示例(见原文附录)。在整篇文章中,我们使用“受试者”一词来指代干预措施的目标“受试者单位”,这些受试者可能是个人、群体或地区(即场所或地点)[44]。虽然我们在 CONSORT 2010 清单中包括了有关每个条目的简短说明,但读者可在 CONSORT 网站(www.consort-statement.org)和 CONSORT 2010 解释与说明[43]上找到有关这些条目的更多信息。


3 结果和讨论
CONSORT-SPI 的解释与说明。
3.1 文题和摘要
3.1.1 条目 1a:文题能识别是随机试验
在文题中列明“随机”一词,会增加文章在数据库中被正确标注和在文章检索中被获取的可能性[45]。作者应考虑在文题中提供信息以帮助感兴趣的读者,如干预措施的名称和试验所解决的问题[46]。我们建议作者避免使用无信息的文题(如醒目的短语或典故),因为这减少了可用于帮助读者识别相关文稿的空间[45, 46]。
3.1.2 条目 1b:结构式摘要,包括试验设计、方法、结果和结论几个部分(有关具体指导,请参见 CONSORT 摘要扩展版)[13 , 47 ]
文章中被广泛阅读最多的部分是摘要[46],它们常被用于在电子数据库中标注索引报告[45]。作者应遵循 CONSORT 摘要扩展版的要求,该扩展版为结构化的期刊文章摘要和会议摘要提供了详细建议。基于 CONSORT 摘要扩展版,我们为社会和心理干预措施随机对照试验报告量身定制了 CONSORT-SPI 2018 摘要报告清单,包括目的、试验设计、受试者和干预措施等(表 3 和原文附录)相关条目[47]。

3.2 引言
3.2.1 条目 2a:科学背景和对试验理由的解释
有条理的引言应描述试验的基本原理及试验如何为已知的结果做出贡献[48]。特别是引言应描述目标问题或议题[49]及已知关于干预措施的内容,最好是参考系统评价[46]。
3.2.2 条目 2b:具体目的或假设
试验目的总括研究问题,包括有关干预措施效果的预期幅度和方向的任何假设[48, 50]。对具有多个干预措施单元和多个结局指标评估(如个人、团体、地点)的社会和心理干预措施,作者应预先指定每个目标和假设的适用目标。
3.2.3 CONSORT-SPI 2018 条目 2b:如果预先指定,假设干预措施如何起作用
描述所有组(即所有试验组和对照组)的干预措施预期如何影响结果,能提供有关干预措施基础理论的重要信息[46]。对于所评估的每种干预措施,作者都应描述“作用机理”[51],也称为“改变的理由”[52]、“程序理论”[53]或“因果路径”[54]。作者应说明在试验前如何考虑干预措施影响结局指标及是否预先确定了假设的作用机制,理想情况下应与其临床试验注册和临床试验方案互相参照[55]。具体而言,作者应报告:预期每种干预措施的组成部分如何影响可改变的心理和社会过程,对这些社会心理过程的被认定的影响又是如何影响关注的结局,这些过程内容的作用,干预措施实施过程中的促进因素和不良影响因素等及潜在的不良事件或意外后果[48, 56]。图示化描述,例如逻辑模型或分析框架,可能会有助于解释[19]。
3.3 方法:试验设计
3.3.1 条目 3a:描述试验设计(例如平行设计,析因设计),包括受试者分配入各组的比例
明确的试验设计细节有助于读者评估实现试验目标的试验方法的适用性[46, 57],清晰透明地报告所有试验设计特征,有助于试验的可重现性[58]。作者应解释他们对设计的选择(特别是如果它不是一个个体化的随机两组平行试验)[9];说明分配比率及其理由;并指出该试验是否旨在评估干预措施的优劣,等效性或非劣势性[10, 59, 60]。
3.3.2 CONSORT-SPI 2018 条目 3a:如果随机分配的单位不是个人,请参阅 CONSORT 群组随机对照试验
群组级别(例如学校)的随机化对于试验设计、分析、推断和报告具有重要意义。对于群组随机对照试验,作者应遵循 CONSORT 群组随机对照试验扩展版的要求。由于许多社会和心理干预措施是群组随机分组的,因此我们在表 4 和表 5 中提供了该清单的扩展条目[8]。作者还应报告随机单位,可以是社区单位(如家庭)、组织(如学校、监狱)或地点(如社区),并指定每个分析的单位,尤其是在分析单位与随机单位不一致的情况下(如在群组水平随机分组并分析个体水平评估的结果)。


3.3.3 条目 3b:试验开始后对试验方法所作的重要改变(例如合格受试者的资格标准),并说明原因
与计划的试验方法有偏差是临床试验常见的现象,不一定是研究有缺陷或有偏差。计划方法的变更对于理解和解释试验结果很重要。研究结果报告应与临床试验注册(条目 23)[61-63]及临床试验方案报告(条目 24)互相参照,而注册及试验方案报告必须在分配第一位受试者之前完成[55],同时研究结果报告亦应与预先指定的统计分析计划互相参照[64]。研究结果报告应总结对试验方案和统计分析计划的所有修订,包括何时修订及每个修订的理由。由于选择性报告临床试验结果的现象无处不在[65],因此作者应陈述在试验期间对结果定义的任何更改。
3.4 方法:受试者
3.4.1 条目 4a:受试者的合格标准
受试者的合格标准应描述如何招募受试者(即个人、团体或地点)。读者需要这些信息来了解谁可参加试验及研究结果的可推广性。作者应描述用于确定受试者的所有纳入和排除标准及用于筛选和评估受试者以确定其资格的所有方法[46, 48]。
3.4.2 CONSORT-SPI 2018 条目 4a:如适用,试验场所和其他条件提供干预措施的资格标准
除受试者的合格标准之外,社会和心理干预措施的试验通常还设有针对将招募受试者和提供干预措施的试验环境及干预措施提供者的合格标准[44]。作者应描述这些标准,以帮助读者将试验背景与干预措施可能使用的其他试验背景进行比较[48, 66, 67]。
3.4.3 条目 4b:收集数据的场所和地点
有关干预措施的实施环境和地点及数据收集的信息对于理解试验背景至关重要。重要的细节可能包括地理位置、试验活动的日期和时间、所需空间及可能影响实施的内部环境(如实施组织)和外部环境(如外部背景和环境)的特征[68]。在确定有关报告场所设置和位置的信息时,作者应参考干预措施的作用机制。
3.5 方法:干预措施
3.5.1 条目 5:每个组的干预措施都应有足够的细节允许被重复,包括如何及何时实际实施干预措施
有关全部组别(试验组和对照组)中所有干预措施内容和实施的完整而透明的信息对于理解、重复和合并干预效应至关重要[54, 69]。干预措施的基本信息包括:干预措施的名称、实际提供的干预措施(如材料和程序等)、提供干预措施的人员、以何种方式、何地、何时和多少剂量等[70]。干预措施实施者的详细信息应包括:其专业资格和教育程度、与干预措施或领域相关的专业知识或能力及提供干预措施的培训和监督[71]。显示干预措施活动顺序的表格或图表,如标准临床试验方案条目(SPIRIT)2013 声明[55]中建议的受试者时间表通常是有用的[72]。作者应避免仅使用“常规治疗”或“标准护理”之类的单一标签,因为它们在不同的时间和地点,内容并不统一[48]。
3.5.2 CONSORT-SPI 2018 条目 5a:按计划由提供者实际提供并由受试者使用实施的干预措施的程度
通常,干预措施未能完全按计划实施。作者应描述干预措施提供者实际提供的干预措施情况及受试者实际接受的干预措施程度,包括用于确保或评估干预措施是否由提供者实施及受试者是否按预期接受干预[69]。定量或定性过程评估[51]可用于评估提供者的实际行为(如记录和编码治疗次数)、受试者接受干预措施的数量(如记录参加治疗的次数)及干预组之间的交互影响[73, 74]。作者应将计划中的系统调整(如剪裁)与未预期的试验方案修改区分开来。当这些信息不能包含在一篇文章中时,作者应使用在线附录、附加报告和数据存储库来提供这些信息。
3.5.3 CONSORT-SPI 2018 条目 5b:哪里可获取有关干预措施实施的其他信息
作者应说明读者可在何处找到足够的信息来重复干预措施,如干预措施方案[75]、培训手册[48]、或其他材料(如工作表和网站)[54]。例如开放科学框架等新的在线平台,使研究人员可自由共享部分或全部研究资料(https://osf.io)。
3.5.4 CONSORT-SPI 2018 条目 5c:如适用,干预措施提供者如何被分配到各组
一些试验指定了不同条件的特定提供者,以防止专业知识和固有观点混淆结果。作者应报告是否同一个人提供试验干预措施和比较干预措施,提供者是否关联配套在干预措施组中及分配给每个干预措施提供者的受试者人数。
3.6 方法:结果
3.6.1 条目 6a:完全定义的预定结局指标,包括评估方式和时间
所有结果均应定义得足够详细,以供其他人使用试验数据重现结果[50, 76]。结果定义包括:① 领域(如抑郁症);② 测量(如贝克抑郁量表 II 认知亚量表);③ 特定指标(如某个时间点的值,相对于基线的变化);④ 聚合方法(如均值,比例);⑤ 时间点(如干预后 3 个月)[50]。此外,作者应报告收集结果数据的方法和人员、测量的性质或参考有关此信息之前的报告用来提高测量质量的方法(如对结果评估者的培训)及各试验组之间结果评估的任何差异[46]。作者还应指出读者可从何处获取用于测量结果的材料[24]。当试验包含无法公开获得的资料(如问卷)时,作者应提供副本(例如,通过在线存储库或作为在线附录)。
3.6.2 条目 6b:试验开始后对结局指标的任何改变,并说明原因
试验中所有评估的结果都应报告出来。如果报告的结局与试验注册(条目 23)或临床试验方案(条目 24)中预设的结局指标不同,则作者应说明增加了和去除了哪些结局指标。为了使读者能够评估结局转换带来的偏倚风险,作者还应确定结局指标重要程度的任何变化(如主要或次要)[77]。作者应提供所做任何更改的理由,并说明这些更改是在收集数据之前还是之后进行的。
3.7 方法:样本量
3.7.1 条目 7a:如何确定样本量
作者应指出试验的预期样本量及如何确定样本量,包括样本量的确定是使用样本量计算的先导试验还是由于实际限制。如果进行了先导试验计算样本量,作者应报告用于样本量计算的效果估计及选择它的原因(如通过对先前试验的 Meta 分析得出的最小效应量)。如果未进行预先样本量计算,那么作者不应该提出事后计算,而应该提出该样本估计的真正原因(例如时间或资金限制)及其检测每种结果的实际功效(条目 17)。
3.7.2 条目 7b:如适用,解释任何中期分析和中止准则
多种统计分析可能导致假阳性结果,尤其是在使用基于统计学意义的中止原则时。应该描述任何中期分析,包括进行了哪些分析(即分析的结果和方法)、进行时间及原因(尤其它们是否预先指定的[78])。作者还应说明停止试验的原因,包括用于确定是否应尽早停止试验的任何程序(如数据安全监控委员会的例会)[79]。
3.8 方法:随机化序列生成
3.8.1 条目 8a:产生随机分配顺序的方法
在随机对照试验中,受试者通过不可预知的随机方法分配到不同组别。作者应描述用于生成分配序列的方法(如计算机生成的随机数序列),以便读者可评估该过程是否真正随机。作者不应该仅使用“随机”一词来描述确定性的序列(如交替、招募顺序、出生日期)。
3.8.2 条目 8b:随机方法的类型;任何限定的细节(例如怎样分区组和各区组样本多小)
一些试验将随机分组设限,以限定各组的样本数及其重要特征的分布平衡。通常通过将受试者分组为区组,并在每个区组内使用随机序列分配受试者以实施随机化[46]。使用区组方案时,作者应描述如何生成区组、区组的大小、区组大小是否变化及如何变化,试验人员是否隐藏区组的大小等等。分层方案通过基于被认为会修改干预效果的位置或特性所创建的多个随机分配序列限定随机化[46]。使用分层时,作者应报告为什么使用分层,并描述用于分层的变量,包括每个分层类别的临界值。使用最小化变量时,作者应报告用于最小化的变量并包括统计代码。当对随机化没有限定时,作者应声明他们使用了“简单随机化”[43]。
3.9 方法:随机化分配隐藏机制
3.9.1 条目 9:用于实现随机分配顺序的机制,描述干预措施分配之前为隐藏序列号所采取的步骤
除了生成真正的随机序列(条目 8a)外,研究人员还应隐藏序列,以防止招募者和分配受试者的人员预知分配方案。否则,招募和分配方案可能受到因为隐藏下一受试者的分配方案而影响。作者应报告是否及如何实施分配隐藏[80, 81]。分配隐藏后,作者应描述该机制及如何监控此机制以避免分配隐藏被篡改或破解(例如集中式或“第三方”分配、自动分配系统、顺序编号的相同容器、密封的不透明信封)。虽然不是所有的受试者可进行盲法处理,但始终可进行随机分配隐藏。
3.10 方法:随机化实施
3.10.1 条目 10:谁生成随机分配序列,谁招募受试者及谁分配干预措施给受试者
在许多单独的随机对照试验中,生成随机序列和隐藏随机序列的人员与实施随机序列的人员不同。这样可防止篡改或破解随机序列隐藏[48]。在招募受试者(如小组,地点)并将其随机分组的试验中,可使用其他程序来确保试验的真正随机分组。作者应指出每个程序(即生成随机序列,注册受试者,并将受试者分配给不同的干预措施组别)的实施者及用于保护随机序列的方法。
3.11 方法:分组认知
3.11.1 条目 11a:分配后谁知道干预分配(例如,受试者、提供者和结局评价者)及如何实施隐藏
分配隐藏(盲法)是指随机分组后对于参与试验的人员中隐瞒干预措施分组的信息[46]。盲法的实施,可减少由于可能知道干预措施的分组方案而对其效果的内部效度带来的影响。作者应说明是否及如何使受试者、干预措施提供者、数据收集者和数据分析人员不知道干预措施分配方案。如果没有实施盲法(如因为不可能),作者应该描述用来评估效果和期望偏倚的方法(如隐藏试验假设,测量受试者的期望),如果有的话[82]。尽管通常不可能对干预措施提供者和受试者设盲,但对于通过访谈或观察评估的试验结局评估者施盲通常是可行的。如果对盲法成功率进行了检查,作者应报告结局评估者对参与者的干预状态保持设盲的程度。
3.11.2 条目 11b:如果相关,说明干预措施的相似性
特别是因为在许多社会和心理干预措施试验中都不可能对干预措施提供者和受试者设盲,因此作者应描述提供给每组的干预措施之间的差异,这些差异可能导致干预措施提供者和受试者的效果和期望方面产生不同。重要细节包括干预措施的组成和可接受度方面的差异、共同干预措施(或辅助干预措施)可能适用于某些组而不是其他组及组之间背景的差异(如实施干预措施地点的差异)。
3.12 方法:分析方法
3.12.1 条目 12a:用于比较各组结局指标的统计方法
完整的统计报告使读者可了解结果并重现分析[48]。对于每个结果,作者应描述其分析方法,包括对协变量的变换和调整及分析方法是预先选择还是在数据收集后确定。在美国,由美国国立卫生研究院资助的试验必须将统计分析计划及其结果保存在 ClinicalTrials.gov 上[62, 63]。其他资金来源支持的临床研究报告的作者亦应确定是否有类似的要求。对于群组随机试验,作者应说明数据分析的单位数是否不同于样本分配的单位数,如果适用,还应说明用于解释分配的单位数、干预措施水平和分析单位之间差异的分析方法等[8, 44, 46]。作者还应注意对分析数据进行的任何变换的任何程序和理由[46]。为促进研究试验的完全可重复性,作者应报告用于运行分析的软件并提供确切的统计代码[24]。
3.12.2 CONSORT-SPI 扩展条目 12a:如何处理缺失的数据及任何填补方法的细节
由于许多原因,社会和心理干预措施的随机对照试验中数据缺失很常见,如受试者中止、错过探访及受试者未能完成所有项目或测试(即使对于尚未中止试验的受试者)[46]。作者应报告缺失数据的数量,有关缺失原因的证据及有关缺失(如随机缺失)的判断基础的假设[83]。对于每个结果,作者应描述分析人群(即符合条件的受试者)和处理缺失数据的方法,包括说明缺失受试者的程序(即退出试验、未完成评估、或其他未提供数据的受试者)和说明缺少的数据项的程序(即问卷中未完成的问题)[76]。旨在基于数据集中的其他数据来估计缺失数据的填补方法可能会影响试验结果[84]。使用数据填补时,作者应描述用于填补的变量、实施的填补数量、实施填补的软件过程及为检验有关缺失数据的假设而进行敏感性分析的结果[84]。例如报告结果时不进行推论通常会很有帮助,以帮助读者评估推算数据的后果。
3.12.3 条目 12b:其他分析方法,例如亚组分析,调整后的分析和过程评估
除了分析对主要和次要结局指标的影响之外,试验通常还包括其他分析,例如亚组分析和中期分析,以调查变化过程[51, 85]。所有分析报告的详细程度应相同。作者应指出在试验注册或临床试验方案中预先指定了哪些亚组分析(条目 23 和 24),如何构建亚组,并应将确认性分析与探索性分析区分开。对于调整后的分析,作者应报告所使用的统计程序和协变量及合理性。
另外,定性分析可用于调查流程变更、实施过程、情境影响和意外结果[51]。作者应指出是否已进行或计划进行此类分析(如果这样做,将在何处报告)。作者应根据定性研究的报告规范报告定性分析的方法和结果[86]。
3.13 结果:受试者流程
3.13.1 条目 13a:随机分配到各组的受试者例数,接受已分配治疗的例数及纳入主要结局分析的例数
3.13.2 CONSORT-SPI 条目 13a:尽可能说明接触、筛选并在随机分配之前符合资格例数没有纳入的原因
随机分配后的试验受试者的流失会影响内部效度(例如:通过引入选择偏倚),而随机分配前后的流失会影响普遍性[46]。作者应报告有关试验在每个阶段受试者总数的可用信息及未纳入(即在随机分组之前)或中止(即在随机分组之后)的原因。关键阶段特別包括:接触试验参与者、筛选潜在合格者、评估并确认合格者、随机分配合格者、接受干预措施和结果评估。由于每个阶段之间可能会有延迟(例如在随机化和开始干预措施之间)[87],作者应采用流程图以描述与每个关键阶段有关的试验参与者的流失(图 1 和原文附录)。

3.13.3 条目 13b:随机分组后,各组脱落和被剔除的例数,并说明原因
作者应在每个随访时间点报告研究团队对每个随机分组的受试者损耗和数据排除情况[48]。作者应区分出偏离干预措施方案但继续接受治疗的例数、中止接受干预措施治疗但继续提供结果数据的例数及完全中止试验并被研究者排除的受试者例数。作者应提供每种数据缺失(如失去联系、死亡)和排除(如由于对干预措施方案的依从性差而被研究人员排除)的原因,并指出因未知原因而中止的例数。
3.14 结果:招募受试者
3.14.1 条目 14a:定义招募和随访时间的日期
试验日期及其相关活动为读者提供了一些有关试验的历史背景信息。SPIRIT 2013 声明包括一个表格,作者可用来提供完整的试验活动时间表,包括病例招募、随机化前的评估分析、干预措施的治疗时间、随机化后评估的时间计划表及试验何时终止[55]。在描述中,作者应定义基线评估和相对于随机分组的随访时间。例如“4 周随访”就其本身而言,内容并不清楚,可表达不同的含义,如可理解为随机分组后或理解为干预结束后。
3.14.2 条目 14b:为什么试验结束或被停止
作者应说明为何停止试验。可能出于预先确定的原因(如达到样本量并完成预定的随访期)或因结果而中止试验。对于因临时分析而提前终止的试验(条目 7b),作者应说明终止的原因(例如,出于试验的安全性或试验结果没有意义的考虑)及终止规则是否预先确定。如果适用,作者应说明其他停止试验的原因,例如实施方面的挑战(如无法招募足够的受试者)或外部因素(如自然灾害),作者也应指出是否有计划继续收集结果数据(如长期随访)。
3.15 结果:基线数据
3.15.1 条目 15:用一张表格显示每组受试者的基线特征
3.15.2 CONSORT-SPI 条目 15:如适用,应包括社会经济变量
作者应提供一张表格,汇总基线数据,并对每个随机组别进行统计性描述。该表应包括在基线测量的所有重要特征,包括有关试验结果的干预措施前数据及潜在的预后变量。作者应特别注意与社会经济和其他不对等因素有关的特定与试验主题相关的信息[88-90]。对于连续性变量,作者应报告平均值及其方差(如均值和标准差)。对于分类变量,作者应报告每个类别的分子和分母。作者不应对基线数据使用标准误和可信区间,因为它们是推论性的(而非描述性的):推论性统计信息评估观察到的差异是偶然发生的,而随机试验中的所有基线差异都是偶然事件[91]。
3.16 结果:纳入分析的例数
3.16.1 条目 16:各组纳入每种分析的受试者数目及是否按最初的分组分析
虽然流程图有助于指示每个试验阶段的受试者数量,但每个结果中包含的受试者数量通常因结果和分析而有所不同[44]。作者应报告每种分析中每个干预措施的受试者人数,以便读者可解释结果并进行数据的二次分析。对于每个分析结果,作者还应确定分析人群和用于处理缺失数据的方法(条目 12a)[76]。
3.17 结果:结果和估计
3.17.1 条目 17a:对于每个结果,每个组的试验结果及效应估计值及其精确度(例如 95%可信区间)
对于试验的每个结局指标,作者应报告所有分析的总结结果,包括每个试验组的结果及组间的对比、差异的估计量(效应值)、估计的准确性或不确定性(如 95%CI)及每个组中分析所包含的例数。P 值不能描述效果估计的精确度,即使组间差异无统计学意义,作者也应报告精确度[46]。对于分类结局指标,每个分析的总结结果应包括结局相关的受试者数量。效应值可表示为风险比,优势比或风险差异及其精确度(如 95%CI)。对于连续性变量结局指标,每个分析的总结结果应包括平均值及其方差(如均值和标准差)。效应值通常表示为平均差异及其精确度(如 95%CI)。总结结果通常更清楚地显示在表格中,而不是文字叙述。
3.17.2 CONSORT-SPI 条目 17a:说明试验数据的可用性
作为不断发展的开放科学运动的一部分,临床试验者越来越希望能够维护试验数据集,这些数据通过与试验注册链接并发布在受信任的在线存储库中(请参阅 http://www.bitss.org/resource-tag/data-repository/),以促进报告分析和将来二次数据分析的重现性。数据共享还与更高的引用率相关[92]。作者应指出是否及如何获得试验数据集,包括重复研究报告中的相关分析所需的任何源数据和分析代码[24, 93]。应描述在提供试验数据方面的任何法律或道德限制[93]。
3.17.3 条目 17b:对二分类结局,建议同时提供绝对效应值和相对效应值
就其本身而言,相对测量和绝对测量都无法提供有关干预措施效果的全面信息。作者应报告相对效应值(如风险比)以表达效应的强度,并报告绝对效应值(如风险差异)以表明干预措施之间事件的实际差异[94]。
3.18 结果:辅助分析
3.18.1 条目 18:所做的任何其他分析的结果,包括亚组分析、校正分析和过程评估,分辨预先设定的与探索性的分析
作者应报告方法中描述的每个其他分析的结果(条目 12b),指出针对每个结果实施的分析数量,哪些分析是预先指定的,哪些分析不是预先指定的。在评估亚组的效果时,作者应报告各组之间的异质性的交互作用或其他适当的测试,包括估计每个亚组之间的可信区间的干预措施效果差异。比较亚组内变化的检验差异不是评估亚组间差异的合适基础。如果报告调整后的分析,则作者也应提供未调整的测量结果。报告定性数据分析的任何结果的作者应遵循定性研究的报告规范[86],但是要充分地报告这些发现可能需要不止一篇文章[51]。
3.19 结果:危害
3.19.1 条目 19:每组中的所有重要危害或意外效应(有关具体指导,请参阅 CONSORT 危害扩展版)[14 ]
社会和心理干预措施有可能产生意想不到的影响,既可以是有害的又可以是有益的[95]。这些反应,或许在试验方案中已经确定,并与干预措施假设如何起作用的理论有关(条目 2b)[56];或许是完全未预知的结果,未预先指定进行评估。危害可能包括间接影响,例如加剧因干预措施导致的组间或地区间不对等性[89]。在报告有关意外效应的定量数据时,作者应指出如何定义和测量它们及每个试验组每个事件的发生频率。作者应报告定性调查的所有结果,以找出可能的意外效应,因为此信息可能有助于读者在未来研究和实践中使用干预措施做出明智的决定。
3.20 讨论:局限性
3.20.1 条目 20:试验的局限性,报告潜在偏倚和不精确的原因及出现多种分析结果的原因(如果有这种情况的话)
作者应就试验及其结果的优缺点进行不偏不倚的讨论。作者应考虑偏倚风险、效应估计值的精度性、多结局指标的应用和分析及干预措施是否按计划实施和被受试者接受等问题。
3.21 讨论:适用性
3.21.1 条目 21:试验结果的推广性(外部效度,实用性)
作者应论述试验结果的适用性,或作者认为在其他情况下可预期获得试验结果的程度[66]。作者应解释有关适用性的陈述与试验设计和实施之间的关系。需要考虑讨论的关键因素包括:招募、合格标准、样本特征、干预措施实施的促进因素和障碍、对照的选择、评估了什么结果及如何评估、随访时间和临床试验单位的特征等[46, 66]。
3.22 讨论:解释
3.22.1 条目 22:与结果一致的解释,权衡试验结果的利弊,并考虑其他相关证据
作者应根据试验的目的或假设[46]简要解释研究结果。作者可能就干预结果间差异以外的其他结果进行合理的替代性解释[44]。作者应对研究结果进行情景分析,并通过讨论该试验结果与其他相关文献的结果,包括先前的试验和相关的系统评价,从而得出额外的知识[96]。如果临床试验中已将理论用于干预措施的制定或评估(条目 2b),则作者应该讨论该试验的结果如何与以前有关干预措施如何起作用的理论进行比较[97, 98]。作者应考虑描述临床发现的实际意义,包括:研究结果对理论、对临床实践和政策的潜在影响、说明未来有待研究的特定领域以解决当前知识的不足[49]。在讨论试验结果时,作者应避免歪曲陈述或操控结果[99, 100]。
3.23 重要信息:试验注册
3.23.1 条目 23:临床试验注册号和试验注册的名称
试验注册是在公共数据库中发布最少量的信息集,其包括:合格标准、所有结局指标、干预方案和分析计划[101]。试验注册有利于系统评价和 Meta 分析,并对数 10 年来防止报告偏倚的呼吁做出回应[102-104]。现在,遵照国际医学杂志编辑委员会报告规范的期刊发表的所有试验、美国国立卫生研究院及美国医学研究理事会和英国国立卫生研究院资助的所有试验,都必须进行试验注册[62, 63, 105, 106]。
所有的试验,都需进行前瞻性注册。通常在正式开展受试者招募前,在由注册管理机构管理的可公开访问的网站上进行注册,以确保规范[101, 105]。作者应报告试验注册中心的名称,该注册中心提供的试验的唯一标识号及试验注册的阶段。如果作者未注册试验,则应报告此信息及未注册的原因。临床医学中使用的注册管理机构(如 ClinicalTrials.gov)适用于具有社会和心理干预措施试验[107, 108],并且有一些专门为社会和心理干预措施而设的注册机构(http://www.bitss.org/resource-tag/registry/)。
3.24 重要信息:试验方案
3.24.1 条目 24:可获取完整试验方案的地方(如果有)
有关试验设计的详细信息应在可公开访问的临床试验方案中描述(如已出版的文稿、储存库中的报告),其中应包含试验开始后所做的所有修改记录。作者应报告何处可获得该试验方案。关于制定和报告方案的指导最近已经出版[55]。难以找到出版社会和心理干预措施试验方案期刊的作者,可搜索支持注册报告格式的期刊(https://cos.io/rr/)或将其试验方案上传到相关的预印服务器(如 PsyArXiv(https://psyarxiv.com/)和 SocArXiv(https://osf.io/preprints/socarxiv)。
3.25 重要信息:资助
3.25.1 条目 25a:资助来源和其他支持;资助者的角色
有关试验资金和支持的信息对于帮助读者识别潜在的利益冲突非常重要。作者应确定并描述为试验提供金钱或物质支持的所有来源,包括为试验研究者提供工资支持及为试验的任何阶段提供或捐赠的资源(如空间、干预措施材料、评估工具)。作者应报告所支持人员或实体的名称、资助者的姓名及资助编号。他们还应具体说明这些资源在试验的设计、实施、分析和报告中是否有作用及参与或影响的性质。如果资助者没有参与或干预,则作者应具体报告。
3.25.2 CONSORT-SPI 条目 25b:声明任何其他潜在利益
除经济利益外,重要的是作者应按照既定标准声明可能被认为会影响试验设计、实施、分析或报告的任何其他潜在利益[109]。实例包括对干预措施评估方案的遵守或专业培训。作者在声明潜在利益时应谨慎。如果作者没有任何经济、专业、个人或其他潜在利益要声明,则应明确说明。
3.26 重要信息:利益相关方的参与
3.26.1 CONSORT-SPI 新条目–条目 26a:任何有关研发人员在设计、实施、分析或试验报告的参与
干预措施制定人员通常是试验报告的作者。由于干预措施制定人员参与试验可能与试验结果的效应值有关[110, 111],因此作者应报告干预措施制定人员是否参与了试验设计、提供干预措施、评估结果或解释数据。作者还应披露与干预措施制定人员的紧密合作(如曾是制定人员的学生、在与干预措施相关的咨询或顾问委员会中任职)及与干预措施相关的任何法律或知识产权,尤其是如果这些可能导致未来的经济利益。
3.26.2 CONSORT-SPI 新条目–条目 26b:其他利益相关方试验设计、实施、或分析的参与
越来越多的研究人员被要求与对试验结果有直接兴趣的人员(如提供者、客户和付款人)进行协商或合作[112]。利益相关方可能参与设计试验(如选择结果)[76],提供干预措施或解释试验结果。利益相关方的参与可能有助于更好地确保干预措施从研究转向现实环境时的可接受性、可实施性和可持续性[113]。在适用的情况下,作者应描述涉及哪些利益相关方、如何招募他们及他们如何参与试验的各个阶段[114]。作者可能会发现有关公众参与研究的报告标准是有用的[115]。
3.26.3 CONSORT-SPI 新条目–条目 26c:试验中提供的激励措施
向参与者、提供者、组织和其他参与试验的人员提供的激励措施可能会影响招募、参与干预措施及干预措施实施的质量[116]。奖励措施包括金钱补偿、礼物(如伙食、交通、获得服务)、学分和胁迫(如转移监狱)[48]。使用激励措施时,作者应明确说明在哪个试验阶段及出于何种目的提供了激励措施及这些激励措施的含义。作者还应说明激励措施是否因试验组而异,例如对受试者接受实验性干预措施而非对照措施的补偿。
4 结论
当作者准确、完整和透明地报告其方法和结果时,RCT 的结果将得到最佳利用。CONSORT-SPI 2018 清单可帮助研究人员设计和报告未来的试验,并为同行评议和编辑评估稿件的质量提供规范,为资助者设置拨款申请的报告标准提供规范,并为教育工作者提供指导试验方法的规范。每个条目的内容,都应在写作主要文章之前或文章之内解决(例如在正文中、作为在线补充、或通过参考以前的报告)。一些清单条目所需的详细程度取决于被评估的干预措施的性质[70]、试验阶段[117]及试验是否涉及对过程或实施的评估[74]。正如所有 CONSORT 规范一样,CONSORT-SPI 2018 是一个持续发展的文件,随着时间的推移不断进行评估和完善的迭代过程。欢迎研究者就清单和本解释和说明文件提供反馈,特别是作为该领域的新证据和在本报告规范中积累更多经验的反馈。例如关注的读者可就是否应将 CONSORT-SPI 2018 中适用于其他类型试验的某些新条目(如处理缺失数据和试验数据的可用性)纳入主要 CONSORT 声明的下一次更新中提供反馈。我们还鼓励行为和社会科学领域的期刊加入到支持 CONSORT 报告规范的数百种医学期刊行列,并向我们通报此类支持。这种集体努力的最终好处应该是带来更好的临床实践、更健康的生活和更好的生活质量。