新型冠状病毒肺炎(COVID-19)疫情爆发以来,从 2020 年 1 月 23 日至 2020 年 3 月 5 日由中国临床研究人员在中国临床试验注册中心(www.chictr.org.cn)和美国临床试验注册网站(www.clinicaltrials.gov)两个平台上登记注册并已经或将要在中国境内进行的针对新型冠状病毒肺炎的干预性临床试验项目总数已超过 200 个。这一现象引起了社会各界的关注。本文在对已登记注册的 249 个在中国开展的 COVID-19 临床试验项目的主要特征作描述性分析的基础上,借鉴美国国家卫生研究院(National Institutes of Health)组建的专项疾病领域国家临床试验网络的实践,思考在突发流行病情况下提高临床试验质量与效率的对策。
引用本文: 姚晨, 赵文乐. 新型冠状病毒肺炎(COVID-19)临床研究的启示与国家临床试验网络构想. 中国循证医学杂志, 2020, 20(5): 497-503. doi: 10.7507/1672-2531.202003069 复制
世界卫生组织于 2020 年 1 月 30 日发布声明确认 2019 年底的新型冠状病毒肺炎(corona virus disease 2019,COVID-19)疫情是一次国际关注的重大突发公共卫生事件[1,2]。为控制人与人之间病毒传播而采取的隔离封堵措施对社会经济和人民日常生活产生巨大影响[3]。在控制疫情蔓延的同时,及早找到安全有效的治疗措施,降低患者死亡率是临床研究领域的当务之急。高质量科学设计和严格运作的临床试验是检验临床治疗方案安全性与有效性的根本途径[4]。据统计,从 2020 年 1 月 23 日至 2020 年 3 月 5 日由中国临床研究人员申请主办,在中国临床试验注册中心(www.chictr.org.cn)[5]和美国临床试验注册网站(www.clinicaltrials.gov)[6]两个平台上登记注册,并已经或将要在中国境内进行的针对 COVID-19 的各类临床研究项目达到 381 个,其中干预性临床试验项目 249 个。在连续 6 周内,针对一个特定疾病,平均每天注册近 6 个干预性临床试验的现象引起了社会各界的关注[7-15]。这一现象一方面反映了 COVID-19 疫情迅速蔓延的严重程度和临床医学研究人员探索 COVID-19 有效治疗方案的紧迫使命感;另一方面也折射出目前我国在临床试验立项的规范审核、临床试验的科学设计、项目运作的严谨管理和开展重大临床试验项目时国家层面统筹协调的短板。在发生重大突发公共卫生事件且缺乏现成有效治疗方案的紧急情况下,寻找安全有效的治疗方法需要整合全国临床医学与生物统计领域的人才、资金、技术等多方面资源,合作开发设计高质量的临床试验,统一规范相关临床试验的伦理审核,统一组织覆盖全国的临床试验网络,采用集成式信息管理系统,统一对各临床试验项目进行实时严格的项目运作管理、临床数据管理和临床试验数据安全监察。这才能在确保临床试验受试者安全与权益的前提下,尽快得到关于候选治疗方案安全性与有效性的科学证据。本文对已登记注册的 249 个 COVID-19 干预性临床试验项目的基本特征作描述性分析,借鉴美国国家卫生研究院(National Institutes of Health,NIH)组建的专项疾病领域国家临床试验网络的实践,探讨在 COVID-19 疫情突发情况下提高临床试验质量与效率的对策。
1 COVID-19 干预性临床试验现有格局
目前已经在中国和美国临床试验注册网站登记注册的 249 项 COVID-19 干预性临床试验项目的主要设计参数见表 1。绝大部分 COVID-19 干预性临床试验由定点集中救治医院一线临床研究者独立主办,具有明确的针对性和即时性。在疫情迅速蔓延、新冠病毒尚无有效药物、国家层面专项临床试验统筹机制尚不具备的紧急情况下,很多研究者自筹资金,经研究者所在机构的伦理审查委员会快速审核批准后,迅速在本单位启动小样本干预性临床试验,探索各种治疗方案的安全性与有效性,填补了 COVID-19 临床研究的空白;所获得的阶段性结果对后续大规模高质量临床试验的设计提供了宝贵价值。同时,这些临床试验注册信息暴露的资源局限、设计缺陷和可行性风险也值得相关行政主管部门和临床研究学者认真审视与总结。

1.1 临床试验的立项申请与审核批准
与其他领域的科学研究不同,临床试验以病患(或志愿者)为试验接受主体。世界医学协会的赫尔辛基宣言明确要求临床试验必须将受试者安全与权益置于其他利益之上,并尽量降低受试者可能承担的风险[16]。另一方面,随机对照临床试验必须以临床平衡(clinical equipoise)原则为道德基础[17]。将受试者随机分配到临床试验的不同治疗组意味着当前医学界对于临床试验中使用的不同治疗方案的有效性存在真正的不确定性。从伦理角度讲,临床试验不需要竞争,因为竞争背后可能存在有别于受试者安全与权益的学术与商业利益。当一个治疗方案的安全性和有效性被一个高质量的临床试验确认(或排除)之后,对该治疗方案重复进行临床试验有悖于临床平衡原则。在所有 249 个注册登记的 COVID-19 干预性临床试验项目中,16 项研究主要经费来自国家各类科研基金(其中 1 项为国家科技部新型冠状病毒应急专项资助);55 项由地方政府资助(其中 8 项为新冠病毒应急专项资助);33 项为企业资助;约一半临床试验项目由研究者或研究单位自筹经费,未见由国家专项经费资助的大规模多中心临床试验。
由研究者自主发起的临床试验立项,按照常规只需通过研究者所在单位的伦理审查委员会审核。由于各项目在运作期间的数据保密,各单位之间在相关医学和临床试验设计运作领域能力和水平的差异,各机构伦理审查委员会之间把握审核标准的差异,以及单个机构临床试验资源的局限,重复试验、不合理试验设计、低质量试验运作和无法按时完成试验等风险不容忽视。在这 249 个临床试验中,有 27 个临床试验项目包含洛匹那韦/利托那韦;有 22 个临床试验项目包含氯喹、羟氯喹、磷酸氯喹或硫酸羟氯喹;有 6 个临床试验项目包含盐酸阿比多尔。在 59 项包含中医中药治疗方案的临床试验项目中,10 个试验项目列出具体中成药;其余 49 个试验项目使用更为广义的中医辩证治疗或中西医结合治疗。尽管同一治疗方案可能需要在不同的临床试验中针对不同的目标病患群体(轻症、普通型、重症、危重症等)与不同的治疗方案进行对照比较,在一个特定疾病领域内实行全国统一的规划立项和伦理审核是避免重复试验,提高临床试验立项质量和运作效率的关键。
1.2 临床试验的统计学设计
在医学领域,一个治疗方案的安全性和有效性都是通过与另一个治疗方案(包括安慰剂)比较而得出的。需要明确的是,即使数百个患者使用了某个药物治疗之后有 80% 患者恢复了健康并不能说明这个药物的有效性,因为同样比例的患者也可能未经治疗而恢复健康。而在一个对照试验中,一个患者是否符合受试者条件、受试者如何被分配到不同的治疗方案组、如何实施治疗、如何评价治疗的安全性和有效性等环节都可能受到临床研究人员个人意志的影响,从而给研究结果带来选择性偏倚。以现代统计学理论为基础的随机对照试验设计通过随机分组和分配隐藏避免了选择性偏倚,通过盲法评价减少了信息偏倚,保证了临床试验结果的准确性和可信度。在现在检索到的 249 个 COVID-19 干预性临床试验中,192 个试验项目为随机对照试验,其中仅 32 个试验项目表明采取盲法设计,在公开的注册资料中,只有少数的临床试验,如瑞德西韦临床试验方案中明确采用了最佳和严格的随机双盲安慰剂对照试验设计,其余 217 个均为开放性试验或未说明是否采用盲法。
样本量是影响临床试验结果准确性和可信度的主要因素。如果需要比较两种治疗方案(假设死亡率分别为 15% 与 10%),就需要大约 1 400 例受试者。尽管武汉市 COVID-19 累计确诊病例接近 5 万例[2],单个医院符合特定临床试验入组条件的患者数量远低于 1 000 例。受制于临床科研资源,单个医院难以独立承担大样本量临床试验。在 249 个登记注册的 COVID-19 干预性临床试验中,明确登记为多中心试验的有 41 项;其余 208 项为单中心试验或未加说明。而大量单中心试验的局限也反映在样本量上:约一半试验的样本量不足 100 例。而 249 个临床试验项目的样本量合计超过了当时中国全部 COVID-19 确诊病例数的三分之一。大量小样本量临床试验项目不仅本身难以取得对特定治疗方案安全性与有效性的准确评估,而且会争抢患者资源,对需要大样本量完成的高质量临床试验项目构成威胁[18]。
1.3 临床试验的项目运作管理与数据采集
高质量的临床试验结果来自科学的试验方案设计和严格的项目运作管理。垃圾数据只会产生垃圾证据。我国的三甲医院数量超过 1 300 家[19],但具备独立设计运作高质量大型多中心临床试验项目所必需的专业人才资源和技术支撑条件的医院很少。一些重要的临床试验项目依旧使用纸质病例报告表(case report form,CRF)采集数据,即使采用了电子 CRF 依然由研究者人工输入数据。试验中心和研究人员的资质文件提交审核的电子化程度不高。与电子数据采集系统集成的中央随机系统也不多。由于编制与人事管理的限制,医院通常无法为具体临床试验项目配备专职临床研究人员。临床试验数据管理和监查主要依靠合同研究组织(Contract Research Organization,CRO)。新冠病毒的高度传染性使得机构外人员现场即时采集数据异常困难,而工作在临床一线的医生和护士又难以集中精力来填写临床试验的病例报告表。
COVID-19 临床试验所面临的问题呼唤一种新的临床试验规划管理理念,如临床医生按照临床试验方案要求进行治疗和检查,认真书写电子医疗病历(electronic medical records,EMR),然后通过信息技术进行电子数据抓取(electronic data capture,EDC)。美国作为临床试验大国在近十多年通过组建国家临床试验网络的方法提高临床试验设计运作质量与效率的做法值得借鉴。
2 NIH 临床试验网络的实践
设计和运作高质量临床试验除了合格的专业人才,还需要不菲的资金支持和充足的患者资源。2015~2016 年中,美国联邦食品药品管理局(Food and Drug Administration,FDA)依据 138 个重要临床试验的结果批准了 56 项新的治疗药物。这 138 个临床试验的中位成本为 1 900 万美元,单个受试者中位成本为 4.1 万美元;其中 112 个随机对照试验的中位成本为 3 510 万美元[20]。在美国开展的临床试验中有 80% 无法按期完成受试者入组。在多中心临床试验中,50% 的试验中心只入组一个受试者或完全无患者入组[21]。为提高临床试验的质量和运作效率,进入 21 世纪以来,各个 NIH 专业研究所在许多重要的疾病领域陆续组建起覆盖全国的临床试验网络;例如国家癌症研究所(National Cancer Institute,NCI)组建的国家临床试验网络(National Clinical Trials Network,NCTN)[22],国家神经系统疾病与脑卒中研究所(National Institute of Neurological Disorders and Stroke,NINDS)组建的国家卫生研究院卒中临床试验网络(NIH Stroke Trials Network,NIH StrokeNet)[23],和由国家过敏与传染病研究所(National Institute of Allergy and Infectious Diseases,NIAID)组建的艾滋病预防临床试验网络(HIV Prevention Trials Network,HPTN)[24]等。这些临床试验网络面向不同的疾病领域,但具备基本相似的组织结构和功能。
2.1 NIH 国家临床试验网络的基础设施
NIH 针对具体疾病研究领域组建的国家临床试验网络基本结构如图 1 所示。由 NIH 专业主管研究所资助建设的网络基础设施(network infrastructure)包括 1 个国家临床协调中心(National Clinical Coordinating Center,NCCC),1 个国家统计与数据管理中心(National Statistical and Data Management Center,NSDMC)和若干区域协调中心(Regional Coordinating Centers)。各中心的选择通过公开项目招标(Funding Opportunity Announcement,FOA)和机构研究项目申请(Research Grant Application),为具体项目设置同行专家评审小组评审,由 NIH 专业主管研究所常设顾问委员会审议是否批准资助。NCCC、NSDMC 和区域协调中心资助额度依网络规模而定。NIH 卒中临床试验网络 NCCC 的年度预算约为 225 万美元[25];NSDMC 的年度预算约为 112 万美元[26],各区域协调中心的年度预算约为 25 万美元[27]。这些资金资助仅支持构架临床试验网络基础设施的运作,具体临床试验项目的运作经费由获得资助的临床试验项目负责人单位向 NCCC 和 NSDMC 另行拨付。国家临床试验网络基础设施要素每隔 5 年进行一次更新审议。通过再次公开招标,同行专家小组评审和顾问委员会审议,淘汰现有基础设施中工作质量和效率不高的机构,接收新的申请单位作为基础设施成员。

NCCC 由在目标疾病领域具备丰富临床研究经验和大型临床试验组织实施能力的研究型大学医学院或大型医学中心承担,负责主持临床试验网络的日常运作,包括临床试验项目的开发、已获立项资助的临床试验项目管理、试验方案的制订与调整、试验项目临床中心的选择与合同签署、研究人员培养、中心伦理审核法规资质文件收集和临床中心研究经费支付。NSDMC 由具备丰富临床试验设计与数据分析经验的统计学专家团队和大型多中心临床试验数据管理人员与技术支撑条件的研究型大学承担;参与新临床试验项目的开发与研究方案的制订与调整,负责临床试验项目的统计学设计,统计分析计划制订,数据采集计划与病例报告表设计,支持网络运作和所有临床试验项目数据和项目管理的数据库信息管理系统。区域协调中心由研究型大学医学院或大型医学中心承担,负责对其下属的网络成员单位在参加具体临床试验项目时提供人员培训和必要的技术支持。区域中心的数量根据网络规模的大小而定,从几个到二十多个不等。NCCC 与区域协调中心作为一个整体,代表了全国在目标疾病领域临床医学研究的最高水平。在此基础上组建的专题工作小组负责新临床试验项目的开发。例如,国家卫生研究院卒中临床试验网络包含 3 个专题工作小组,分别为卒中急诊治疗工作小组、卒中预防工作小组和卒中康复工作小组。各工作小组至少有 2 个成员分别来自 NCCC 或 NSDMC。来自 25 个区域协调中心的负责人按各自研究专长分别加入一个专题工作小组。
从 2018 年起,NIH 要求所有受其资助的多中心临床试验采用中心伦理审查机制[28]。国家临床试验网络由 NCCC 指定一个伦理审查委员会作为网络中心伦理审查委员会独立行使伦理审查职权。在组建国家临床试验网络时,核心任务是设计运作大型多中心临床试验,因此独立的中央伦理审查委员会是网络的一个必不可少的机构,由 NCCC 负责选定。中央伦理审查委员会对网络内所有临床试验项目的立项与运作进行伦理审核。
作为临床试验资助方,NIH 专业主管研究所在组建临床试验网络的同时还成立了一个独立的数据与安全监察委员会(Data and Safety Monitoring Board,DSMB),负责对网络内所有临床试验项目的安全性数据、有效性数据、整体研究进度和数据质量进行定期和不定期审查,并就临床试验项目是否需要终止或按计划继续进行,向资助方和项目承担者提出建议。DSMB 成员由临床试验网络资助方 NIH 专业主管研究所指定,包括相关领域临床医学、生物统计学、临床伦理学和临床试验方法学等方面的专家。
2.2 临床试验项目的开发与运作
国家临床试验网络作为一种临床研究服务设施向目标疾病领域内全国临床研究人员开放。NCCC、NSDMC 和相关临床专题工作小组共同帮助临床试验项目申办人完善项目申请报告,优化临床试验研究方案,制定统计分析计划,编制项目预算,并依据网络成员单位可行性问卷调查结果进行项目可行性分析。专题工作小组成员中大多数是区域协调中心的负责人,代表了具体疾病临床研究专题领域中的国际最高水平。他们的参与有助于避免低水平重复性临床试验。NSDMC 为每一个临床试验申请项目指定一名生物统计学专家负责统计学设计,采用先进临床试验设计和数据分析方法,如贝叶斯适应性试验设计。
临床试验项目的立项与审批按常规研究项目申报程序执行,由同行专家评审小组和专业主管研究所常设顾问委员会审核。国家临床试验网络成员单位人员需要对网络内研究人员提交的临床试验项目评审实行利益冲突回避。目前临床试验项目申请通过各项评审最终获得 NIH 资助的比例不到 10%。
获得资助的临床试验项目由项目负责人(Principal Investigator,PI)配合 NCCC 和 NSDMC 进行项目运作。NCCC 协助项目负责人选择参加试验的临床中心,负责与各临床中心签订临床试验合同,向中心伦理审查委员会提交临床试验研究方案,知情协议书及其他法规文件。根据试验项目的需求,NCCC 负责组建或确定中心药房、医学影像阅读中心、生物样本库、医学安全审核员、中心实验室和临床终点事件判定委员会等临床试验项目运作功能要素。NSDMC 负责临床试验数据采集计划制定,病例报告表设计,临床试验操作手册编制和数据库开发。作为临床试验网络的信息中枢,NSDMC 负责开发基于互联网的管理信息系统,为整个网络的项目管理与数据管理提供安全可靠的技术支持,包括法规资质文件提交与审核、临床研究用药的盲法包装与分发使用全程电子编码的追踪、受试者中央随机化分组、医学影像收集、质检和中心阅片、不良事件医学安全审核、终点事件判定、基于风险的数据监查和现场源数据核查等。
与每个临床试验项目负责人自己组建各自的项目运作管理队伍,投资搭建自己的数据库系统相比,由 NCCC 和 NSDMC 共同执行网络内所有已获资助的临床试验项目的运作管理,具有明显的优越性,可以概括为临床试验项目开发立项的充分科学民主与临床试验项目运作的高度专业化集中相结合。不同临床试验项目共享国家网络资源可以提高项目运作管理的质量和效率。
3 关于中国国家临床试验网络的设想
COVID-19 疫情期间大量临床试验开展的无序状态从一个侧面反映了组建覆盖全国的国家临床试验网络的必要性。其目的是集中人才、资金、技术和患者资源,通过统筹规划,设计运作高质量大规模临床试验,提高在短期内寻找安全有效治疗方案,降低疾病死亡率的机会。
自 2012 年起国家科技部在 20 个疾病领域陆续组建了 50 个国家临床医学研究中心,包括 3 个国家呼吸系统疾病临床医学研究中心。建议在此基础上构建国家呼吸系统疾病临床试验网络,并通过公开招标,同行专家评议,选定一个研究型大学或医院作为网络的统计与数据管理中心,尽快开发并完善同时承担多项大型多中心临床试验的人才队伍和技术支撑能力。针对此次 COVID-19 疫情临床试验,建议统一临床试验中心伦理审核机制,对已经注册登记的临床试验项目进行伦理复审,终止设计不合理或条件不具备的 COVID-19 临床试验项目。疫情结束后将国家临床试验网络这种模式推广至其他疾病治疗领域的国家临床研究中心。希望从此次 COVID-19 疫情临床试验的无序状况获得的教训能有助于提高国家临床试验的总体质量和效率。
致谢 感谢董冲亚博士和王斌博士对本文表 1 数据整理的支持。
世界卫生组织于 2020 年 1 月 30 日发布声明确认 2019 年底的新型冠状病毒肺炎(corona virus disease 2019,COVID-19)疫情是一次国际关注的重大突发公共卫生事件[1,2]。为控制人与人之间病毒传播而采取的隔离封堵措施对社会经济和人民日常生活产生巨大影响[3]。在控制疫情蔓延的同时,及早找到安全有效的治疗措施,降低患者死亡率是临床研究领域的当务之急。高质量科学设计和严格运作的临床试验是检验临床治疗方案安全性与有效性的根本途径[4]。据统计,从 2020 年 1 月 23 日至 2020 年 3 月 5 日由中国临床研究人员申请主办,在中国临床试验注册中心(www.chictr.org.cn)[5]和美国临床试验注册网站(www.clinicaltrials.gov)[6]两个平台上登记注册,并已经或将要在中国境内进行的针对 COVID-19 的各类临床研究项目达到 381 个,其中干预性临床试验项目 249 个。在连续 6 周内,针对一个特定疾病,平均每天注册近 6 个干预性临床试验的现象引起了社会各界的关注[7-15]。这一现象一方面反映了 COVID-19 疫情迅速蔓延的严重程度和临床医学研究人员探索 COVID-19 有效治疗方案的紧迫使命感;另一方面也折射出目前我国在临床试验立项的规范审核、临床试验的科学设计、项目运作的严谨管理和开展重大临床试验项目时国家层面统筹协调的短板。在发生重大突发公共卫生事件且缺乏现成有效治疗方案的紧急情况下,寻找安全有效的治疗方法需要整合全国临床医学与生物统计领域的人才、资金、技术等多方面资源,合作开发设计高质量的临床试验,统一规范相关临床试验的伦理审核,统一组织覆盖全国的临床试验网络,采用集成式信息管理系统,统一对各临床试验项目进行实时严格的项目运作管理、临床数据管理和临床试验数据安全监察。这才能在确保临床试验受试者安全与权益的前提下,尽快得到关于候选治疗方案安全性与有效性的科学证据。本文对已登记注册的 249 个 COVID-19 干预性临床试验项目的基本特征作描述性分析,借鉴美国国家卫生研究院(National Institutes of Health,NIH)组建的专项疾病领域国家临床试验网络的实践,探讨在 COVID-19 疫情突发情况下提高临床试验质量与效率的对策。
1 COVID-19 干预性临床试验现有格局
目前已经在中国和美国临床试验注册网站登记注册的 249 项 COVID-19 干预性临床试验项目的主要设计参数见表 1。绝大部分 COVID-19 干预性临床试验由定点集中救治医院一线临床研究者独立主办,具有明确的针对性和即时性。在疫情迅速蔓延、新冠病毒尚无有效药物、国家层面专项临床试验统筹机制尚不具备的紧急情况下,很多研究者自筹资金,经研究者所在机构的伦理审查委员会快速审核批准后,迅速在本单位启动小样本干预性临床试验,探索各种治疗方案的安全性与有效性,填补了 COVID-19 临床研究的空白;所获得的阶段性结果对后续大规模高质量临床试验的设计提供了宝贵价值。同时,这些临床试验注册信息暴露的资源局限、设计缺陷和可行性风险也值得相关行政主管部门和临床研究学者认真审视与总结。

1.1 临床试验的立项申请与审核批准
与其他领域的科学研究不同,临床试验以病患(或志愿者)为试验接受主体。世界医学协会的赫尔辛基宣言明确要求临床试验必须将受试者安全与权益置于其他利益之上,并尽量降低受试者可能承担的风险[16]。另一方面,随机对照临床试验必须以临床平衡(clinical equipoise)原则为道德基础[17]。将受试者随机分配到临床试验的不同治疗组意味着当前医学界对于临床试验中使用的不同治疗方案的有效性存在真正的不确定性。从伦理角度讲,临床试验不需要竞争,因为竞争背后可能存在有别于受试者安全与权益的学术与商业利益。当一个治疗方案的安全性和有效性被一个高质量的临床试验确认(或排除)之后,对该治疗方案重复进行临床试验有悖于临床平衡原则。在所有 249 个注册登记的 COVID-19 干预性临床试验项目中,16 项研究主要经费来自国家各类科研基金(其中 1 项为国家科技部新型冠状病毒应急专项资助);55 项由地方政府资助(其中 8 项为新冠病毒应急专项资助);33 项为企业资助;约一半临床试验项目由研究者或研究单位自筹经费,未见由国家专项经费资助的大规模多中心临床试验。
由研究者自主发起的临床试验立项,按照常规只需通过研究者所在单位的伦理审查委员会审核。由于各项目在运作期间的数据保密,各单位之间在相关医学和临床试验设计运作领域能力和水平的差异,各机构伦理审查委员会之间把握审核标准的差异,以及单个机构临床试验资源的局限,重复试验、不合理试验设计、低质量试验运作和无法按时完成试验等风险不容忽视。在这 249 个临床试验中,有 27 个临床试验项目包含洛匹那韦/利托那韦;有 22 个临床试验项目包含氯喹、羟氯喹、磷酸氯喹或硫酸羟氯喹;有 6 个临床试验项目包含盐酸阿比多尔。在 59 项包含中医中药治疗方案的临床试验项目中,10 个试验项目列出具体中成药;其余 49 个试验项目使用更为广义的中医辩证治疗或中西医结合治疗。尽管同一治疗方案可能需要在不同的临床试验中针对不同的目标病患群体(轻症、普通型、重症、危重症等)与不同的治疗方案进行对照比较,在一个特定疾病领域内实行全国统一的规划立项和伦理审核是避免重复试验,提高临床试验立项质量和运作效率的关键。
1.2 临床试验的统计学设计
在医学领域,一个治疗方案的安全性和有效性都是通过与另一个治疗方案(包括安慰剂)比较而得出的。需要明确的是,即使数百个患者使用了某个药物治疗之后有 80% 患者恢复了健康并不能说明这个药物的有效性,因为同样比例的患者也可能未经治疗而恢复健康。而在一个对照试验中,一个患者是否符合受试者条件、受试者如何被分配到不同的治疗方案组、如何实施治疗、如何评价治疗的安全性和有效性等环节都可能受到临床研究人员个人意志的影响,从而给研究结果带来选择性偏倚。以现代统计学理论为基础的随机对照试验设计通过随机分组和分配隐藏避免了选择性偏倚,通过盲法评价减少了信息偏倚,保证了临床试验结果的准确性和可信度。在现在检索到的 249 个 COVID-19 干预性临床试验中,192 个试验项目为随机对照试验,其中仅 32 个试验项目表明采取盲法设计,在公开的注册资料中,只有少数的临床试验,如瑞德西韦临床试验方案中明确采用了最佳和严格的随机双盲安慰剂对照试验设计,其余 217 个均为开放性试验或未说明是否采用盲法。
样本量是影响临床试验结果准确性和可信度的主要因素。如果需要比较两种治疗方案(假设死亡率分别为 15% 与 10%),就需要大约 1 400 例受试者。尽管武汉市 COVID-19 累计确诊病例接近 5 万例[2],单个医院符合特定临床试验入组条件的患者数量远低于 1 000 例。受制于临床科研资源,单个医院难以独立承担大样本量临床试验。在 249 个登记注册的 COVID-19 干预性临床试验中,明确登记为多中心试验的有 41 项;其余 208 项为单中心试验或未加说明。而大量单中心试验的局限也反映在样本量上:约一半试验的样本量不足 100 例。而 249 个临床试验项目的样本量合计超过了当时中国全部 COVID-19 确诊病例数的三分之一。大量小样本量临床试验项目不仅本身难以取得对特定治疗方案安全性与有效性的准确评估,而且会争抢患者资源,对需要大样本量完成的高质量临床试验项目构成威胁[18]。
1.3 临床试验的项目运作管理与数据采集
高质量的临床试验结果来自科学的试验方案设计和严格的项目运作管理。垃圾数据只会产生垃圾证据。我国的三甲医院数量超过 1 300 家[19],但具备独立设计运作高质量大型多中心临床试验项目所必需的专业人才资源和技术支撑条件的医院很少。一些重要的临床试验项目依旧使用纸质病例报告表(case report form,CRF)采集数据,即使采用了电子 CRF 依然由研究者人工输入数据。试验中心和研究人员的资质文件提交审核的电子化程度不高。与电子数据采集系统集成的中央随机系统也不多。由于编制与人事管理的限制,医院通常无法为具体临床试验项目配备专职临床研究人员。临床试验数据管理和监查主要依靠合同研究组织(Contract Research Organization,CRO)。新冠病毒的高度传染性使得机构外人员现场即时采集数据异常困难,而工作在临床一线的医生和护士又难以集中精力来填写临床试验的病例报告表。
COVID-19 临床试验所面临的问题呼唤一种新的临床试验规划管理理念,如临床医生按照临床试验方案要求进行治疗和检查,认真书写电子医疗病历(electronic medical records,EMR),然后通过信息技术进行电子数据抓取(electronic data capture,EDC)。美国作为临床试验大国在近十多年通过组建国家临床试验网络的方法提高临床试验设计运作质量与效率的做法值得借鉴。
2 NIH 临床试验网络的实践
设计和运作高质量临床试验除了合格的专业人才,还需要不菲的资金支持和充足的患者资源。2015~2016 年中,美国联邦食品药品管理局(Food and Drug Administration,FDA)依据 138 个重要临床试验的结果批准了 56 项新的治疗药物。这 138 个临床试验的中位成本为 1 900 万美元,单个受试者中位成本为 4.1 万美元;其中 112 个随机对照试验的中位成本为 3 510 万美元[20]。在美国开展的临床试验中有 80% 无法按期完成受试者入组。在多中心临床试验中,50% 的试验中心只入组一个受试者或完全无患者入组[21]。为提高临床试验的质量和运作效率,进入 21 世纪以来,各个 NIH 专业研究所在许多重要的疾病领域陆续组建起覆盖全国的临床试验网络;例如国家癌症研究所(National Cancer Institute,NCI)组建的国家临床试验网络(National Clinical Trials Network,NCTN)[22],国家神经系统疾病与脑卒中研究所(National Institute of Neurological Disorders and Stroke,NINDS)组建的国家卫生研究院卒中临床试验网络(NIH Stroke Trials Network,NIH StrokeNet)[23],和由国家过敏与传染病研究所(National Institute of Allergy and Infectious Diseases,NIAID)组建的艾滋病预防临床试验网络(HIV Prevention Trials Network,HPTN)[24]等。这些临床试验网络面向不同的疾病领域,但具备基本相似的组织结构和功能。
2.1 NIH 国家临床试验网络的基础设施
NIH 针对具体疾病研究领域组建的国家临床试验网络基本结构如图 1 所示。由 NIH 专业主管研究所资助建设的网络基础设施(network infrastructure)包括 1 个国家临床协调中心(National Clinical Coordinating Center,NCCC),1 个国家统计与数据管理中心(National Statistical and Data Management Center,NSDMC)和若干区域协调中心(Regional Coordinating Centers)。各中心的选择通过公开项目招标(Funding Opportunity Announcement,FOA)和机构研究项目申请(Research Grant Application),为具体项目设置同行专家评审小组评审,由 NIH 专业主管研究所常设顾问委员会审议是否批准资助。NCCC、NSDMC 和区域协调中心资助额度依网络规模而定。NIH 卒中临床试验网络 NCCC 的年度预算约为 225 万美元[25];NSDMC 的年度预算约为 112 万美元[26],各区域协调中心的年度预算约为 25 万美元[27]。这些资金资助仅支持构架临床试验网络基础设施的运作,具体临床试验项目的运作经费由获得资助的临床试验项目负责人单位向 NCCC 和 NSDMC 另行拨付。国家临床试验网络基础设施要素每隔 5 年进行一次更新审议。通过再次公开招标,同行专家小组评审和顾问委员会审议,淘汰现有基础设施中工作质量和效率不高的机构,接收新的申请单位作为基础设施成员。

NCCC 由在目标疾病领域具备丰富临床研究经验和大型临床试验组织实施能力的研究型大学医学院或大型医学中心承担,负责主持临床试验网络的日常运作,包括临床试验项目的开发、已获立项资助的临床试验项目管理、试验方案的制订与调整、试验项目临床中心的选择与合同签署、研究人员培养、中心伦理审核法规资质文件收集和临床中心研究经费支付。NSDMC 由具备丰富临床试验设计与数据分析经验的统计学专家团队和大型多中心临床试验数据管理人员与技术支撑条件的研究型大学承担;参与新临床试验项目的开发与研究方案的制订与调整,负责临床试验项目的统计学设计,统计分析计划制订,数据采集计划与病例报告表设计,支持网络运作和所有临床试验项目数据和项目管理的数据库信息管理系统。区域协调中心由研究型大学医学院或大型医学中心承担,负责对其下属的网络成员单位在参加具体临床试验项目时提供人员培训和必要的技术支持。区域中心的数量根据网络规模的大小而定,从几个到二十多个不等。NCCC 与区域协调中心作为一个整体,代表了全国在目标疾病领域临床医学研究的最高水平。在此基础上组建的专题工作小组负责新临床试验项目的开发。例如,国家卫生研究院卒中临床试验网络包含 3 个专题工作小组,分别为卒中急诊治疗工作小组、卒中预防工作小组和卒中康复工作小组。各工作小组至少有 2 个成员分别来自 NCCC 或 NSDMC。来自 25 个区域协调中心的负责人按各自研究专长分别加入一个专题工作小组。
从 2018 年起,NIH 要求所有受其资助的多中心临床试验采用中心伦理审查机制[28]。国家临床试验网络由 NCCC 指定一个伦理审查委员会作为网络中心伦理审查委员会独立行使伦理审查职权。在组建国家临床试验网络时,核心任务是设计运作大型多中心临床试验,因此独立的中央伦理审查委员会是网络的一个必不可少的机构,由 NCCC 负责选定。中央伦理审查委员会对网络内所有临床试验项目的立项与运作进行伦理审核。
作为临床试验资助方,NIH 专业主管研究所在组建临床试验网络的同时还成立了一个独立的数据与安全监察委员会(Data and Safety Monitoring Board,DSMB),负责对网络内所有临床试验项目的安全性数据、有效性数据、整体研究进度和数据质量进行定期和不定期审查,并就临床试验项目是否需要终止或按计划继续进行,向资助方和项目承担者提出建议。DSMB 成员由临床试验网络资助方 NIH 专业主管研究所指定,包括相关领域临床医学、生物统计学、临床伦理学和临床试验方法学等方面的专家。
2.2 临床试验项目的开发与运作
国家临床试验网络作为一种临床研究服务设施向目标疾病领域内全国临床研究人员开放。NCCC、NSDMC 和相关临床专题工作小组共同帮助临床试验项目申办人完善项目申请报告,优化临床试验研究方案,制定统计分析计划,编制项目预算,并依据网络成员单位可行性问卷调查结果进行项目可行性分析。专题工作小组成员中大多数是区域协调中心的负责人,代表了具体疾病临床研究专题领域中的国际最高水平。他们的参与有助于避免低水平重复性临床试验。NSDMC 为每一个临床试验申请项目指定一名生物统计学专家负责统计学设计,采用先进临床试验设计和数据分析方法,如贝叶斯适应性试验设计。
临床试验项目的立项与审批按常规研究项目申报程序执行,由同行专家评审小组和专业主管研究所常设顾问委员会审核。国家临床试验网络成员单位人员需要对网络内研究人员提交的临床试验项目评审实行利益冲突回避。目前临床试验项目申请通过各项评审最终获得 NIH 资助的比例不到 10%。
获得资助的临床试验项目由项目负责人(Principal Investigator,PI)配合 NCCC 和 NSDMC 进行项目运作。NCCC 协助项目负责人选择参加试验的临床中心,负责与各临床中心签订临床试验合同,向中心伦理审查委员会提交临床试验研究方案,知情协议书及其他法规文件。根据试验项目的需求,NCCC 负责组建或确定中心药房、医学影像阅读中心、生物样本库、医学安全审核员、中心实验室和临床终点事件判定委员会等临床试验项目运作功能要素。NSDMC 负责临床试验数据采集计划制定,病例报告表设计,临床试验操作手册编制和数据库开发。作为临床试验网络的信息中枢,NSDMC 负责开发基于互联网的管理信息系统,为整个网络的项目管理与数据管理提供安全可靠的技术支持,包括法规资质文件提交与审核、临床研究用药的盲法包装与分发使用全程电子编码的追踪、受试者中央随机化分组、医学影像收集、质检和中心阅片、不良事件医学安全审核、终点事件判定、基于风险的数据监查和现场源数据核查等。
与每个临床试验项目负责人自己组建各自的项目运作管理队伍,投资搭建自己的数据库系统相比,由 NCCC 和 NSDMC 共同执行网络内所有已获资助的临床试验项目的运作管理,具有明显的优越性,可以概括为临床试验项目开发立项的充分科学民主与临床试验项目运作的高度专业化集中相结合。不同临床试验项目共享国家网络资源可以提高项目运作管理的质量和效率。
3 关于中国国家临床试验网络的设想
COVID-19 疫情期间大量临床试验开展的无序状态从一个侧面反映了组建覆盖全国的国家临床试验网络的必要性。其目的是集中人才、资金、技术和患者资源,通过统筹规划,设计运作高质量大规模临床试验,提高在短期内寻找安全有效治疗方案,降低疾病死亡率的机会。
自 2012 年起国家科技部在 20 个疾病领域陆续组建了 50 个国家临床医学研究中心,包括 3 个国家呼吸系统疾病临床医学研究中心。建议在此基础上构建国家呼吸系统疾病临床试验网络,并通过公开招标,同行专家评议,选定一个研究型大学或医院作为网络的统计与数据管理中心,尽快开发并完善同时承担多项大型多中心临床试验的人才队伍和技术支撑能力。针对此次 COVID-19 疫情临床试验,建议统一临床试验中心伦理审核机制,对已经注册登记的临床试验项目进行伦理复审,终止设计不合理或条件不具备的 COVID-19 临床试验项目。疫情结束后将国家临床试验网络这种模式推广至其他疾病治疗领域的国家临床研究中心。希望从此次 COVID-19 疫情临床试验的无序状况获得的教训能有助于提高国家临床试验的总体质量和效率。
致谢 感谢董冲亚博士和王斌博士对本文表 1 数据整理的支持。