引用本文: 代欣玥, 张菀桐, 杨巧宁, 刘艳飞, 高蕊. 中国糖尿病足诊疗指南的方法学质量评价. 中国循证医学杂志, 2021, 21(2): 191-196. doi: 10.7507/1672-2531.202005100 复制
糖尿病已成为严重危害人类健康的慢性疾病,其并发症糖尿病足的患病率也明显增加。据估计,我国 50 岁以上的糖尿病患者发生糖尿病足的概率高达 8.1%[1]。糖尿病足溃疡患者年死亡率高达 11%,全球每 20 秒钟就有 1 例糖尿病患者截肢[2],截肢患者死亡率高达 22%。糖尿病足花费巨大,约占整个糖尿病医疗费用的三分之一[3],其不仅是糖尿病患者致残、致死的主要原因之一,也是社会的重大公共卫生问题之一[4]。
2005 年国际糖尿病联盟在全球范围提出“关注足以预防截肢”,糖尿病足并发症被学界重视,一系列相关指南相继问世,我国也陆续发布了多篇糖尿病足相关指南[5]。高质量的临床指南能够更有效地指导临床,故对发表的指南进行质量评价非常重要。目前国内尚无研究对我国糖尿病足指南的方法学质量进行评价,因此,本研究使用国际公认的指南评价工具 AGREE Ⅱ[6, 7]对我国发表的糖尿病足临床实践指南进行方法学质量评价,以期为我国糖尿病足指南的制订和更新提供方法学参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 纳入标准
① 符合 2011 年美国医学研究所(the Institution of Medicine,IOM)指南定义的我国所有以中文发表的糖尿病足指南、共识与诊疗规范[8];② 全文可获取。
1.1.2 排除标准
① 指南摘要或解读;② 重复发表的指南;③ 国外指南的翻译版或改编;④ 仅有单一作者的指南;⑤ 非治疗性质的指南;⑥ 同一组织发布的旧版指南。
1.2 文献检索策略
计算机检索 CNKI、WanFang Data、VIP、CBM 和医脉通数据库及中华医学会糖尿病学分会、中国中西医结合学会和中国微循环学会周围血管疾病专业委员会的网站,搜集国内发表的糖尿病足诊疗指南,检索时限均为建库至 2020 年 5 月。中文检索词包括:糖尿病足、指南、规范、共识等。以 CBM 为例,检索策略见框 1。

1.3 文献筛选与资料提取
由 2 名研究者独立筛选文献、提取资料并交叉核对,如遇分歧,则咨询第三方协助判断,缺乏的资料尽量与作者联系予以补充。文献筛选时首先阅读文题和摘要,在排除明显不相关的文献后,进一步阅读全文,以确定最终是否纳入。资料提取内容主要包括:① 纳入指南的基本信息,包括指南名称、发表时间、指南类型、制订机构、发表期刊、参与制订专家数、参考文献数量、是否指南更新等;② 指南方法学质量评价的关键要素。
1.4 纳入指南的质量评价
由 4 名研究者采用 AGREE Ⅱ工具[9]分别就 6 个领域共 23 个条目对指南的方法学质量进行独立评价。在正式评价前对所有研究者进行培训,保证其对每个条目理解基本一致,具有相同的评价标准[10]。每个条目评分 1~7 分,得分越高表明该指南对相关的方法学描述越详细、明确。若评价者对同一条目评分的差异较大(>2 分),由 4 名研究者对该条内容进行讨论后给出最终评分。每个领域的标准化得分(以百分比形式表示)=(实际得分−可得最低分)/(可得最高分−可得最低分)×100%,根据各领域百分比分布情况,将指南推荐级别划分为 3 个等级。其中,A 级为“推荐”:6 个领域得分均≥60%,可不做修改直接推荐;B 级为“修改后推荐”:存在分数≥30% 的领域≥3 个,但有分数<60% 的领域,不同程度修改完善后推荐;C 级为“不推荐”:分数<30% 的领域≥3 个,因指南制订方法或证据质量低暂不推荐[11]。
1.5 统计分析
采用均数(范围)和频数对相关信息进行统计描述。
2 结果
2.1 文献检索流程及结果
初检共获得相关文献 439 篇。经过逐层筛选,最终纳入 10 部指南[4, 5, 12-23]。文献筛选流程及结果见图 1。

*所检索的数据库及检出文献数具体如下:CNKI(
2.2 纳入指南的基本特征
见表 1。

2.3 纳入指南的方法学质量评价结果
纳入指南 6 个领域的平均得分分别为:75.74%、36.85%、28.61%、86.30%、43.47% 及 9.44%,总体质量中等偏低。综合评价结果为:A 级(推荐)0 部,B 级(修改完善后推荐)8 部[4, 5, 12-16, 18-20, 22, 23],C 级(不推荐)2 部[17, 21],见表 2。

2.3.1 范围和目的
该领域包括 3 条,各条目打分情况如下:条目 1 明确阐述指南的总目的平均分为 5.87,条目 2 明确阐述指南所涵盖的卫生问题平均得分为 5.33,条目 3 明确阐述指南所要应用的人群平均分为 5.43。该领域平均得分为 75.74%,最高分为 92.59%[4, 5, 18-20],最低分为 59.26%[15]。该领域得分较高,总体得分均为中等偏高水平。
2.3.2 参与人员
该领域包括 3 条,各条目打分情况如下:条目 4 指南制订包括所有相关专业人员平均分为 4.77,条目 5 考虑到目标人群的观点和选择平均分为 1.00,条目 6 指南的适用者已经明确规定平均分为 3.87。该领域平均得分为 36.85%,最高分为 57.41%[4, 5, 18-20],最低分为 0 分[17]。总体得分较低。所有纳入指南均未考虑目标人群的意见,部分指南缺乏对于指南的适用者的描述,多数指南虽列出了参与专家信息,但描述不够详细,未具体阐述每位成员的专业、位置等信息,其中有 2 部指南[16, 17]未列出参与制订指南专家信息。
2.3.3 严谨性
该领域细分 8 条,主要反映指南开发的方法学部分,各条目打分情况如下:条目 7 用系统的方法检索证据平均分为 1.27,条目 8 明确阐述了选择证据的标准平均分为 2.03,条目 9 清楚地描述证据群的优势和不足平均分为 1.83,条目 10 明确阐述形成推荐意见的方法平均分为 3.30,条目 11 在形成推荐意见时考虑了对健康的效益、副作用和风险平均分为 5.53,条目 12 推荐意见和支持证据之间有明确的联系平均分为 4.57,条目 13 指南在发表前经过专家的外部评审平均分为 2.00,条目 14 提供指南更新过程平均分为 1.20。该领域平均得分为 28.61%,最高分为 66.67%[4, 5, 18-20],最低分为 12.50%[13],得分均较低。几乎所有指南均未说明证据的检索策略、选择证据的纳排标准及证据群的优势与不足,缺乏对于推荐意见形成方法的描述,形成推荐建议时虽对健康效益、副作用及风险有所考虑,但不够充分;仅有2部在发布前经过外部评审,其余指南均未经过外部评审;仅有1部指南[23]提供更新过程,但描述不够清晰,其余指南均未提及。
2.3.4 清晰性
该领域细分为 3 条,主要反映表达的清晰性,各条目打分情况如下:条目 15 推荐意见明确不含糊平均分为 6.57,条目 16 明确列出针对某一情况或卫生问题不同的选择平均分为 6.23,条目 17 主要的推荐意见清晰易辨平均分为 5.73。该领域平均得分为 86.30%,最高得分为 92.59%[4, 5, 18-20],最低得分为 79.63%[16],得分均高于 60%,在所有领域中的得分最高,质量较高。
2.3.5 应用性
该领域细分为 4 条,主要反映指南是否可用于实践,是否具有可行性,各条目打分情况如下:条目 18 指南中描述了应用过程中的促进和阻碍因素平均分为 2.43,条目 19 指南提供了推荐意见如何应用于实践的建议和(或)配套工具平均分为 4.27,条目 20 指南考虑了应用推荐建议时潜在的资源投入问题平均分为 1.97,条目 21 指南提供了监控和(或)审计的标准平均分为 5.77。该领域平均得分为 43.47%,最高分为 73.61%[4, 5, 18-20],最低分为 13.89%[17],仅有 1 部指南[4, 5, 18-20]高于 60%,整体质量较低。多数指南未考虑到应用中的促进及阻碍因素,缺乏对应用建议或配套工具的具体描述,未说明应用中的资源投入问题;多数指南均说明了使用中的监督和审计标准。
2.3.6 编辑独立性
该领域细分为 2 条,主要反映制订过程中的独立性,各条目打分情况如下:条目 22 赞助单位的观点不影响指南的内容平均分为 1.00,条目 23 指南记录并考虑了制订小组成员的利益冲突平均分为 2.13。该领域平均得分为 9.44%,最高分为 47.22%[4, 5, 18-20, 23],最低分为 0%[12-17, 21, 22],得分均较低,在所有领域中得分最低。所有指南均未说明赞助单位观点是否影响指南内容,仅有 2 个指南[4, 5, 18-20, 23]声明制订小组成员间无利益冲突,其余指南均未提及。
3 讨论
1990 年 IOM 将临床实践指南定义为:应用系统方法开发的文件,能够给从业者或患者提供针对某一临床问题的适当解决方案[24]。它是针对特定临床问题为医生和患者提供建议的临床决策工具,目的在于制订医疗标准,提高医疗质量水平[25]。指南在应用中的受益程度与指南本身的质量密切相关,高质量的指南能改善患者的预后、提高医务人员决策的质量、节约医疗费用,而低质量的指南可能会引导无效甚至是有害的临床干预,造成医疗资源的浪费[26]。AGREE Ⅱ是由国际协作组织制订的用于评估临床实践指南质量的工具,是目前国际上较为公认的指南评价工具[9, 27]。因此,本研究使用该工具对国内的糖尿病足指南进行质量评价,并对评价结果进行分析,针对现存问题提出相应建议,为提高我国糖尿病足指南方法学质量提供参考。
本研究结果表明,我国糖尿病足诊疗指南方法学质量不高,相较于高宁等[28]对于国际指南的质量评价有差距。其中范围和目的、表达的清晰性两个领域得分相对较高,而剩下的 4 个领域的得分较低,尤其是制订的严谨性和编辑独立性两个领域(<30%)。现存的具体问题可分析概括为以下几个方面:① 指南制订方法缺乏严谨性,描述不够清晰,极少数采用循证方法制订指南,多为非正式专家共识;② 制订指南人员中缺少方法学专家、社会学专家及患者参与;③ 指南推荐建议忽视投入与收益、不同方案优劣情况等现实问题分析;④ 缺乏指南发表前同行评价及指南更新情况说明;⑤ 缺乏对于指南制订中资助影响及小组人员中利益冲突的说明;⑥ 缺少指南推广应用方面的描述。
我国糖尿病足指南的质量问题尚未得到重视,警示我们在指南制订过程中应提出更有效的措施及方法来加强制订的规范性和方法的科学性,以提高指南的质量,提高中国在糖尿病足实践中的影响力。针对现存问题,提出以下建议:① 提高指南制订人员循证思维的意识;② 严格遵守制订指南的要求,加强指南制订人员方法学培训;③ 完善指南制订小组人员种类的全面性,纳入方法学、社会学专家及目标人群意见;④ 开展高质量原始研究,提高国内原始研究证据的质量;⑤ 规范指南报告形式,提供指南更新机制;⑥ 重视利益冲突说明。
本研究的局限性:① 本研究仅纳入通过计算机检索到的公开发表的文献,可能遗漏其他渠道发表的相关研究,如书本、宣传手册等指南;② AGREE Ⅱ指南评价工具在评价时具有主观性,要求评价者有较高的临床专业素养,需熟悉指南的标准化制订及循证医学相关概念,不同评价者可能存在有因对条目理解不同而有偏差[29];③ 由于 AGREE Ⅱ指南仅评价指南方法学质量,故本研究对于糖尿病足指南的评价仅局限于方法学质量,无法评价指南其他方面,不能全面反映指南质量[30]。
综上所述,我国糖尿病足指南整体质量有待提高,特别是制订的严谨性和编辑的独立性领域。在今后的指南制订中,应借鉴国际指南制订标准与方法,规范指南制订流程,提高指南方法学质量,制订出更益于提高我国糖尿病足诊疗水平以及中国在该领域影响力的高质量糖尿病足指南。
利益冲突声明:本研究无任何利益冲突。
糖尿病已成为严重危害人类健康的慢性疾病,其并发症糖尿病足的患病率也明显增加。据估计,我国 50 岁以上的糖尿病患者发生糖尿病足的概率高达 8.1%[1]。糖尿病足溃疡患者年死亡率高达 11%,全球每 20 秒钟就有 1 例糖尿病患者截肢[2],截肢患者死亡率高达 22%。糖尿病足花费巨大,约占整个糖尿病医疗费用的三分之一[3],其不仅是糖尿病患者致残、致死的主要原因之一,也是社会的重大公共卫生问题之一[4]。
2005 年国际糖尿病联盟在全球范围提出“关注足以预防截肢”,糖尿病足并发症被学界重视,一系列相关指南相继问世,我国也陆续发布了多篇糖尿病足相关指南[5]。高质量的临床指南能够更有效地指导临床,故对发表的指南进行质量评价非常重要。目前国内尚无研究对我国糖尿病足指南的方法学质量进行评价,因此,本研究使用国际公认的指南评价工具 AGREE Ⅱ[6, 7]对我国发表的糖尿病足临床实践指南进行方法学质量评价,以期为我国糖尿病足指南的制订和更新提供方法学参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 纳入标准
① 符合 2011 年美国医学研究所(the Institution of Medicine,IOM)指南定义的我国所有以中文发表的糖尿病足指南、共识与诊疗规范[8];② 全文可获取。
1.1.2 排除标准
① 指南摘要或解读;② 重复发表的指南;③ 国外指南的翻译版或改编;④ 仅有单一作者的指南;⑤ 非治疗性质的指南;⑥ 同一组织发布的旧版指南。
1.2 文献检索策略
计算机检索 CNKI、WanFang Data、VIP、CBM 和医脉通数据库及中华医学会糖尿病学分会、中国中西医结合学会和中国微循环学会周围血管疾病专业委员会的网站,搜集国内发表的糖尿病足诊疗指南,检索时限均为建库至 2020 年 5 月。中文检索词包括:糖尿病足、指南、规范、共识等。以 CBM 为例,检索策略见框 1。

1.3 文献筛选与资料提取
由 2 名研究者独立筛选文献、提取资料并交叉核对,如遇分歧,则咨询第三方协助判断,缺乏的资料尽量与作者联系予以补充。文献筛选时首先阅读文题和摘要,在排除明显不相关的文献后,进一步阅读全文,以确定最终是否纳入。资料提取内容主要包括:① 纳入指南的基本信息,包括指南名称、发表时间、指南类型、制订机构、发表期刊、参与制订专家数、参考文献数量、是否指南更新等;② 指南方法学质量评价的关键要素。
1.4 纳入指南的质量评价
由 4 名研究者采用 AGREE Ⅱ工具[9]分别就 6 个领域共 23 个条目对指南的方法学质量进行独立评价。在正式评价前对所有研究者进行培训,保证其对每个条目理解基本一致,具有相同的评价标准[10]。每个条目评分 1~7 分,得分越高表明该指南对相关的方法学描述越详细、明确。若评价者对同一条目评分的差异较大(>2 分),由 4 名研究者对该条内容进行讨论后给出最终评分。每个领域的标准化得分(以百分比形式表示)=(实际得分−可得最低分)/(可得最高分−可得最低分)×100%,根据各领域百分比分布情况,将指南推荐级别划分为 3 个等级。其中,A 级为“推荐”:6 个领域得分均≥60%,可不做修改直接推荐;B 级为“修改后推荐”:存在分数≥30% 的领域≥3 个,但有分数<60% 的领域,不同程度修改完善后推荐;C 级为“不推荐”:分数<30% 的领域≥3 个,因指南制订方法或证据质量低暂不推荐[11]。
1.5 统计分析
采用均数(范围)和频数对相关信息进行统计描述。
2 结果
2.1 文献检索流程及结果
初检共获得相关文献 439 篇。经过逐层筛选,最终纳入 10 部指南[4, 5, 12-23]。文献筛选流程及结果见图 1。

*所检索的数据库及检出文献数具体如下:CNKI(
2.2 纳入指南的基本特征
见表 1。

2.3 纳入指南的方法学质量评价结果
纳入指南 6 个领域的平均得分分别为:75.74%、36.85%、28.61%、86.30%、43.47% 及 9.44%,总体质量中等偏低。综合评价结果为:A 级(推荐)0 部,B 级(修改完善后推荐)8 部[4, 5, 12-16, 18-20, 22, 23],C 级(不推荐)2 部[17, 21],见表 2。

2.3.1 范围和目的
该领域包括 3 条,各条目打分情况如下:条目 1 明确阐述指南的总目的平均分为 5.87,条目 2 明确阐述指南所涵盖的卫生问题平均得分为 5.33,条目 3 明确阐述指南所要应用的人群平均分为 5.43。该领域平均得分为 75.74%,最高分为 92.59%[4, 5, 18-20],最低分为 59.26%[15]。该领域得分较高,总体得分均为中等偏高水平。
2.3.2 参与人员
该领域包括 3 条,各条目打分情况如下:条目 4 指南制订包括所有相关专业人员平均分为 4.77,条目 5 考虑到目标人群的观点和选择平均分为 1.00,条目 6 指南的适用者已经明确规定平均分为 3.87。该领域平均得分为 36.85%,最高分为 57.41%[4, 5, 18-20],最低分为 0 分[17]。总体得分较低。所有纳入指南均未考虑目标人群的意见,部分指南缺乏对于指南的适用者的描述,多数指南虽列出了参与专家信息,但描述不够详细,未具体阐述每位成员的专业、位置等信息,其中有 2 部指南[16, 17]未列出参与制订指南专家信息。
2.3.3 严谨性
该领域细分 8 条,主要反映指南开发的方法学部分,各条目打分情况如下:条目 7 用系统的方法检索证据平均分为 1.27,条目 8 明确阐述了选择证据的标准平均分为 2.03,条目 9 清楚地描述证据群的优势和不足平均分为 1.83,条目 10 明确阐述形成推荐意见的方法平均分为 3.30,条目 11 在形成推荐意见时考虑了对健康的效益、副作用和风险平均分为 5.53,条目 12 推荐意见和支持证据之间有明确的联系平均分为 4.57,条目 13 指南在发表前经过专家的外部评审平均分为 2.00,条目 14 提供指南更新过程平均分为 1.20。该领域平均得分为 28.61%,最高分为 66.67%[4, 5, 18-20],最低分为 12.50%[13],得分均较低。几乎所有指南均未说明证据的检索策略、选择证据的纳排标准及证据群的优势与不足,缺乏对于推荐意见形成方法的描述,形成推荐建议时虽对健康效益、副作用及风险有所考虑,但不够充分;仅有2部在发布前经过外部评审,其余指南均未经过外部评审;仅有1部指南[23]提供更新过程,但描述不够清晰,其余指南均未提及。
2.3.4 清晰性
该领域细分为 3 条,主要反映表达的清晰性,各条目打分情况如下:条目 15 推荐意见明确不含糊平均分为 6.57,条目 16 明确列出针对某一情况或卫生问题不同的选择平均分为 6.23,条目 17 主要的推荐意见清晰易辨平均分为 5.73。该领域平均得分为 86.30%,最高得分为 92.59%[4, 5, 18-20],最低得分为 79.63%[16],得分均高于 60%,在所有领域中的得分最高,质量较高。
2.3.5 应用性
该领域细分为 4 条,主要反映指南是否可用于实践,是否具有可行性,各条目打分情况如下:条目 18 指南中描述了应用过程中的促进和阻碍因素平均分为 2.43,条目 19 指南提供了推荐意见如何应用于实践的建议和(或)配套工具平均分为 4.27,条目 20 指南考虑了应用推荐建议时潜在的资源投入问题平均分为 1.97,条目 21 指南提供了监控和(或)审计的标准平均分为 5.77。该领域平均得分为 43.47%,最高分为 73.61%[4, 5, 18-20],最低分为 13.89%[17],仅有 1 部指南[4, 5, 18-20]高于 60%,整体质量较低。多数指南未考虑到应用中的促进及阻碍因素,缺乏对应用建议或配套工具的具体描述,未说明应用中的资源投入问题;多数指南均说明了使用中的监督和审计标准。
2.3.6 编辑独立性
该领域细分为 2 条,主要反映制订过程中的独立性,各条目打分情况如下:条目 22 赞助单位的观点不影响指南的内容平均分为 1.00,条目 23 指南记录并考虑了制订小组成员的利益冲突平均分为 2.13。该领域平均得分为 9.44%,最高分为 47.22%[4, 5, 18-20, 23],最低分为 0%[12-17, 21, 22],得分均较低,在所有领域中得分最低。所有指南均未说明赞助单位观点是否影响指南内容,仅有 2 个指南[4, 5, 18-20, 23]声明制订小组成员间无利益冲突,其余指南均未提及。
3 讨论
1990 年 IOM 将临床实践指南定义为:应用系统方法开发的文件,能够给从业者或患者提供针对某一临床问题的适当解决方案[24]。它是针对特定临床问题为医生和患者提供建议的临床决策工具,目的在于制订医疗标准,提高医疗质量水平[25]。指南在应用中的受益程度与指南本身的质量密切相关,高质量的指南能改善患者的预后、提高医务人员决策的质量、节约医疗费用,而低质量的指南可能会引导无效甚至是有害的临床干预,造成医疗资源的浪费[26]。AGREE Ⅱ是由国际协作组织制订的用于评估临床实践指南质量的工具,是目前国际上较为公认的指南评价工具[9, 27]。因此,本研究使用该工具对国内的糖尿病足指南进行质量评价,并对评价结果进行分析,针对现存问题提出相应建议,为提高我国糖尿病足指南方法学质量提供参考。
本研究结果表明,我国糖尿病足诊疗指南方法学质量不高,相较于高宁等[28]对于国际指南的质量评价有差距。其中范围和目的、表达的清晰性两个领域得分相对较高,而剩下的 4 个领域的得分较低,尤其是制订的严谨性和编辑独立性两个领域(<30%)。现存的具体问题可分析概括为以下几个方面:① 指南制订方法缺乏严谨性,描述不够清晰,极少数采用循证方法制订指南,多为非正式专家共识;② 制订指南人员中缺少方法学专家、社会学专家及患者参与;③ 指南推荐建议忽视投入与收益、不同方案优劣情况等现实问题分析;④ 缺乏指南发表前同行评价及指南更新情况说明;⑤ 缺乏对于指南制订中资助影响及小组人员中利益冲突的说明;⑥ 缺少指南推广应用方面的描述。
我国糖尿病足指南的质量问题尚未得到重视,警示我们在指南制订过程中应提出更有效的措施及方法来加强制订的规范性和方法的科学性,以提高指南的质量,提高中国在糖尿病足实践中的影响力。针对现存问题,提出以下建议:① 提高指南制订人员循证思维的意识;② 严格遵守制订指南的要求,加强指南制订人员方法学培训;③ 完善指南制订小组人员种类的全面性,纳入方法学、社会学专家及目标人群意见;④ 开展高质量原始研究,提高国内原始研究证据的质量;⑤ 规范指南报告形式,提供指南更新机制;⑥ 重视利益冲突说明。
本研究的局限性:① 本研究仅纳入通过计算机检索到的公开发表的文献,可能遗漏其他渠道发表的相关研究,如书本、宣传手册等指南;② AGREE Ⅱ指南评价工具在评价时具有主观性,要求评价者有较高的临床专业素养,需熟悉指南的标准化制订及循证医学相关概念,不同评价者可能存在有因对条目理解不同而有偏差[29];③ 由于 AGREE Ⅱ指南仅评价指南方法学质量,故本研究对于糖尿病足指南的评价仅局限于方法学质量,无法评价指南其他方面,不能全面反映指南质量[30]。
综上所述,我国糖尿病足指南整体质量有待提高,特别是制订的严谨性和编辑的独立性领域。在今后的指南制订中,应借鉴国际指南制订标准与方法,规范指南制订流程,提高指南方法学质量,制订出更益于提高我国糖尿病足诊疗水平以及中国在该领域影响力的高质量糖尿病足指南。
利益冲突声明:本研究无任何利益冲突。