临床实验室分析质量目标的共识 第一篇(上)

发布时间:2016-01-02       作者:冯仁丰       来源:临床实验室        浏览:3009       收藏: 0

引  言:


从上世纪50年代以来,临床实验室在医学事业的发展,使其具有的地位和价值被大家逐渐认识。检验结果的准确可靠是现代医学对患者诊疗的重要依据。建立、实施临床实验室分析质量指标(以下简称“质量指标”;由于该词语的使用至今尚未一致,本文中引用的允许误差词语等应该是一样的含义。所以,在较高层次上大多使用分析性能质量指标,在临床实验室则多用允许误差),评估临床实验室检验质量的方法学,是几十年来临床实验室、大部分检测项目研究探讨的热点。可是,不同的使用者都从自身的使用要求提议各种质量指标。临床直接面对患者服务,临床对实验室质量要求是所有质量指标的第一位;但往往提议的质量指标带有强烈的主观意识,难以实现。行政机构和实验室认可机构对临床实验室的要求,基本上以实验室现有技术水平和能力为基础,既对被检查的实验室有压力,但还是让大多实验室可以开展工作,所以属于现有操作水平能力的质量指标;同样,组织室间质量评估的组织者,更是需要考虑使大多数实验室愿意参加质量评估的分析性能指标为可接受水平。长期从事理论研究的专家,认真研究影响分析质量的各个因素,采用数学公式推出了质量指标。以实验为依据的生物变异数据,从个体内和个体间的生物变异,推算出不同水平的最佳的、合适的和最低的质量指标;可是这样的数据来源困难,实验抽样量过小、检测方法学以及世界各地不同人群的差异等影响因素,使生物变异数据可靠性总是有问题。


世界各国和地区为了解、建立和统一检验分析质量的问题,有许多研究和讨论。较集中的大型国际专题会议举行了多次。1976年在美国举行了第一次CAP的Aspen会议,这是确定合适标准的里程碑。1999年4月,国际临床化学联合会(IFCC)、国际理论和应用化学联合会(IUPAC)和世界卫生组织(WHO),在瑞典的斯德哥尔摩组织召开了检验医学全球质量指标策略会议。会议后发表了协同声明是在过去的15年里,成为临床实验室建立分析质量指标分级的指导原则。2014年5月,在意大利米兰市,由欧洲检验医学联合会(EFLM)召开了第一次EFLM的对策会议“斯德哥尔摩会议15年后确定分析性能目标”。这次会议对斯德哥尔摩会议后的15年来,临床实验室对建立分析性能质量指标的进展和进一步的认识,做了深入详细的探讨和研究。会议后也发表了协同声明[1]。


本文对分析性能质量目标的发展过程和这些大型会议的协同声明做概要的介绍。分两篇文章叙述:一是斯德哥尔摩会议之前到该会议阶段,临床实验室对分析性能指标的认识和意见;二是2000年以来,国际上对分析性能指标的观点和做法。


本文是临床实验室分析性能质量指标的第一篇。


一、上世纪70年代以来的临床实验室


为了使临床实验室对患者标本检测结果符合临床需求,全球临床实验室做了大量努力和实践。美国临床化学协会(AACC)从上世纪50年代起开始编撰临床化学标准方法,一共出了7本。上世纪70年代初认识到不能将经典分析方法称为标准方法,检验技术发展形成的新方法必然会取代老的“标准”方法。所以,以后就将值得介绍的可靠分析方法称为“推荐方法”。即使这样的标准方法,在当时也没有像现在对分析方法的可靠性能,进行了那样具体的评价实验,完备如此详细性能数据资料。所以,在上世纪50年代出现了自动化仪器后,70年代在美国广泛使用时,如何了解这样的自动化仪器的分析性能成为大问题。而且如何判断分析性能是否可以被临床实验室和临床接受的判断依据和做法,当时几乎都是空白。


Westgard博士于1974年成为临床实验室人员后,被指派进行的第一项工作,是进行分析方法的方法学分析性能评价。面对当时美国临床实验室的现状,他为评价方法学是否可接受,进行了系统的研究和实践,写出了“在方法形成和评价中,判断精密度和准确度的指标”文章[2]。这是在全球的临床实验室领域里,首先走出了如何评价分析方法性能的基本思路和做法。提出了分析性能中不精密度和偏移是最主要的两大性能,提出了以允许误差(Allowable Error)为判断各个分析性能是否为可接受标准的概念,又正确地应用统计技术,完成各个分析性能指标与允许误差间的比较。最后在某个决定水平下,以天间再现性估计的不精密度和方法学比较估计的偏移的综合,成为总误差(Total Error)再与允许误差比较,若总误差依然小于或等于允许误差,则被评价的方法学被认为符合临床和实验室的需求。而且,Westgard在1973年正确地使用统计技术处理方法学比较实验数据[3],是以后形成完整的方法学评价做法的重要内容。到了1978年,Westgard博士编写了如何进行方法学评价的五篇系列文章,更加丰富完整了整个方法学评价[4]。


在Westgard引用的允许误差中,采用了各个学者的观点。例如,可由Barnett[5]、Campbell和Owen[6]、Tonks[7]、Cotlove等[8]、Vanko[9]和Duncan和Geary[10]的建议给予指导。这些作者展现了最大允许SD的建议,应乘以2成为允许分析误差的95%限值。Barnett的建议几乎最代表医学允许误差,由于它们依据医学判断和包括了医学决定水平。Cambell和Owen调查了医师对“可接受重现性”的建议,但是他们的数据较Barnett的更有限。Tonks和Cotlove的限值依据正常个体变异的范围,较多偏重于理论的确定。Vanko概要了“操作水平”性能限值,即性能来自可用的方法,就是当时使用的状态。“操作水平”信息也可通过国家的质量控制调查计划获取,Duncan和Geary已经推荐了依据澳大利亚调查的限值。“操作水平”建议在医学要求会比近期方法可用的性能更有要求的情况下,是最有用的。因此判断某方法可否接受时必须与近期可用的性能的比较,使大多实验室为质量符合要求、少数(20%)被认为质量优秀;而不是去判断所有实验室的方法均为不可接受。由于Westgard推出的方法学评价方案中,必须了解被评价方法具有的分析性能是否符合要求,需要允许误差(即质量指标)。由此推动了全世界去研究探索质量指标。


从那时候起,临床实验室知道和懂得了评价分析方法或检测系统分析性能的重要性。但是在评价中判断不精密度、不准确度和总误差时,尽管已经有文献的经验,可是究竟选择哪一个允许误差作为性能指标判断依据,一直很困难。正如上述,Westgard当时将所有允许误差列成了表格,在文章中也对引用的各个允许误差做了简要介绍。可是真正引用哪个允许误差,还是由进行评价的实验室自行选择。其实在选择中实验室只是去挑选符合自己评价数据大小的允许误差,根本上忽略了确定该允许误差的原先意义。至今这样的情况依然如此。


二、斯德哥尔摩会议前夕对质量指标的认识


始终关注分析质量指标的Fraser,是世界上研究、建立临床实验室分析性能质量指标的大家。1999年初他在美国临床化学杂志发表的社论,是该会议的前奏曲[11]。去年米兰会议他被邀请做报告[12]总结归纳斯德哥尔摩会议前后。


斯德哥尔摩会议前国际上对质量指标的认识概要如下:


1、评估分析性能对做出临床决定的影响

(1)特定临床情况下的质量指标。理想的,质量指标应有目的地来自医学需求的分析。这样,在任何评价中发现分析质量对做出临床决定的影响,应是客观评估的主题。可惜这非常困难。主要的缺点是在单一确定的临床情况下,仅仅是少量检测项目具有标准的完全可接受的医学做法,直接与检测结果有关。另一个显著败笔是非常依赖临床医生如何使用检测结果的假设,去计算质量指标;所以,它们必须与明确特性的做法有关。在特定临床情况下使用各个检测的医生,由他们提交的调查表得出质量指标:这些研究具有非常严重的缺点,已经被我们以往进行了讨论,不推荐使用。

(2)依据医学需求的通用质量指标。考虑使用检测结果的两个主要临床情况,是监视各个患者和使用参考区间的诊断,显示了一般可应用的质量指标最好依据生物变异的组分,个体内(CVI)和个体间(CVG)的变异[13]。一个非常广泛坚持的观点是,不精密度应<0.50 CVI,偏移应<0.25(CVI2+CVG2)1/2。这个做法的优点是生物变异组分的数据很容易可用于>180个项目。这个概念近期已经被扩展。对于不精密度,尽管合适的性能被确定为CVA<0.50 CVI,依据生物学的质量指标用户会考虑,最佳性能可以被确定为CVA<0.25 CVI,使用这个公式产生的较严格的质量指标,应用于那些合适的性能指标容易被近期技术和方法学实现的项目,最低性能可被定义为CVA<0.75 CVI,使用这个公式产生的较不严格的质量指标,可用于合适的性能标准不能被近期技术和方法学达到的那些项目。


2、专业建议 — 来自国家或国际专家组的导则

少数国家的或国际的专业组已经提议了详细的不精密度和偏移的质量指标。如美国国家胆固醇教育组(NCEP)的建议已经被广泛使用,作为新方法的可接受指标[14]。一个欧洲工作组已经提议了依据生物变异数据,用于评价分析系统的质量指标,有20%的实验室达到了操作水平;这些已经在欧洲过去的几年里被广泛使用,以判断分析系统的可接受性。另一个欧洲工作组已经建议参考方法的质量指标,该参考方法用于为常规方法的确认和为室间质量评估计划(EQA)或PT试验使用的物质定值。这样的导则具有一个主要的优点是依据非常广泛的实验室和来自不同背景和具有各种专业经验的许多专家的临床经验。而且,他们通常依据对现有的或新的科学理论或实验数据在发表前进行广泛的讨论。另外,由这些讨论的方法,形成的建议发表在对等成组评审文献中,允许用户评价用于达到结论过程的目的性。


3、来自专家个人或研究组的导则

在许多发表的导则中,成为最佳实践(Best Practice)或实验室管理规范(Good Laboratory Practice)的提议了质量指标。这些经常在某个协同会议上形成或展现的,未经详细的讨论。例如,用于评估甲状腺代谢状态使用分析物[15],以及在治疗药物监视上做出的建议。这些导则具有的优点是,它们通常依据非常广泛的实验室和来自一个研究所的一个专家或一个专家组的临床经验。缺点是这些导则有些主观,没有依据科学理论或实验数据,但可再次允许用户去评价结论的目的性。


4、由行政监督机构或EQA组织者确定的质量指标 — 由行政管理机构确定的质量指标

许多国家在判断某个分析技术要求的性能实际水平是否为可接受,有详细的法规内容。美国CLIA’88的法规,规定了通常检测的一些分析物的可接受总误差,它容易计算[例如,使用Westgard等的方法,一个新方法的性能特性是否实现了符合可以通过的指标]。在德国有类似的法规,但是质量指标很不同。这个方式的优点是,这些标准,特别是CLIA’88的方式,都知道和理解。CLIA’88质量要求缺点是,它们依据操作水平确定,所以指标应该是可实现的,而不是指标是合适的。


5、由实验室间质量评估组织者设定的质量指标

实验室间质量评估(EQA)组织者使用了不同参与地区的不同度量水平和允许离散。但是,世界的其他部分广泛使用可接受的固定限值。它容易计算,使用Westgard等的方式,在某方法评价时便于判断实验室实现的分析性能是否为可接受。这些质量指标的主要缺点是,尽管经常依据专家的观点,但他们倾向于经验,而且明显地受实际上可实现水平的影响。


6、由操作水平发表的数据 — 来自室间质量评估和能力比对试验计划发表的数据

分析质量的比较可以通过参考在EQA和PT参加的实验室组实现的性能。优点是经常有许多数据可用。但是,确定的分析性能会没有真实地反映操作水平,因为基质效应,比对中使用的物质没有像患者标本那样的实际表现;以及参加者操作会采用特殊的分析技术以确保良好性能。而且,这样推测的操作水平,会随时间变化。再则,在分析上实现的性能会与实际医学需求没有关系。


7、发表的方法学

可参考原始工作记录,与相似的或其他方法对分析物的检测进行比较。具有的优点是数据经常可用;但缺点是方法评价是在最佳条件下实施的,原始实验室或原始评价者形成文件的性能,会是最佳的可能性、但不是实际情况下实现的。因此分析上实现的性能会与实际医学需求没有关系。

(未完待续)


本文链接:http://www.ddm360.com/article/detail/411
版权所有,转载时请以链接的形式注明来源!
相关主题: 生化