摘 要
研究背景:在肺功能测试中不鼓励对种族进行校正,但采用种族中立方程的影响尚未得到全面量化。
研究方法:我们从国家健康和营养检查调查、英国生物库、动脉粥样硬化多种族研究以及器官采购和移植网络中获得了369,077名参与者的纵向数据。使用这些数据,我们比较了基于种族的2012年全球肺功能倡议(GLI-2012)方程和2022年引入的种族中性方程(GLI-Global)。评估结果包括临床、职业和财务重新分类的国家预测;移植优先级的个体肺分配得分;以及临床预测任务的一致性统计(C统计)。
研究结果:在美国能够产生高质量肺活量测定结果的2.49亿6岁至79岁的人中,使用GLI-Global公式对1250万人进行重新分类,对816万人进行医疗损害评级,对228万人进行职业资格评定,对205万人进行慢性阻塞性肺疾病分级,对41.3万人进行军事伤残赔偿。这些潜在的变化因种族而异;例如,非阻塞性呼吸机损伤的分类可能会发生巨大变化,在黑人中增加141%(95%可信区间[CI]),在白人中减少69%(95%可信区间)。黑人退伍军人的年度伤残抚恤金可能增加超过10亿美元,白人退伍军人的年度伤残抚恤金可能减少5亿美元。GLI-2012年和GLI-Global在呼吸道症状、卫生保健利用、新发疾病、任何原因死亡、与呼吸系统疾病相关的死亡以及等待移植名单上的人死亡方面具有类似的判别准确性,C统计量的差异从−0.008到0.011不等。
研究结论:使用基于种族和种族中立的方程产生了对呼吸结果的类似准确预测,但为数百万人分配了不同的疾病分类、职业资格和残疾补偿,影响因种族而异。(由国家心肺和血液研究所和国家环境健康科学研究所资助。)
肺活量测定法是一种广泛使用的肺功能测试,对于肺部疾病的诊断、分期和监测是必不可少的。一个多世纪以来,临床医生一直通过将肺活量测量(包括 1秒用力呼气量(FEV1)和用力肺活量(FVC))与预测的正常范围进行比较来解释预期的健康值。1这些正常值是根据年龄、性别、身高和经常使用参考方程计算的,参考方程旨在预测健康非吸烟者的肺活量测量值。在临床实践中,这些方程提供了预期肺活量值的人口学特定分布,可与测量的肺活量值进行比较。例如,慢性阻塞性肺疾病(COPD)等疾病可以通过将测量的肺活量测定值与正常范围的第5个百分位下限进行比较来诊断损害程度(如COPD等级),也可以通过将参考校正值与定义轻度、中度和重度疾病的固定阈值进行比较来量化;这些值包括预测值的百分比(测量值与预测健康值的比率,通常认为正常值不会落在预测健康值的80%到120%之间)和z分数(测量值高于或低于预测健康值的标准差数)。
在临床算法中对种族的校正引起了关于医学的普遍争议,特别是关于肺功能的争议,因为它在历史上被用于量化假定的黑人缺陷,并为他们的奴役辩护。最近,批评性讨论还强调了关于种族本质主义及其对医疗和经济不平等的影响的过时观念。2021年,欧洲呼吸学会(ERS)和美国胸科学会(ATS)的技术标准指出,“历史上对种族的固定校正系数的方法是不合适的,显然是不受鼓励的”。在2022年,全球肺功能倡议(GLI)试图用新的不包括种族或民族作为输入的种族中立方程(GLI-Global方程)取代基于种族的GLI-2012方程。GLI-Global方程是使用相同的数据推导出来的,有效地构成了跨种族群体的加权平均值。截至2024年初,GLI-Global方程是ATS和ERS官方认可的唯一肺功能参考方程。
虽然众所周知,参考公式的选择涉及权衡取舍,但将种族作为校正因素纳入或剔除的下游后果尚未得到全面量化。结果包括参考校正的肺功能指数的预测能力的潜在变化,以及这些指数用于确定的临床、职业和财务结果。使用来自五个队列的数据,我们量化了随着种族中立方程的广泛采用而预期的变化,包括美国对肺部疾病、就业资格和残疾补偿的重新分类的国家预测;对肺移植优先顺序的历史影响;以及针对呼吸道症状、医疗保健利用、新发疾病和死亡的参考校正肺功能指数的区别性准确性。
人群特征
数据来自五个队列:17,067人来自2007-2012年国家健康和营养检查调查(NHANES IV),15,861人来自NHANES 1988-1994(NHANES III),29 0,136人来自英国生物库,3262人来自动脉粥样硬化多种族研究(MESA),42751人来自器官采购和移植网络(OPTN)(表1)。参与者是根据可接受的肺活量数据以及记录的年龄和身高来选择的。肺活量测定的质量控制按照ATS-ERS标准进行,包括质量等级A或B(从A到F,其中A和B代表质量较好的结果)(参见补充附录中的补充方法部分,可在nejm.org获得本文全文)。
MESA、NHANES和英国生物库调查问卷数据包括参与者报告的年龄、性别或性别、种族和民族认同、医疗条件和吸烟行为;它们还包含体检数据,包括身高和肺活量测量。移植中心报告的OPTN数据包括与MESA、NHANES和英国生物库问卷,增加了转诊、移植或死亡的日期,以及计算2020年使用的肺分配得分所需的所有数据输入。NHANES III和英国生物库的数据也包含了关于新发疾病和死亡的纵向结果。MESA和NHANES数据被用来建立GLI-2012和GLI-Global方程,而英国生物库和OPTN数据不是。NHANES IV旨在提供美国非制度化平民人口的代表性样本。OPTN的数据代表了2020年美国肺移植等待名单上的所有人。
由于根据GLI种族分类定义的不同群体,包括或不包括种族校正所导致的变化预计会有所不同,因此我们报告黑人、西班牙裔和白人参与者根据种族或民族分组的结果。其余参与者在使用GLI-2012公式时将被分配到“其他”校正,他们被报告为“亚洲人或其他人”,以反映亚洲人在该群体中占多数。补充方法一节提供了关于在报告结果中使用种族和族裔群体数据的更多细节。
本研究的肺活量测定法和其他标准见表2。阻塞性呼吸障碍,包括对气流阻力的增加,定义为FEV1与FVC的比值低于正常范围下限的第5个百分位数非阻塞性损伤,包括多种肺内和肺外原因,定义为FEV1(保留的比率受损的肺活量)或FVC(限制性模式)低于其各自正常范围的第5个百分位下限,FEV1:FVC高于正常范围的第5个百分位下限。COPD定义为FEV1:FVC小于0.70,并根据预测FEV1的百分比和全球慢性阻塞性肺疾病倡议(GOLD)定义的标准划分严重等级。我们使用2008年美国can医学协会(AMA)永久性损伤评估指南,计算了与工作相关的粉尘或烟雾的成年参与者的医疗损伤等级。为了评估职业资格,我们使用2018年国家消防协会标准来识别肺功能可能使他们失去消防职业资格的成年参与者。为了量化补偿站点的变化,我们计算了2023退伍军人部市场(VA)残疾支付和使用VA时间表评估呼吸残疾和残疾补偿率的成年退伍军人。最后,我们计算了肺允许教育分数,在等待名单上的位置,根据参考方程,使用评分参数和2020年的基线生存数据,计算2020年美国移植等待名单上列出的1399人中的每个人的预期等待时间。
统计分析
我们使用GLI-2012和GLI-Global方程来计算所有参与者的正常FEV1、FVC和FEV1:FVC值以及正常范围的第5个百分位数下限。然后,我们使用测量的肺活量测定法得出预测值的百分比和z分数。使用NHANES IV的数据并应用适当的调查权重,我们计算了对美国6至79岁能够产生高质量肺活量测定结果的人群的临床、职业和财务结果变化的全国代表性预测(参见补充方法部分)。肺移植等待名单上的移动是基于肺分配分数的变化来计算的,该变化是由预测的FVC的百分比变化引起的。根据联合器官共享网络2020年的政策,我们使用肺活量测量输入数据来计算仅在被分配到诊断组D(限制性肺病)的候选人中的肺分配分数。使用从OPTN数据导出的线性方程(图2),从等待名单上的初始位置估计预期等待时间。补充附录中的S1)。
使用参考校正指数(例如,z分数或预测值的百分比)而不是原始肺活量测量的一个关键原理是提高了区分健康和疾病状态的能力。为了评估这种能力,一种称为判别准确度的统计测量方法,我们计算了Harrell的一致性统计(C统计),用于基于肺活量z分数预测呼吸结果。对于二进制终点,C统计量表示具有给定临床结果(例如,死亡)的随机参与者的肺功能低于没有该临床结果的随机参与者的概率;C统计量相当于接受者-手术特征(ROC)曲线下的面积。值得注意的是,C统计量衡量的是所有可能的肺功能阈值的平均表现,并且没有引用任何特定的阈值。C统计量为1.0表示完全辨别,而C统计量为0.5表示辨别能力不比随机好。在二次分析中,我们使用−1.645的z分数阈值计算了预测呼吸结果的敏感度和特异度,对应于正常范围的5%下限。关于并发症状和最近的医疗保健利用的数据来自NHANES IV,关于新发哮喘和COPD的数据来自英国生物库,关于呼吸道原因死亡和任何原因死亡的数据来自NHANES III的2019年链接死亡文件,关于肺移植等待名单上的人死亡的数据来自OPTN。补充方法一节提供了有关统计分析的更多细节。
基线特征
表1描述了肺活量测定结果可接受的369,077名参与者,他们代表了5个人口统计学和社会经济学不同的队列(表S1)。NHANES III和IV代表的参与者(中位年龄分别为35岁和33岁)比MESA、英国生物库和OPTN(中位年龄范围为57至65岁)年轻。英国生物库和OPTN的白人参与者比例(分别为95.1%和78.2%)高于其他队列(百分比从35.2%到39.6%)。队列中FVC的中位数从OPTN的肺移植候选患者的1.82升到NHANES IV人群的3.62升不等。当移植数据被省略时,没有呼吸道症状、肺部疾病或吸烟史的参与者的百分比从MESA的31.6%到NHANES IV的56.2%不等。
呼吸机能障碍
阻塞性损害与气流受限障碍(如哮喘和慢性阻塞性肺病)有关。与GLI-2012公式相比,GLI-Global公式与NHANES IV数据的使用导致黑人、西班牙裔和白人参与者中阻塞性损伤的发现增加,而亚洲或其他种族或民族参与者的发现减少(图1A)。在美国人口中,这些结果的变化相当于320万次重新分类(95%可信区间[CI],263万到386万):264万人新被归类为梗阻,565,000人不再被归类(表3)。流行率和受影响总人数的精确值见表S2,流行率变化和相对变化见表S3,重新分类见表S4。
非梗阻性损伤是一种非特异性的发现,通常涉及限制性疾病、早期梗阻、肌肉无力和其他原因的随访测试。当使用GLI-Global方程时,这些发现在黑人中增加了一倍以上,在西班牙裔和白人中减少了3到4倍(图1B)。
在美国人口中,这些变化在黑人中增加了234万例非阻塞性损伤(95%CI,193万到275万),在西班牙裔中减少了137万例(95%CI,94万到180万),在白人中减少了537万例(95%CI,419万到655万)(表3)。
当GLI-Global方程应用于NHANES III、MESA和英国生物库数据时,也观察到类似的相对变化(图.S2a和S2b)。总共有1250万人可能有阻塞性或非阻塞性呼吸障碍的重新分类。
肺活量测定法也可用于COPD严重程度的分级。当使用GLI-GLOBAL而不是GLI-2012公式解释NHANES IV参与者的肺功能测量时,中到重度COPD的分类在黑人参与者中增加,在西班牙裔和白人参与者中减少(图1C)。
在美国人口中,这相当于增加了428,000名黑人(95%CI,300,000到556,000)和110万白人(95%CI,72万到148万)患有中到重度COPD(表3)。使用GLI-Global方程对205万COPD患者(95%CI,159万至251万)的严重程度进行了重新分类:50.8万人为重度,154万人为轻度(表S4G)。在其他队列中也观察到了类似的相对变化(图3。S2C)。
职业资格在某些职业中,采用肺活量测定标准来确定就业资格。当GLIGlobal方程被用来评估与工作相关的粉尘或烟雾暴露的成年人时,黑人成年人的消防专业资格取消几乎增加了一倍,白人成年人减少了四分之一(图1D)。这一变化相当于754,000名黑人成年人(95%CI,54万至969,000人)可能不再有资格从事消防工作,127万白人成年人(95%CI,81万至173万)可能新获得资格(表3)。总体而言,228万处于工作年龄的美国成年人(95%CI,184万至278万)可能会受到消防资格变化的影响。这一估计包括美国100万现役消防员30和许多消防员工作申请者的资格变化,但也包括那些可能被其他体检评估排除在外的申请者和没有申请消防员工作的人。
医疗损害评级由临床医生指定,以指导有关工作资格和残疾补偿的决定。在与工作相关的粉尘或烟雾暴露的黑人成年人中,使用GLI-Global公式时,中到重度医疗损害的分类可能会增加一倍以上(图1E)。这相当于638,000名黑人成年人(95%CI,478,000至797,000人),他们可能会获得更多的基于减损的赔偿(表3)。相比之下,在成年白人中,中度到重度的损伤可能会减少四分之一,影响到938,000人(95%CI,57万到131万)。使用GLI-Global公式可以为816万成年人(95%CI,693万至939万)重新分配AMA减值评级:268万为较严重的减值,549万为较轻的减值(表S4H)。
退伍军人伤残津贴的数额部分是根据肺活量测定标准确定的。使用GLI-Global方程计算黑人退伍军人服兵役引起的呼吸损伤的补偿可能会增加17.1%(95%CI,8.5至25.8)(图1F),每年总计11.亿美元(95%CI,5.8亿至16.1亿)(表3)。在将受益的21.6万名黑人退伍军人(9.5%)中,37.0%的黑人退伍军人的年补偿可能增加1,991美元,41.1%的黑人退伍军人的年补偿可能增加4,110美元,19.0%的黑人退伍军人的年补偿可能增加9,740美元,2.9%的黑人退伍军人的年补偿可能增加27,600美元。相反,白人退伍军人的补偿可能会减少1.15%(95%CI,0.29至2.00)(图1F),每年总计5.2亿美元(95%CI,1.3亿至9.2亿)(表3)。在将受到影响的15万名白人退伍军人(1.0%)中,28.8%的退伍军人年薪将减少1,991美元,其余71.2%的退伍军人年薪将减少4,110美元。总体而言,使用GLI-Global公式可以将19.4亿美元(95%CI,11.亿到27.9亿)的退伍军人伤残补偿重新分配给413,000名退伍军人(表3)。重新分配的金额不到202231年度报告的退伍军人伤残补偿总支出的2%,但可能在呼吸系统疾病方面的支出中占了相当大的比例,在退伍军人中与服务相关的所有残疾中,呼吸系统疾病的支出不到5%。
直到最近,肺活量测定还是用于确定肺移植优先顺序的几种方法之一。在2020年美国肺移植等待名单上的1399名候选人中,如果使用GLI-Global公式而不是GLI-2012公式确定优先顺序,1243人(88.8%)将改变他们在等待名单上的位置(图2a)。对于632名患有限制性肺部疾病的候选人(45.2%)来说,这种变化是由于他们预测的FVC和肺分配分数的百分比发生了变化(图1)。S3)。另有611名考生(43.7%)会因轮候名单的重新编排而轮班,而肺分配分数则维持不变。如果使用GLI-Global方程,亚洲和黑人移植候选者将平均前移21.2个位置(表明更高的优先级),相当于减少4.3天的预期等待时间。西班牙裔和白人移植候选人平均会后退4.3个职位(表明优先级较低),相当于额外1.1天的预期等待时间。最有利的患者将前移150个位置(10.7%的轮候名单),而最不利的患者将后移80个位置(5.7%的轮候名单),对应于预期的等待时间变化,分别减少4.6周和2.5周(图2B)。
使用GLI-2012和GLI-Global方程校正后的呼吸功能指数与呼吸结局的相关性在预测体力衰竭、限制活动的喘息、限制活动的肺部或呼吸问题、因喘息就诊、夜间住院、新发哮喘、慢性下呼吸道疾病死亡、365天内在肺移植等待名单上死亡以及死于任何原因方面具有相似的判别准确性(表4)。绝对差异接近或不到1个百分点,这表明一个方程表现优于另一个的例子很少。对敏感度和特异度的二次分析表明,使用GLI-Global方程提高了黑人参与者对大多数结果的敏感度,降低了特异度,而在西班牙裔和白人参与者中产生了相反的影响(表S5和S6)。图S4、S5和S6显示了跨肺活量阈值的灵敏度和特异度的ROC曲线。表S7、S8和S9以及图S7到S10提供了对健康人中预测的正常肺活量测定结果与测量的肺活量测定结果进行比较的其他分析。
这项研究阐述(GLI-2012)方程和2022年引入的种族中性方程(GLI-Global)在疾病分类、职业资格和残疾补偿影响差异,以及在呼吸道症状、卫生保健利用、新发疾病、任何原因死亡、与呼吸系统疾病相关的死亡以及等待移植名单上的人死亡方面具有类似的判别准确性。全面量化各标准对社会、医疗、财务影响。
1.基于种族的肺功能方程式有什么利害关系?为数百万患者提供临床、职业和财务重新分类
2.使用或消除种族可以对数百万患者的肺部疾病进行重新分类,并重新分配数十亿美元的残疾补偿。这些变化是由于敏感性与特异性的权衡造成的,对鉴别准确性没有总体影响。
3.肺活量测定法是一种肺功能测试,用于测量某人在一秒钟或一次完整呼吸中可以呼出的空气量。它用于诊断哮喘和慢性阻塞性肺病等常见疾病,并测量呼吸系统健康
4.一个多世纪以来,个人的肺活量测定测试是通过与基于年龄、性别、身高和种族的预测“正常”进行比较来解释的。
5.这意味着三个原本相同的人可能会经历不同的诊断、工作资格和残疾补助金,具体取决于他们假设或报告的种族。
6.2022年,美国和欧洲呼吸学会推荐了一种新的种族中立方程式,但我们仍然对预期的下游影响(或等效地,首先添加种族的影响)知之甚少。
7.这些转变往往是双向的。考虑一个50岁的黑人男子在寻找消防工作。使用种族中立的方程式可能会使他失去工作资格。但是,如果他后来为慢性阻塞性肺病寻求残疾福利,种族中立的方程式将证明更高的赔偿是合理的。
8.我们的研究使用了来自美国和英国370,000名参与者的数据来比较基于种族和种族中立的方程来解释肺功能。我们研究了临床、职业、财务和统计学意义。
9.临床影响:1250万美国人患有重新分类的通气障碍,200万人重新分类为COPD严重程度。这对诊断和后续检测、治疗、保险范围和试验入组有重大影响。
10.职业影响:230万人有资格改变消防工作。预计建筑、采矿和纺织行业的工作也会发生类似的资格变化。
11.财务影响:在413,000名美国退伍军人中重新分配了$2B的残疾赔偿,其中黑人退伍军人多了$1B,白人退伍军人少了$0.5B。
12.移植影响:2020年美国肺移植候补名单上90%的患者重新排列,亚裔和黑人患者平均向前移动21个位置,西班牙裔和白人患者平均向后移动4个位置。
13.在所有这些权衡中,我们提出了一个问题:使用种族是否使等式更准确?准确性对肺功能的意义不如对肾功能的意义,因为没有像测量的GFR那样的“金标准”。
14.因此,我们评估了判别准确性,该准确性衡量肺功能指数在临床终点(如新发疾病或死亡率)方面对个体进行排名的程度。
15.我们的研究发现,使用种族并不能提高预测呼吸结果的判别准确性。相反,它牺牲了敏感性来换取特异性,并因种族而异。
16.一个多世纪以来,种族调整得到了肺功能种族差异是自然和良性的假设的支持。新的GLI-Global方程虽然不完美,但为超越这一点提供了重要的机会。
17.我们希望量化基于种族的肺活量测定法的影响可以为纠正其危害的干预措施提供信息,为预期的护理变化做好准备,以及改进未来的方程式。
18.我们还希望肺功能评估能够纳入个性化基线和更全面的措施,继续摆脱种族等粗糙的启发式方法,朝着精准医疗的共同理想迈进
订阅后可查看全文(剩余80%)