写在前面的话
在真实世界中,患者和家属可能会关心:这个药值不值得花这个钱。作为临床药研人的你,也许看到一个获批的、具有更强*性特征的药物组合虽然能显著延长无进展生存期(PFS),却在总生存期(OS)上没有明显临床获益,会好奇应当如何评价这个药物组合的经济价值。医保决策部门总是会关心:获批药物是否值得纳入医保,以什么样的价格纳入是合适的。
这些问题都涉及到药物经济学评价
药物经济学评价和决策中涉及复杂统计模型的构建与分析,尤其是围绕效果(effectiveness)分析指标质量调整生命年(QualityAdjustedLifeYears,QALYs)的模型分析。今天走出临床统计的舒适圈,给大家写些新鲜东西。
围绕QALYs的计算模型有不同类型,各有优势,亦各有假设和局限。“花开数朵,各表一枝”,作为药物经济学评价中的统计的第一篇文章,今天给大家讲在肿瘤治疗方案QALYs计算中常用的、依赖假设相对少、和容易理解的分区生存分析(PartitionedSurvivalAnalysis,PartSA)。今后也希望给大家介绍其它方法,比如更为经典和普适的状态转移模型(statetransitionmodel)。与此同时,今后也会向有药物经济评价实战经验的统计师邀稿实例分享。
文章大纲如下:
1.背景:药物的成本-效果分析
2.关于质量调整生命年(QALYs)
3.QALYs的计算方法之:分区生存分析(PartSA)
4.应用案例:帕博利珠单抗(Pembrolizumab)对比伊匹单抗(ipilimumab)用于未经ipilimumab治疗的晚期黑色素瘤患者的药经评价
正文共计字,适合大众阅读。
01
背景:药物的成本-效果分析
“药物经济学是研究如何使用有限的药物资源实现最大程度的健康效果改善的交叉学科,应用经济学的理论基础,系统、科学地比较分析医药技术之间的经济成本和健康产出,进而形成决策所需的优选方案,旨在提高医药资源配置的总体效率。”(参考文献)
比较相同临床设定下(如治疗晚期黑色素瘤)的若干备选干预方案时,药物经济学评价主要通过成本-效果分析(Cost-EffectivenessAnalysis,CEA),以回答"应该选择哪种干预方案?是更便宜的但效果稍弱的方案,还是更昂贵的但稍微更有效的方案?"(见图1)。
图1:CEA框架。分别确定并衡量每种干预方案的成本和效果,并计算成本增量和效果增量的比值(increamentalcost-effectivenessratio,ICER)。ICER=成本增量/效果增量
在图1的例子中,如果干预方案A效果优于干预B且成本较低,则干预方案A显然占绝对优势。可如果干预A具有更好的效果,但成本也高于干预B,则计算ICER以用于确定干预A所获得的更好的效果所对应的额外费用是否可承担。
***举个玩具例子***
在肿瘤研究中,效果的计算通常使用质量调整生命年(QALYs),1QALY代表完全健康状况下的一年(本文下一节具体介绍)。假设方案A和B下,患者的期望QALYs分别为2.75年和1.8年。进一步假设方案A和方案B的治疗总成本分别为65万人民币和56.5万人民(注:成本计算需要考虑治疗相关的直接和间接成本,也涉及到复杂的分析,本文不会涉及。感兴趣的朋友可以阅读参考文献做初步了解)。
那么干预方案A的ICER=(65-56.5)/(2.75-1.8)=8.95(万元/QALY),代表医疗保健系统将为患者1QALY的提高支付额外的约9万人民币。在ICER分析中,我国对于1QALY的意愿支付阙值建议采用全国人均GDP的1-3倍(参考文献[1]),但在实际医保谈判中,一般按照0.8倍甚至0.5倍等其它数值进行。我国年的全国人均GDP约为7.2万元,该玩具例子中ICER在支付阙值附近,A方案是勉强符合药物经济学要求的方案。
02
质量调整生命年(QALYs)
效果增量分析通常以QALYs作为指标。顾名思义,QALYs是衡量寿命的指标。但与普通寿命单位(生命年)不一样的是,QALYs计算用的是基于生存质量(QualityofLife,QoL)调整的生命年。比如小赵在完全健康状况下生活的一年和因疾病卧床一年的QALYs就不一样,后者可能只能算0.1个QALYs。
当比较不同治疗方案时,QALYs能够在一个相同尺度上综合对应不同QoL的健康状态下的期望生命年产生药物效果分析指标。假设一个患者从患病至死亡经历了k类健康状况,那么:
***举个玩具例子***
假设A和B都是用于治疗一种引起严重免疫缺陷的病*感染的干预方案。如图2,方案A控制感染更强,一部分患者可认为是治愈,但人群总死亡率上升,因此方案A的期望寿命为4年(
非统计师:“期望”可理解为人群均值);方案B在感染控制上弱,大部分患者很快会发生自免疫缺陷问题,导致生存质量很差,但却可以长期带病生存,方案B的期望寿命为5年。如图2,假设我们对带病状态良好、一般、较差、极差的生命年按QoL调整权重(q)分别设为0.8,0.5,0.3,0.1。那么干预方案A的QALYs为(2.5*0.8+1.5*0.5)=2.75;干预方案B的QALYs为(1*0.8+3*0.3+1*0.1)=1.8。虽然方案A的期望寿命短1年,但增加了0.9个QALY。
图2:干预方案A和B下的患者期望健康状况变化图
QALYs计算中的调整权重(q)如何取值呢?一般是基于一些QoL评价工具(比如EQ-5D量表;EORTCQLQ-C30量表等)的数据分析结果转换计算(参考文献)。实践中,即使应用相同QoL量表收集到相同结果,不同国家针对量表中各个问题的权重调整可能不一样,最后转换的q也可能不一样。本文也不就这一问题展开讲。
03
QALYs的计算方法之:PartSA
从上一节,大家可能感觉QALYs分析是很简单的事情,似乎只要知道患者在每种健康状态下的期望生命年(直至转移至下一健康状态)和每种状态的QoL调整权重就可以计算QALYs。而事实上,建模过程并没有那么简单。健康状态分类和可能非常复杂的状态间的结构性关系、建模数据的局限性(注:对于新药的QALYs评价,通常还是基于关键3期临床试验数据,对药经评价来说临床试验样本量较小、随访时间短)都会对QALYs的建模分析带来挑战(参考文献)。
QALYs的建模分析方法主要包括:
状态转移模型(如马尔科夫模型):可处理具复杂结构性关系的状态分类。比如下图3,个体可从患病至严重恶化或者直接死亡,也可能被治愈(健康)。那么在研究患病状态下的期望生命年时,我们需要考虑个体在不同单位时间被治愈的概率、恶化的概率、直接死亡的概率等。状态转移模型下涉及到复杂的模型变量(图中的h系列变量)和变量间关系构建,因此变量的估计不能从汇总数据中直接得到,需更多地要依赖统计模拟。比如,死亡率可直接观察到,但在状态转移模型下,该死亡率需要被拆解为健康、患病、严重恶化3种状态到死亡的三个需被估计的转移概率(h14,h24,h34)。在肿瘤研究中,额外的挑战是不同状态至死亡的期望时间不一样,但由于试验截止日的删失,受删失的影响也不一样,因此当试验随访时间短时,参数的估计可能更不准确。关于状态转移模型,今天这篇文章不再多讲。
图3:复杂的状态结构,状态转移模型(图示为马尔科夫转移链)适用,PartSA模型不适用
分区生存分析(PartSA)(参考文献):PartSA模型在晚期和复发性肿瘤治疗方案的药经评价时很常用,适用于单方向的简单状态转移结构,如下图4。和状态转移模型不一样的是,PartSA模型中个体状态的界定直接依据生存曲线,模型估计简单得多,也更易于临床研发同学们理解。
图4:单方向的3-状态结构。患者到了疾病进展后不可能回复到初始的无进展状态(虽然他们对于后线治疗为无进展状态,但不是对当前治疗)。3-状态架构是晚期肿瘤治疗方案药经评价最简单和常用的状态分类架构,因为通常认为未发生疾病进展和发生疾病进展后,患者的生存质量和医疗花费是不一样的。
******
PartSA模型概览
******
我们以图4的3-状态架构为例介绍PartSA模型。与状态转移模型不一样的是,在PartSA模型中我们不关心状态本身,而是关心从当前状态到状态单方向变化发生前的期望生命年。3-状态问题下,我们关心的就是未发生进展的期望生存,即从状态1初始状态,如接受1线治疗到状态2疾病进展发生前的期望生命年,和进展后的期望生存,即状态2疾病进展到状态3死亡发生前的期望生命年。患者未发生疾病进展的期望生存可以直接通过PFS估计,而进展后的期望生存可以通过OS和PFS共同估计(OS和PFS的概率差值不正是进展后生存PPS概率么)。参考下图5:
图5:分区生存模型的状态划分和状态下期望生存时间的估计
因此,分区生存模型的精髓就是依据生存曲线将患者健康状态分为不同区域(如图6)。生存分析中的期望生命年就是截止至L的生存曲线下区域面积。是不是非常直观!
图6:3-状态分区生存生存模型的图示,L=20年
有了每种状态下的期望生存时间,再对其进行QoL权重调整,我们就可以计算QALYs。
当我们研究更为复杂的治疗方案时(比如1线2线最佳序贯治疗方案),我们也可以使用多状态的PartSA分析(只要状态结构是单方向就可以)。比如一个4-状态药经问题在PartSA分析下可分为3个区:
1线治疗下的无进展生存分区1:PFS1
2线治疗下的无进展生存分区2:PFS2-PFS1
2线治疗进展后生存分区3:OS-PFS2
死亡终止状态:1-OS
******
进阶版阅读:数据的外推
******
如前文所讲的,在对一个新药做药经评价时,对QALYs的估计主要依赖于注册性三期试验数据(和标准治疗对照)。在无论是肿瘤还是非肿瘤项目,就会有一个挑战:临床试验随访时间是有限的,很难提供药物长期(比如L=20年)CEA分析所需信息。尤其是肿瘤项目中,OS是评估QALYs的重要指标,但一个肿瘤临床试验至主要分析甚至最终分析时中位随访时间可能只有1-5年,OS常常不成熟。PartSA亦尤其依赖完整生存曲线的估计,怎么办呢?
这就要依赖于生存曲线“外推”(extrapulation),即依据已经观测的生存数据拟合每一个药物风险特征(比如拟合OS风险率hazardrate),并依据拟合风险率模拟生成观测时间窗外的生存曲线。
这仿佛是很简单的事情,但应用中其实有很多挑战(参考文献)。比如下图7,代表了一种香蕉型的非比例OS风险的挑战。假设治疗组药物(图7(a)虚线)的疗效特征是能极显著延长无进展生存期,但患者一旦进展就会很快死亡。假设对照组药物(图7(a)实线)特征是虽然存在早期死亡率快速攀升,但死亡率会随时间变稳定可控。在这种情况下,两组疗效风险比(hazardratio)就会是先降低后提高直至没有区别的状态(图7(b)代表Actual的虚线,可见hazardratio先是小于1,最后收敛到1),即治疗组相对于对照组没有长期OS获益优势。假设由于临床试验观测数据的有限性(只观察到t*),我们需要拟合长期OSKM曲线。如果我们依据早期观测数据并假设不变的死亡风险率进行t*时间后生存曲线的拟合(7(b)predicted虚线),则治疗组OS的长期获益会被高估,那么治疗组的QALYs增量也会被高估。
图7:引自参考文献,数据外推的挑战。
目前所有应用PartSA的方法都涉及到数据外推(参考文献)。数据外推是否使用了合理的参数模型经常被药经评估部门提出(比如使用不变的风险率外推数据是否合理;是否应该加上随时间的加速或者减速的风险率参数等),了解药物疗效特征对合理的数据外推非常重要。实战过程中,一般会使用不同的参数模型都试一下,挑其中拟合最好的模型。此外,探索不同模型下药经评价最终结论的稳健性也很重要。这一点会在下一节通过应用案例进一步解读。
04
应用案例
NICEDSUTSD19(参考文献)系统地回顾了应用PartSA模型进行药经分析的案例。基于NICE技术鉴定报告(technicalappraisal),读者也可以全面了解药经评价的很多实战案例和审评考虑。其中,NICE技术鉴定报告(