艾滋病介绍

首页 » 常识 » 常识 » 联合模型介绍及在医学研究中的应用
TUhjnbcbe - 2021/7/14 13:52:00

中华流行病学杂志,,40(11)翟映红,陈琪,韩贺东,等

摘要

医学随访研究中,纵向数据和生存数据往往伴随出现,并且通常相关联,对纵向数据和生存数据单独分析可能会导致有偏倚的结果。联合模型同时处理纵向数据及生存数据,能够纠正偏差,提高参数估计的效率并提供有效的推论,是目前医学研究中一个比较热门的方法。联合模型已取得较多进展,国内介绍及应用联合模型的文章较少。本文将从主要思想、基本框架、参数估计方法等方面对联合模型中的随机效应模型进行介绍,并基于R软件中程序包JM对艾滋病数据集分析,旨在阐明联合模型在处理医学随访数据中的优势,促进联合模型在临床研究中的应用。

背景

在医学随访研究中,针对每位受试者通常需要收集不同类型的测量数据,包括重复测量的纵向数据以及感兴趣事件的发生时间。典型的例子是涉及艾滋病的临床研究,其中生物标志物CD4+T淋巴细胞(CD4)计数往往有规则地以预定时间间隔测量。以Abrams等[]的随机临床试验为例,主要研究目的是比较两种替代抗反转录病*药物去羟肌苷和扎西他滨的有效性和安全性,研究中收集的数据包括纵向(研究开始以及之后2、6、12和18个月的CD4计数)和生存(患者出现死亡事件的时间)2类。这些数据的特点:①纵向测量数据是间歇性收集,并受测量误差影响;②感兴趣事件的发生将终止纵向测量过程,可能导致有用信息缺失;③纵向测量过程会影响生存过程。这些属性意味着分开进行重复测量和生存结果的分析是低效的,因为未充分利用重复测量过程和生存过程之间的潜在关系,并且忽略了测量误差,会导致两者之间联系的有偏估计。联合模型(Jointmodel)的出现,为同时分析这2类数据提供可能。年Wulfsohn和Tsiatis[]首先提出了用于处理重复测量和生存结局数据的联合模型,联合模型最早是应用于艾滋病研究中[]。近年来,联合模型得到进一步的发展,形式有更多扩展[],已被广泛用于其他临床研究领域,包括癌症[]、心血管疾病[]和肾移植研究[]等。

联合模型的基本结构联合模型主要有2类模型框架:随机效应联合模型(randomeectsjointmodel)[]和基于G估计的边际结构联合模型(marginalstructuraljointmodels)[]。随机效应联合模型是最常见的,本文主要对其展开介绍。随机效应联合模型由纵向子模型和生存子模型组成。Ti表示第i个受试者被观察到的事件发生时间,是真实事件时间T*i和潜在删失时间Ci的最小值,δi是事件发生指标。yi(t)表示第i个受试者在时间点t被观测到的纵向结果值,真实的未观察到的纵向结果值用mi(t)表示(受到测量误差的影响)。(1)纵向子模型:对于纵向子模型,常用的是线性混合效应模型:

其中β是固定效应的系数,bi是随机效应的系数,xi(t)和zi(t)分别表示固定和随机效应设计矩阵的行向量。εi(t)是测量误差项,假设与bi无关,服从均值为0,方差为σ2的正态分布。线性混合效应模型通过假设观察到的纵向结果的水平yi(t)等于真实水平mi(t)加上随机误差项来解释测量误差问题。

(2)生存子模型:对于生存子模型,常采用Cox比例风险模型:Mi(t)={mi(s),0≤s≤t}表示直至时间点t的真实未观察到的纵向过程轨迹,h0(·)表示基线风险函数,ωi是基线协变量(如治疗指标,疾病史等)的向量,γ是回归系数。纵向子模型和生存子模型通过参数α连接,α量化了潜在纵向结果对事件风险的影响。在标准Cox模型中基线风险函数h0(·)通常未指定,联合模型中需要明确地定义h0(·)。可以使用已知参数分布的风险函数(如Weibull、对数正态、Gompertz和Gamma分布),或更灵活的方法比如分段常数(piecewise-constantapproaches)和回归样条(regressionsplinesapproaches)[]。联合模型的参数估计联合模型参数估计的方法目前主要是极大似然方法和使用马尔科夫链-蒙特卡罗的贝叶斯方法,本文仅介绍联合模型中使用最多的极大似然估计[]。联合模型的极大似然估计是最大化事件发生时间和纵向结果联合分布{Ti,δi,γi}的对数似然函数。为了定义这种联合分布,将假设时间无关随机效应的向量bi是纵向和生存过程的基础。这意味着这些随机效应既解释了纵向和事件结果之间的关联,也解释了纵向过程中重复测量之间的相关性。其中θ表示参数矢量。由于生存子模型和纵向子模型具有相同的随机效应,因此这种类型的联合模型称为共享参数模型(sharedparametermodels)。据前提出的建模假设,以及这些条件独立假设,第i个患者的联合对数似然贡献可以表示为:f{γi(tij)

bi;θ}是纵向响应的单变量正态密度函数,g(bi;θ)是随机效应的多元正态密度函数。高斯积分[]和蒙特卡罗[]可用于参数的求解。实例应用

通过实例来演示联合模型在R中的实现过程,并将联合模型的结果与扩展的Cox模型结果进行对比。

(1)数据来源:

试验数据来自Abrams等[]随机临床试验(数据集AIDS可从R软件JM程序包中获得),研究人群为例在抗反转录病*治疗期间接受齐多夫定治疗失败或对齐多夫定治疗不耐受的晚期AIDS患者,患者被随机分配接受去羟肌苷或者扎西他滨治疗。记录研究开始以及之后2、6、12和18个月的CD4计数和患者出现死亡事件的时间。CD4计数随时间的减少表明患者免疫系统状况恶化,往往标示较差的预后。在下面的例子中,我们

1
查看完整版本: 联合模型介绍及在医学研究中的应用