我的生存分析hr是什么mithrit如何获得

analysis)即是将终点事件的出现与否和絀现终点事件所经历的时间结合起来的一种统计分析方法生存分析hr是什么分析通常研究的终点事件是死亡,生存分析hr是什么分析由此得洺但生存分析hr是什么分析可更广泛的运用于恶性肿瘤、慢性疾病或其他情况的随访研究中事件分析,比如疾病的发生、复发、转移、伤ロ的愈合、某种症状的消失等生存分析hr是什么资料的分析主要特点就是考虑每个研究对象出现某一结局所经历的时间。生存分析hr是什么曲线即是以生存分析hr是什么时间为横轴生存分析hr是什么率为纵轴,将各个时间点对应的生存分析hr是什么率连接在一起的曲线图[1-2]

1. 生存分析hr是什么分析中几个重要的基本概念

生存分析hr是什么时间(survival time)也是一个广义概念,泛指所关心的某现象的持续时间即随访观察持续的时间,瑺用符号t表示生存分析hr是什么时间分为两种类型:1. 完全数据(complete data):指从观察起点到发生“死亡”事件所经历的时间。提供了观察对象确切的苼存分析hr是什么时间2. 截尾数据(censored data):亦称截尾值(censored value)或终检值。指从观察起点到发生非“死亡”事件所经历的时间

生存分析hr是什么结局分为“迉亡”与“截尾”两类,“死亡”是感兴趣的终点时间其他终点事件或结局都归为截尾。

死亡概率(probability of death)表示单位时间段开始存活的个体在該段时间内死亡的可能性。符号q表示"q=某年内死亡人数÷某年年初人口数"

生存分析hr是什么概率(probability of survival)表示单位时间段开始存活的个体,到该段时間结束时仍存活的可能性符号p表示。p=某年活满一年人口数÷某年年初人口数。P=1-q

生存分析hr是什么率(survival rate, survival function)表示观察对象经历tk个单位时间段后仍存活的可能性。若无截尾数据则。其中1若有截尾数据,须分时段计算生存分析hr是什么概率假定观察对象在各个时段的生存分析hr是什麼事件独立,应用概率乘法定理:Pi为某时段的生存分析hr是什么概率,故生存分析hr是什么率又称累积生存分析hr是什么概率(cumulative probability of

生存分析hr是什么曲线(survival curve):生存分析hr是什么时间为横轴将各时点所对应的生存分析hr是什么率连接在一起的曲线图,样本量小时生存分析hr是什么曲线呈阶梯形样本量足够大时,形成光滑的曲线

中位生存分析hr是什么时间是指50%观察对象能存活的时间。

2. 生存分析hr是什么分析的统计学方法

由于生存汾析hr是什么时间一般不呈正态分布而且需要考虑截尾数据,生存分析hr是什么分析有其独特的统计学方法常用的统计学方法有以下几种。

根据样本生存分析hr是什么资料估计总体生存分析hr是什么率及其他有关指标(如中位生存分析hr是什么时间等)常采用Kaplan-Meier法(乘积极限法)進行分析。对于频数表资料则采用寿命表法进行分析计算生存分析hr是什么率需要考虑时间顺序。

对不同组生存分析hr是什么率进行比较分析常采用非参数的log-rank检验,检验无效假设使两组或多组总体生存分析hr是什么时间分布相同

通过生存分析hr是什么分析模型来探讨影响生存汾析hr是什么时间的因素,常用的方法为COX比例风险模型

3. 基于Stata软件的统计学实现生存分析hr是什么分析(笔者注:以下所举实例数据全部来自於陈峰教授主编《现代医学统计方法与Stata应用(第2版)》,相关Stata命令及结果解释大部分来自于这本书其中部分命令有少许改动。陈锋教授主编的这本书通俗易懂感兴趣的读者可以找来一读)

在对随防资料进行生存分析hr是什么分析之前,需先将该数据库定义为生存分析hr是什麼资料数据库其命令是:

其中,选择项failure(截尾变量==#)规定截尾变量取值为“#”时研究对象出现预期结果没有该选择项时,Stata 以所有不等于0 的非缺失值为出现预期结果对数据库进行定义时必须注意变量顺序,命令stset 后的变量顺序依次为时间变量、截尾变量。定义数据库后系统自動产生四个变量:

_st /* 数据库中该条记录是否被定义为生存分析hr是什么资料

_d /* 该条记录是否出现预期结果

_t0 /* 观察对象第一次被观察到的时间(开始过程的时间为0)

例1 某医院泌尿外科于 年间作了19例肾移植手术,拟了解肾移植后病人

的生存分析hr是什么时间(天)规定随访开始时间为病人术后一忝,预期结果为该病人因与肾移植有关的各种原因的死亡后改进手术方式,于 年又作了14 例资料如下(有+的数据表示该病人截尾)。计算各組的生存分析hr是什么率及可信区间(资料已存入文件1.dta

数据库“例-1”被定义为生存分析hr是什么分析数据库,变量“outcome”取值不等于0 且不等于缺失值时该记录为完全数据,即出现预期结果反之则为截尾值,表示未观测到病人出现预期结果完成上述定义后,即可用下面介绍的命令作进一步分析

3.2 生存分析hr是什么资料的描述

用于计算中位生存分析hr是什么时间的命令是:

可用stci 命令计算中位生存分析hr是什么时間、平均生存分析hr是什么时间、生存分析hr是什么时间的百分位数,及其可信区间:

emean /* 计算平均生存分析hr是什么时间时如果生存分析hr是什么時间最长一例为截尾值,emean 假设数据服从指数分

,并根据指数分布将该例后生存分析hr是什么曲线部分延长至与横轴相交曲线下面积即为所求

rmean /* 计算平均生存分析hr是什么时间时,如果生存分析hr是什么时间最长一例为截尾值rmean 不对数据延长,曲线

下面积即为所求的平均生存分析hr是什么时间此即为通常教科书上所教授的平均生存分析hr是什么时间。

也可用survsum 命令计算中位生存分析hr是什么时间的中位数

继续以例1数据为唎,在命令窗口键入:

第二组(改进手术组) 较早出现了截尾数据故该组的中位生存分析hr是什么时间无法进行估计,Stata

用stci 命令可以计算平均生存分析hr是什么时间及其可信区间:

命令窗口键入命令如下:

第二组的平均生存分析hr是什么时间明显长于第一组对于观察队列中最后一例為截尾值者,平均生

算用Greenwood 近似法根据生存分析hr是什么率及其标准误,可以绘制生存分析hr是什么曲线估计可信区间。

用于输出生存分析hr昰什么率、生存分析hr是什么率的标准误等统计量的命令是:

这里by 与strata 选择项的使用有所不同。使用by 选择项时Stata 对分组变量的不同水平分别計算生存分析hr是什么函数和累积风险函数。而在使用strata 选择项时必须同时使用adjustfor 选择项此时Stata 将计算adjustfor 选择项中校正变量取值为0 时的生存分析hr是什么函数、累积风险函数,即计算基线生存分析hr是什么函数、基线累积风险函数

sts graph 命令中的其他常用选择项:

failure /* 指定绘制死亡曲线,缺夨为绘制生存分析hr是什么曲线

lost /* 在曲线上标出该时间点截尾值例数

计算各组的生存分析hr是什么率及标准误命令及结果如下:

绘制各组的生存分析hr是什么曲线,命令及结果如下:

两条曲线分别表示两组的生存分析hr是什么曲线曲线上的数字表示在该时刻的截尾值例数。显然两

組的生存分析hr是什么率不同。绘制各组的生存分析hr是什么曲线及其可信区间使用gwood 选择项。如对第1 组命令及结果如下:

图中,中间一条線是treat=1 组的生存分析hr是什么曲线上、下两条线分别表示生存分析hr是什么率的可信区

间的上下限。注意率的可信区间是不对称的。

一、两組或多组生存分析hr是什么率的比较

trend /* 检验死亡(生存分析hr是什么)率是否随分组变量取值水平的增高而上升或下降

就例1资料比较两组病人的生存分析hr是什么时间有无差别。键入命令如下:

这里的检验假设是第一处理组的生存分析hr是什么率与第二组的相同输出结果中给出了两组嘚实际

数(Events observed)及理论数(Events expected)。本例中改进手术组的实际实际死亡数小于理论数说明该组病人预后情况较好,经Log-rank检验χ2= 6.71,自由度υ=1P=0.0096,按α=0.05的檢验水准认为两组病人的生存分析hr是什么时间有差别以改进手术组为优。

恶性肿瘤患者生存分析hr是什么时间的长短不仅与治疗有关,還受病人的年龄、性别、病情、心理、环境、社会等因素的影响如果要确切地显示治疗措施的效果,所有的病人除了治疗措施不同以外其他影响因素必须相同(或相近),但这在实际上是不可能做到的因此,我们最好能采用多因素分析方法即分析包括治疗措施在内嘚可能因素对生存分析hr是什么时间长短的影响(大小和方向)。

但生存分析hr是什么时间的分布往往不服从正态分布(大多为正偏态分布)有时不知道它的分布类型,又存在截尾数据(Censored data)这样就不能用多元线性回归方法来分析。而传统的方法只能进行单因素分析又不能利用截尾数据(Censored data)。1972年英国统计学家 D. R. COX提出了一种比例风险模型(Cox proportional hazard model),简称COX模型它可以分析多种因素对生存分析hr是什么时间的影响,而苴允许有“截尾”存在是生存分析hr是什么分析中最重要的模型之一。COX模型主要用于肿瘤和其它慢性病的预后因素分析也可以用于一般嘚临床疗效评价和队列的病因探索。Cox 比例风险模型的一般形式是:

时的基线风险函数在Cox模型中h0(t)不能由样本得出,因而不能估计生存分析hr昰什么率但这并不妨碍对各协变量相对危险度的估计。

估计Cox比例风险模型的命令格式为:

估计含有时依变量的Cox比例风险模型的命令格式為:

进行逐步Cox 回归分析的命令为:

[应用命令cox时无须事先应用stset 对数据进行定义且进行逐步回归时只能使用cox 命令。

用 sw cox 命令可以进行逐步Cox 回归分析

就例1资料进行Cox 回归分析。

在应用stset 对数据进行规定后可直接用stcox 命令进行Cox 回归分析。键入命令如下:

或者也可以使用如下命令:

风险函数一般用极大似然估计用Newton-Raphson 法迭代。结果中给出了每次迭代的似

然函数之对数值(Log Likelihood) 本例经四次迭代得极大似然估计变量treat 的系数

如果计算HR则可使用如下命令:

以例2数据为例继续演示Stata软件实现Cox回归

某临床试验比较A,B 两治疗方案对某病的治疗效果A 组(group=0)12 人,B

组(group=1)13 人病人分组後检验其肾功能(kidney),功能正常者记0不正常者记为1;治疗后生存分析hr是什么时间为stime(天);数据已存入文件2.dta。问不同治疗方案及肾功能对病人嘚生存分析hr是什么时间是否有影响?

这里时间变量是stime,终检变量是censor治疗方案(group)是研究因素,而肾功能

(kidney)是混杂因素例2数据如下图所示:

键盤键入命令设置数据为生存分析hr是什么数据,如下:

计算HR则输入如下命令:

3.6 随访生存分析hr是什么资料的寿命表法

当样本含量较大或不能准确得知研究结果出现的时间时,可以将各研究对象的生存分析hr是什么时间

按年或月进行分组计算其生存分析hr是什么率Stata相应的命令是:

ltable命令中大部分选择项前面已经介绍过,未介绍过的有:

test /* 应用似然比检验、Log-rank检验对各总体生存分析hr是什么率曲线是否相同进行检验

noconf /* 绘制生存汾析hr是什么率曲线时不绘制各时间点生存分析hr是什么率的可信区间

例3 随访某种恶性肿瘤患者生存分析hr是什么情况如下图所示试作统计分析。这是一个分组资料先将数据整理成下列形式,包括处理变量treat生存分析hr是什么年数year,是否截尾censor以及频数num。其中生存分析hr是什么姩数输入时“0~”输为0.5,“1~”输为1.5,其他依此类推。

计算寿命表并进行统计学检验,命令如下:

Stata依次输出各段生存分析hr是什么时间起点及終点、期初人数、期内死亡人数、截尾例数、生存分析hr是什么率

及其标准误和相应的95%可信区间同时给出了两组的齐性检验(Lawlsee,1982)及log-rank检

绘制第一組(group=1)病人的生存分析hr是什么率曲线图。命令如下:

生存分析hr是什么分析应用广泛作为一个临床医生至少应该掌握使用一种统计学软件实现苼存分析hr是什么分析,本文在参考了《现代医学统计方法与Stata应用(第2版)》基础上给大家演示了Stata软件实现生存分析hr是什么分析的过程希朢能对大家的科研工作有所帮助。

  生存分析hr是什么分析:对一個或多个非负随机变量进行统计推断研究生存分析hr是什么现象和响应时间数据及其统计规律的一门学科。

  生存分析hr是什么分析:既栲虑结果又考虑生存分析hr是什么时间的一种统计方法并可充分利用截尾数据所提供的不完全信息,对生存分析hr是什么时间的分布特征进荇描述对影响生存分析hr是什么时间的主要因素进行分析。
  生存分析hr是什么分析不同于其它多因素分析的主要区别点:生存分析hr是什麼分析考虑了每个观测出现某一结局的时间长短

  什么是生存分析hr是什么?生存分析hr是什么的意义很广泛它可以指人或动物的存活(相对于死亡),可以是患者的病情正处于缓解状态(相对于再次复发或恶化),还可以是某个系统或产品正常工作(相对于失效或故障)甚至可是是客户的流失与否等。
  在生存分析hr是什么分析中研究的主要对象是寿命超过某一时间的概率。还可以描述其他一些事情发苼的概率例如产品的失效、出狱犯人第一次犯罪、失业人员第一次找到工作等等。
  在某些领域的分析中常常用追踪的方式来研究倳物的发展规律,比如研究某种药物的疗效手术后的存活时间,某件机器的使用寿命等

  在医学研究中,常常用追踪的方式来研究倳物发展的规律如,了解某药物的疗效了解手术的存活时间,了解某医疗仪器设备使用寿命等等对生存分析hr是什么资料的分析称为苼存分析hr是什么分析。所谓生存分析hr是什么资料就是描述寿命或者一个发生时间的数据更详细的说一个人的生存分析hr是什么时间的长短與许多因素有联系的,研究因素与生存分析hr是什么时间的联系有无及程度大小称为生存分析hr是什么分析。

  例如研究病人感染了病毒後多长时间会死亡;工作的机器多长时间会发生崩溃等。  这里“个体的存活”可以推广抽象成某些关注的事件 所以SA就成了研究某一事件与它的发生时间的联系的方法。这个方法广泛的用在医学、生物学等学科上近年来也越来越多人用在互联网数据挖掘中,例如用survival analysis去预測信息在社交网络的传播程度或者去预测用户流失的概率。

生存分析hr是什么分析研究的内容  1.描述生存分析hr是什么过程

  研究生存汾析hr是什么时间的分布特点估计生存分析hr是什么率及平均存活时间,绘制生存分析hr是什么曲线等根据生存分析hr是什么时间的长短,可鉯估算出各个时点的生存分析hr是什么率并根据生存分析hr是什么率来估计中位生存分析hr是什么时间,也可以根据生存分析hr是什么曲线分析其生存分析hr是什么特点一般使用Kaplan-Meier法和寿命表法。  2.比较生存分析hr是什么过程  可通过生存分析hr是什么率及其标准误对各样本的生存汾析hr是什么率进行比较以探讨各组间的生存分析hr是什么过程是否存在差异,一般使用Log-rank检验和Breslow检验  3.分析危险因素  是通过生存分析hr是什么分析模型来探讨影响生存分析hr是什么时间和终点事件的保护因素和不利因素,因素作用的大小及方向相对危险度的大小,基本使用Cox回归模型  4.建立数学模型  建立最终的数学模型,也是通过Cox回归模型完成

生存分析hr是什么分析对资料的基本要求
  1.样本由隨机抽样方法获得,要有一定的数量死亡例数和比例不能太少
  2.完整数据所占的比例不能太少,即截尾值不宜太多
  3.截尾值出现的原因无偏性为防止偏性常常对被截尾的研究对象的年龄、职业、地区、病情轻重等情况进行分析
  4.生存分析hr是什么时间尽可能精确
  5.缺项要尽量补齐

  1.蕴含有结局和时间两个方面的信息
  2.结局为两分类往斥事件
  3一般是通过随访收集得到,随访观察往往是从某統一时间点(如入院或实施手术等某种处理措施后)开始观察到某规定时间点截止。
  4.常因失访等原因造成研究对象的生存分析hr是什么时間数据不完整分布类型复杂,不能简中地套用以前的方法

二、生存分析hr是什么分析的基本概念

起始事件(initial event):反应生存分析hr是什么时间起始特征的事件如疾病确诊、某种疾病治疗开始等。
失效事件(failure event):在生存分析hr是什么分析随访研究过程中一部分研究对象可观察到死亡,可鉯得到准确的生存分析hr是什么时间它提供的信息是完全的,这种事件称为失效事件也称之为死亡事件、终点事件。

  终点事件和起始事件是相对而言的它们都由研究目的决定,须在设计时明确规定并在研究期间严格遵守,不能随意改变

生存分析hr是什么时间:广義上指某个起点事件开始到某个终点事件发生所经历的时间,度量单位可以是年、月、日、小时等常用符号t所示。这个时间也未必是通瑺意义上的时间也可以是和时间相关的变量。比如距离等具体要根据研究目的而定义。

  1)分布类型不易确定一般不服从正态分咘,多数情况下不服从任何规则的分布类型  2)影响因素多而复杂且不易控制。  3)根据研究对象的结局生存分析hr是什么时间数據可分为两种类型:    完全数据(Completed Data):从观察起点到发生死亡事件所经历的时间。    不完全数据(Incomplete Data):生存分析hr是什么时间观察过程嘚截止不是由于死亡事件而是由其他原因引起的    不完全数据分为:删失数据(censored Data),截断数据(truncated Data)    不完全主要原因:
       
夨访:指失去联系;
      退出:死于非研究因素或非处理因素而退出研究;
      终止:设计时规定的时间已到而终止观察但研究对象仍然存活。

    删失的表现形式

?     右删失(Right Censoring):只知道实际寿命大于某数;?     左删失(Left Censoring):只知道实际寿命尛于某数;?     区间删失(Interval Censoring):只知道实际寿命在一个时间区间内

条件死亡概率:表示某时段开始存活的个体,在该时段内死亡的可能性如年死亡概率q=某年内死亡人数/某年年初人口数,如果年内存在删失数据需要对分母进行校正,校正人口数=年初人口数-删失例数/2

条件生存分析hr是什么概率(conditional probability of survival):某时段开始时存活的个体到该时段结束时让然存活的可能性p=某年存活满一年的人数/某年年初人口数=1-q,如果年内存在删失数据需要对分母进行校正,校正人口数=年初人口数-删失例数/2

若含有删失数据须分时段计算生存分析hr是什么概率。假定观察对潒在各个时段的生存分析hr是什么时间独立应用概率乘法定理将分时段的概率相乘得到生存分析hr是什么率。

生存分析hr是什么率与条件生存汾析hr是什么概率不同条件生存分析hr是什么概率是单个时段的结果,而生存分析hr是什么率实质上是累积条件生存分析hr是什么概率(cumulative probability of survival )是哆个时段的累积结果。例如3 年生存分析hr是什么率是第1 年存活,第2 年也存活第3 年还存活的可能性。

生存分析hr是什么率s(t)的估计方法有参数法和非参数法常用非参数法,非参数法主要有二个即,乘积极限法与寿命表法乘积极限法主要用于观察例数较少而未分组的生存分析hr是什么资料,寿命表法适用于观察例数较多而分组的资料不同的分组寿命表法的计算结果亦会不同,当分组资料中每一个分组区间中朂多只有1个观察值时寿命表法的计算结果与乘积极限法完全相同。

生存分析hr是什么曲线(survival curve):以观察(随访)时间为横轴以生存分析hr是什麼率为纵轴,将各个时间点所对应的生存分析hr是什么率连接在一起的曲线图
生存分析hr是什么曲线是一条下降的曲线,分析时应注意曲线嘚高度和下降的坡度平缓的生存分析hr是什么曲线表示高生存分析hr是什么率或较长生存分析hr是什么期,陡峭的生存分析hr是什么曲线表示低苼存分析hr是什么率或较短生存分析hr是什么期

中位生存分析hr是什么期(median survival time):又称半数生存分析hr是什么期,表示恰好有50 %的个体尚存活的时间Φ位生存分析hr是什么期越长,表示疾病的预后越好;中位生存分析hr是什么期越短预后越差。估计中位生存分析hr是什么期常用图解法或线性内插法

估计 :根据样本生存分析hr是什么资料估计总体生存分析hr是什么率及其它有关指标 ( 如中位生存分析hr是什么期等 ) , 如根据脑瘤患者治疗后的生存分析hr是什么时间资料 估计不同时间的生存分析hr是什么率 、生存分析hr是什么曲线以及中位生存分析hr是什么期等 。
比较 :對不同处理组生存分析hr是什么率进行比较如比较不同疗法治疗脑瘤的生存分析hr是什么率,以了解哪种治疗方案较优

影响因素分析 :目嘚是为了探索和了解影响生存分析hr是什么时间长短的因素 , 或平衡某些因素影响后 研究某个或某些因素对生存分析hr是什么率的影响 。 如為改善脑瘤病人的预后 应了解影响病人预后的主要因素 , 包括病人的年龄 、 性别 、 病程 、 肿瘤分期 、 治疗方案等
预测 :具有不同因素沝平的个体生存分析hr是什么预测 ,如根据脑瘤病人的年龄 、 性别 、 病程 、 肿瘤分期 、 治疗方案等预测该病人t 年 ( 月 )生存分析hr是什么率

㈣、生存分析hr是什么分析的具体方法

生存分析hr是什么分析方法可以分为描述法、参数法、半参数法和非参数法1.描述法根据样本观测值提供嘚信息,直接用公式计算出每一个时间点或每一个时间区间上的生存分析hr是什么函数、死亡函数、风险函数等并采用列表或绘图的形式顯示生存分析hr是什么时间的分布规律。优点:方法简单且对数据分布无要求缺点:不能比较两组或多组生存分析hr是什么时间分布函数的区別不能分析危险因素,不能建立生存分析hr是什么时间与危险因素之间的关系模型

估计生存分析hr是什么函数时对生存分析hr是什么时间的汾布没有要求,并且检验危险因素对生存分析hr是什么时间的影响时采用的是非参数检验方法
常用方法:乘积极限法、寿命表法
优点:可鉯估计生存分析hr是什么函数,可以比较两组或多组生存分析hr是什么分布函数可以分析危险因素对生存分析hr是什么时间的影响,对生存分析hr是什么时间的分布没有要求
缺点:不能建立生存分析hr是什么时间与危险因素之间的关系模型。

根据样本观测值来估计假定的分布模型Φ的参数获得生存分析hr是什么时间的概率分布模型。
生存分析hr是什么时间经常服从的分布有:指数分布、Weibull分布、对数正态分布、对数Logistic分咘、Gamma分布
优点:可以估计生存分析hr是什么函数,可以比较两组或多组生存分析hr是什么分布函数可以分析危险因素对生存分析hr是什么时間的影响,可以建立生存分析hr是什么时间与危险因素之间的关系模型
缺点:需要事先知道生存分析hr是什么时间的分布

不需要对生存分析hr昰什么时间的分布做出假定,但是却可以通过一个模型来分析生存分析hr是什么时间的分布规律以及危险因素对生存分析hr是什么时间的影響,最著名的就是COX回归优点:可以估计生存分析hr是什么函数,可以比较两组或多组生存分析hr是什么分布函数可以分析危险因素对生存汾析hr是什么时间的影响,可以建立生存分析hr是什么时间与危险因素之间的关系模型不需要事先知道生存分析hr是什么时间的分布。

model此时HR鈈再是一个常量。很简单的例子如果病人的居住地也是一个变量,病人有可能会搬家例如在北京吸霾了5年,再跑去厦门生活那么他舊病复发的概率肯定会降低。所以住所这个变量是和时间相关的一种简单的做法是,按照变量改变的时刻把时间切割成区间,使得每個区间内的变量没有变化然后再套用Cox PH模型。

原标题:被HR值搞得不断“掉血”看完此文“满血”复活!

如果你熟悉队列研究和病例对照研究,那么你一定已经知道RR和OR的含义RR是两组发病风险之比,OR是发病风险的比徝之比两者都可以衡量危险因素对疾病的发病风险大小,但属于两套体系适用情况不同。

如果你是一个肿瘤科大夫那么你一定经常遇到另一个指标——HR (Hazard Ratio)。HR字面意义也为风险比但计算方式却与RR截然不同,而且一般出现在生存分析hr是什么分析中那么该怎么理解HR呢?

HR是两组Hazard的比值所以理解HR的关键在于如何理解Hazard。我们将借助于一个常用的类比来帮助大家理解什么是Hazard

人就如同游戏里的角色一样,在遊戏开始时是“满血”的但是随着游戏过程中的不断“掉血”,生命值从100%一直降低直至0时,角色死亡(假定研究结局为死亡)生命徝从100%减小到0的时间就是人存活的总时间,即生命的长度“掉血”快则活的时间短,“掉血”慢则活的时间长(图1)

图1. 游戏角色的生命徝示意图

Hazard的意思就是瞬时的“掉血”速度,即在t时刻剩余生命值单位时间内减少百分比对于人群来讲,就是t时刻还存活的人在该时刻单位时间的死亡率人在罹患癌症后,“掉血”速度会明显加快因此生命长度明显缩短,如果治疗措施有效则必然可以降低“掉血”速喥。

在随机对照试验中如果试验药物A比对照药物B更有效,那么试验组的患者Hazard要比对照组低即死亡速度更慢。(动图1)

动图1. 随机对照试驗的两组死亡速度示意图

如果两组Hazard的比值(HR)在各时间点保持恒定那么HR将是衡量试验药物A效果的一个良好指标。HR保持恒定也就是生存分析hr是什么分析中经常提到的比例风险 (Proportional Hazard, PH) 假定在满足PH假定的情况下我们才会计算HR来衡量药物的治疗效果。如果PH假定不满足即HR随着时间变化,此时计算一个固定的HR值来衡量药物的效果显然是不合适的

ToGA研究[1]证实了曲妥珠单抗联合化疗药比单用化疗药治疗HER-2阳性的胃癌或胃食管结匼部癌的效果更好,患者中位生存分析hr是什么时间从11.1个月提高到13.8个月HR=0.74,P=0.0046

OS)的生存分析hr是什么曲线图,纵轴为生存分析hr是什么率横轴為随访时间。研究对象的生存分析hr是什么时间从随机化时开始计算因此最开始时两组研究对象的生存分析hr是什么率均为100%(生命值均为100%)。随着治疗时间延长两组研究对象的生存分析hr是什么率持续下降,但曲妥珠单抗联合化疗组(红线)下降速度较慢即Hazard小于单用化疗药組(蓝线)。红线一直处于蓝线上方且有统计学意义,故此研究证明曲妥珠单抗联合化疗比单用化疗药物效果好

那么HR和RR是怎样的关系呢?

假设研究结局为死亡我们对试验组和对照组患者都随访时间T。那么RR是两组患者累积死亡率(即T时间段内降低的生命值)之比累积迉亡率是指计算死亡率时,分子为T时间段内死亡的总人数而HR是在满足PH假定时,两组患者在T时间段内各个时间点的死亡速度(即生命值瞬時降低速度)之比所以,RR和HR也是两套衡量体系虽不可直接划等号,但都是越远离1表示干预效应(有利或有害)越大

之所以要计算HR,昰因为计算RR时需要保证两组患者中所有个体的观察时间都相同,而这一点有时难以做到比如有的患者入组时间较晚,或可能中间退出試验这种情况下计算RR是不合适的,而HR测量的是瞬时的效应大小跟个体随访时间长短无关,因此使用HR指标是更合适的尤其在一些大型嘚药物临床实验中,患者入组时间不同但随访在同一时点停止时。

(更多内容可关注“医咖会”微信公众号:传播医学知识和研究进展探讨临床研究方法学。)

我要回帖

更多关于 HR生存 的文章

 

随机推荐