五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

R語言中的生存分析Survival analysis晚期肺癌患者4例

2021-03-09 13:08 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=10278

?

第1部分:生存分析簡介?

本演示文稿將介紹生存分析 ,參考:

?

Clark, T., Bradburn, M., Love, S., & Altman, D. (2003). Survival analysis part I: Basic concepts and first analyses. 232-238. ISSN 0007-0920.

我們今天將使用的一些軟件包包括:

  • lubridate

  • survival

  • survminer

  1. library(survival)

  2. library(survminer)

  3. library(lubridate)

什么是生存數(shù)據(jù)?

事件時(shí)間數(shù)據(jù)由不同的開始時(shí)間和結(jié)束時(shí)間組成。

癌癥的例子

  • 從手術(shù)到死亡的時(shí)間

  • 從治療開始到進(jìn)展的時(shí)間

  • 從響應(yīng)到復(fù)發(fā)的時(shí)間

其他領(lǐng)域的例子

事件發(fā)生時(shí)間數(shù)據(jù)在許多領(lǐng)域都很常見,包括但不限于

  • 從艾滋病毒感染到艾滋病發(fā)展的時(shí)間

  • 心臟病發(fā)作的時(shí)間

  • 藥物濫用發(fā)生的時(shí)間

  • 機(jī)器故障時(shí)間

生存分析別名

由于生存分析在許多其他領(lǐng)域很常見,因此也有其他名稱

  • 可靠性分析

  • 持續(xù)時(shí)間分析

  • 事件歷史分析

  • 事件發(fā)生時(shí)間分析

肺數(shù)據(jù)集

數(shù)據(jù)包含來自北中部癌癥治療組的晚期肺癌患者。今天我們將用來演示方法的一些變量包括

  • 時(shí)間:以天為單位的生存時(shí)間

  • 狀態(tài):審查狀態(tài)1 =審查,2 =失效

  • 性別:男= 1女= 2

什么是審查?

?

RICH JT,NEELY JG,PANIELLO RC,VOELKER CCJ,NUSSENBAUM B,WANG EW。理解KAPLAN-MEIER曲線的實(shí)用指南。耳鼻咽喉頭頸外科:美國耳鼻咽喉頭頸外科學(xué)會(huì)官方雜志。2010; 143(3):331-336。doi:10.1016 / j.otohns.2010.05.007。

審查類型

某個(gè)主題可能由于以下原因而被審查:

  • 后續(xù)損失

  • 退出研究

  • 固定學(xué)習(xí)期結(jié)束前沒有活動(dòng)

具體來說,這些是審查的示例。

?

審查生存數(shù)據(jù)

?

在此示例中,我們將如何計(jì)算10年無事件的比例?

受試者2、3、5、6、8、9和10?在10年時(shí)都是無事件的。受試者4和7?在10年之前發(fā)生了該事件。主題1?在10年之前已被審查,因此我們不知道他們是否在10年之前有此事件-我們?nèi)绾螌⒃撝黝}納入我們的估計(jì)中?

分配隨訪時(shí)間

  • 受審查的主題仍會(huì)提供信息,因此必須適當(dāng)?shù)匕诜治鲋?/p>

  • 隨訪時(shí)間的分布存在偏差,在接受檢查的患者和有事件的患者之間可能有所不同

生存數(shù)據(jù)的組成部分

對于主題ii:

  1. 活動(dòng)時(shí)間TiTi

  2. 審查時(shí)間CiCi

  3. 事件指標(biāo)δiδi:

    • 1,如果觀察到的事件(即??Ti≤CiTi≤Ci)

    • 如果檢查,則為0(即??Ti>CiTi>Ci)

  4. 觀測時(shí)間Yi=min(Ti,Ci)Yi=min(Ti,Ci)

lung數(shù)據(jù)中提供了觀察時(shí)間和事件指示

  • 時(shí)間:以天為單位的生存時(shí)間(YiYi)

  • 狀態(tài):審查狀態(tài)1 =審查,2 =死亡(δiδi)

?

在R中處理日期

數(shù)據(jù)通常帶有開始日期和結(jié)束日期,而不是預(yù)先計(jì)算的生存時(shí)間。第一步是確保將這些格式設(shè)置為R中的日期。

讓我們創(chuàng)建一個(gè)小的示例數(shù)據(jù)集,其中sx_date包含手術(shù)日期和last_fup_date上次隨訪日期的變量。

  1. date_ex <-

  2. tibble(

  3. sx_date = c("2007-06-22", "2004-02-13", "2010-10-27"),

  4. last_fup_date = c("2017-04-15", "2018-07-04", "2016-10-31")

  5. )


  6. date_ex

  1. ## # A tibble: 3 x 2

  2. ## ? sx_date ? ?last_fup_date

  3. ## ? <chr> ? ? ?<chr>

  4. ## 1 2007-06-22 2017-04-15

  5. ## 2 2004-02-13 2018-07-04

  6. ## 3 2010-10-27 2016-10-31

我們看到它們都是字符變量,通常都是這種情況,但是我們需要將它們格式化為日期。

格式化日期-基數(shù)R

  1. date_ex %>%

  2. mutate(

  3. sx_date = as.Date(sx_date, format = "%Y-%m-%d"),

  4. last_fup_date = as.Date(last_fup_date, format = "%Y-%m-%d")

  5. )

  1. ## # A tibble: 3 x 2

  2. ## ? sx_date ? ?last_fup_date

  3. ## ? <date> ? ? <date>

  4. ## 1 2007-06-22 2017-04-15

  5. ## 2 2004-02-13 2018-07-04

  6. ## 3 2010-10-27 2016-10-31

  • 請注意,R格式必須包含分隔符和符號。例如,如果您的日期格式為m / d / Y,則需要format = "%m/%d/%Y"

  • ?

格式化日期-lubridate程序包

我們還可以使用該lubridate包來格式化日期。在這種情況下,請使用ymd功能

  1. date_ex %>%

  2. mutate(

  3. sx_date = ymd(sx_date),

  4. last_fup_date = ymd(last_fup_date)

  5. )

  1. ## # A tibble: 3 x 2

  2. ## ? sx_date ? ?last_fup_date

  3. ## ? <date> ? ? <date>

  4. ## 1 2007-06-22 2017-04-15

  5. ## 2 2004-02-13 2018-07-04

  6. ## 3 2010-10-27 2016-10-31

  • 請注意,與基本R選項(xiàng)不同,不需要指定分隔符

  • ?

計(jì)算生存時(shí)間?

現(xiàn)在日期已格式化,我們需要以某些單位(通常是幾個(gè)月或幾年)計(jì)算開始時(shí)間和結(jié)束時(shí)間之間的差。在base中R,用于difftime計(jì)算兩個(gè)日期之間的天數(shù),然后使用將其轉(zhuǎn)換為數(shù)字值as.numeric。然后將除以365.25年的平均天數(shù)轉(zhuǎn)換為年。

  1. date_ex %>%

  2. mutate(

  3. os_yrs =

  4. as.numeric(

  5. difftime(last_fup_date,

  6. sx_date,

  7. units = "days")) / 365.25

  8. )

  1. ## # A tibble: 3 x 3

  2. ## ? sx_date ? ?last_fup_date os_yrs

  3. ## ? <date> ? ? <date> ? ? ? ? <dbl>

  4. ## 1 2007-06-22 2017-04-15 ? ? ?9.82

  5. ## 2 2004-02-13 2018-07-04 ? ? 14.4

  6. ## 3 2010-10-27 2016-10-31 ? ? ?6.01

計(jì)算生存時(shí)間?

?操作員可以%--%指定一個(gè)時(shí)間間隔,然后使用將該時(shí)間間隔轉(zhuǎn)換為經(jīng)過的秒數(shù)as.duration,最后除以dyears(1),將其轉(zhuǎn)換為年數(shù),從而得出一年中的秒數(shù)。

  1. ## # A tibble: 3 x 3

  2. ## ? sx_date ? ?last_fup_date os_yrs

  3. ## ? <date> ? ? <date> ? ? ? ? <dbl>

  4. ## 1 2007-06-22 2017-04-15 ? ? ?9.82

  5. ## 2 2004-02-13 2018-07-04 ? ? 14.4

  6. ## 3 2010-10-27 2016-10-31 ? ? ?6.02

  • ?

事件標(biāo)標(biāo)

對于生存數(shù)據(jù)的組成部分,我提到了事件指示器:

事件指標(biāo)δiδi:

  • 1,如果觀察到的事件(即??Ti≤CiTi≤Ci)

  • ?如果檢查,則為0(即??Ti>CiTi>Ci)

?在lung數(shù)據(jù)中,我們有:

  • 狀態(tài):審查狀態(tài)1 =審查,2 =失效

生存函數(shù)

受試者可以存活超過指定時(shí)間的概率

?

S(t)=Pr(T>t)=1?F(t)S(t)=Pr(T>t)=1?F(t)

?

S(t)S(t):生存函數(shù)F(t)=Pr(T≤t)F(t)=Pr(T≤t):累積分布函數(shù)

理論上,生存函數(shù)是平滑的;在實(shí)踐中,我們以離散的時(shí)間尺度觀察事件。

生存概率

  • 生存概率在某個(gè)時(shí)間,S(t)S(t),是存活超過該時(shí)間,考慮到個(gè)體已存活剛剛在此之前,時(shí)間的條件概率。

  • 可以估計(jì)為當(dāng)時(shí)活著但沒有損失的隨訪患者人數(shù)除以當(dāng)時(shí)的活著患者人數(shù)

  • 生存概率的Kaplan-Meier估計(jì)是這些條件概率的乘積

  • 在時(shí)間0,生存概率為1,即??S(t0)=1S(t0)=1

創(chuàng)建生存對象

Kaplan-Meier方法是估計(jì)生存時(shí)間和概率的最常用方法。這是一種非參數(shù)方法,可產(chǎn)生階躍函數(shù),每次事件發(fā)生時(shí),階躍下降。

  • ?創(chuàng)建一個(gè)生存對象。對于每個(gè)主題,將有一個(gè)條目作為生存時(shí)間,+如果主題是經(jīng)過審查的,則后面跟一個(gè)。讓我們看一下前10個(gè)觀察值:

## ?[1] ?306 ? 455 ?1010+ ?210 ? 883 ?1022+ ?310 ? 361 ? 218 ? 166

用Kaplan-Meier方法估算生存曲線

  • survfit函數(shù)根據(jù)公式創(chuàng)建生存曲線。讓我們?yōu)檎麄€(gè)同類群組生成總體生存曲線,將其分配給object?f1,然后查看names該對象的:

names(f1)

  1. ## ?[1] "n" ? ? ? ? ?"time" ? ? ? "n.risk" ? ? "n.event" ? ?"n.censor"

  2. ## ?[6] "surv" ? ? ? "std.err" ? ?"cumhaz" ? ? "std.chaz" ? "start.time"

  3. ## [11] "type" ? ? ? "logse" ? ? ?"conf.int" ? "conf.type" ?"lower"

  4. ## [16] "upper" ? ? ?"call"

survfit對象將用于創(chuàng)建生存曲線的一些關(guān)鍵組件包括:

  • time,其中包含每個(gè)時(shí)間間隔的起點(diǎn)和終點(diǎn)

  • surv,其中包含每個(gè)對應(yīng)的生存概率?time

Kaplan-Meier圖?

現(xiàn)在, 繪制對象 獲得Kaplan-Meier圖。

  1. plot(survfit(Surv(time, status) ~ 1, data = lung),

  2. xlab = "Days",

  3. ylab = "Overall survival probability")

?

?

  • 基數(shù)R中的默認(rèn)圖顯示了具有相關(guān)置信區(qū)間(虛線)的階躍函數(shù)(實(shí)線)

  • 水平線代表間隔的生存時(shí)間

  • 時(shí)間間隔由事件終止

  • 垂直線的高度顯示累積概率的變化

  • 帶有刻度線的經(jīng)過審查的觀察結(jié)果會(huì)減少間隔之間的累積生存期。?

Kaplan-Meier圖?

?建立在上ggplot2,并可用于創(chuàng)建Kaplan-Meier圖。

  • 默認(rèn)圖??帶相關(guān)置信帶(陰影區(qū)域)的階躍函數(shù)(實(shí)線)。

  • 默認(rèn)情況下,顯示了被檢查患者的刻度線,在此示例中,該刻度線本身有些模糊,可以使用選項(xiàng)將其取消?censor = FALSE

估計(jì)xx年生存

生存分析中經(jīng)常需要關(guān)注的一個(gè)數(shù)量是生存超過一定數(shù)量(xx)年的概率。

例如,要估算生存到11年的可能性?

  1. ## Call: survfit(formula = Surv(time, status) ~ 1, data = lung)

  2. ##

  3. ## ?time n.risk n.event survival std.err lower 95% CI upper 95% CI

  4. ## ? 365 ? ? 65 ? ? 121 ? ?0.409 ?0.0358 ? ? ? ?0.345 ? ? ? ?0.486

我們發(fā)現(xiàn)本研究中11年生存的機(jī)率是41%。

同時(shí)顯示95%置信區(qū)間的相關(guān)上下限。

xx年生存率和生存曲線

?11年存活率概率為在y軸上的點(diǎn)對應(yīng)于11一年x軸的生存曲線。

Xx年生存率常常被錯(cuò)誤估計(jì)

如果 使用“天真”的估計(jì)會(huì)怎樣?

228名患者中的121名到1年時(shí)死亡,因此:

?

-當(dāng) 忽略42名患者在1年之前受到檢查的事實(shí)時(shí), 會(huì)錯(cuò)誤估計(jì)1個(gè)1個(gè)年生存率。?

?

  • ?正確的估計(jì)生存概率-年為41%。

忽略審查對xx年生存的影響

  • 想象兩個(gè)研究,每個(gè)研究228個(gè)主題。每個(gè)研究中有165人死亡。一個(gè)沒有檢查(橙色線),63個(gè)病人被另一個(gè)(藍(lán)色線)檢查

  • 忽略審查會(huì)導(dǎo)致總體生存概率被高估,因?yàn)楸粚彶榈氖茉囌邇H在部分隨訪時(shí)間內(nèi)提供信息,然后落入風(fēng)險(xiǎn)范圍之外,從而降低了生存的累積概率

?

估計(jì)中位生存時(shí)間

生存分析中經(jīng)常需要關(guān)注的另一個(gè)數(shù)量是平均生存時(shí)間,我們使用中位數(shù)對其進(jìn)行量化。預(yù)計(jì)生存時(shí)間不會(huì)呈正態(tài)分布,因此平均值不是適當(dāng)?shù)目偨Y(jié)。

?

  1. ## Call: survfit(formula = Surv(time, status) ~ 1, data = lung)

  2. ##

  3. ## ? ? ? n ?events ?median 0.95LCL 0.95UCL

  4. ## ? ? 228 ? ? 165 ? ? 310 ? ? 285 ? ? 363

我們看到中位生存時(shí)間為310天。還會(huì)顯示95%置信區(qū)間的上限和下限。

中位生存時(shí)間和生存曲線

中位生存時(shí)間是生存概率為0.50?

中位生存率常常被錯(cuò)誤估計(jì)

?總結(jié)165例死亡患者的中位生存時(shí)間

  1. ## ? median_surv

  2. ## 1 ? ? ? ? 226

  • 當(dāng) 忽略被檢查患者也有助于隨訪的事實(shí)時(shí), 會(huì)得出錯(cuò)誤的估計(jì)中值生存時(shí)間226天。

  • ?正確的中位生存時(shí)間估計(jì)是310天。

忽略審查對中位數(shù)生存率的影響

  • 忽略審查會(huì)造成人為降低的生存曲線,因?yàn)榕懦耸軐彶榛颊哓暙I(xiàn)的隨訪時(shí)間(紫色線)

  • 數(shù)據(jù)的真實(shí)生存曲線以lung藍(lán)色顯示,以進(jìn)行比較

比較各組之間的生存時(shí)間

  • 我們可以使用對數(shù)秩檢驗(yàn)進(jìn)行組間重要性檢驗(yàn)

  • 對數(shù)秩檢驗(yàn)在整個(gè)隨訪時(shí)間內(nèi)平均權(quán)衡觀察結(jié)果,是比較組間生存時(shí)間的最常用方法

  • 根據(jù)研究問題,有些版本可能會(huì)更重視早期或后期的隨訪,可能更合適?

我們使用 函數(shù)獲得對數(shù)秩p值。例如,我們可以根據(jù)lung數(shù)據(jù)中的性別測試是否存在生存時(shí)間差異

  1. ## Call:

  2. ##

  3. ## ? ? ? ? N Observed Expected (O-E)^2/E (O-E)^2/V

  4. ## sex=1 138 ? ? ?112 ? ? 91.6 ? ? ?4.55 ? ? ?10.3

  5. ## sex=2 ?90 ? ? ? 53 ? ? 73.4 ? ? ?5.68 ? ? ?10.3

  6. ##

  7. ## ?Chisq= 10.3 ?on 1 degrees of freedom, p= 0.001

從survdiff對象中提取信息

從 結(jié)果中提取p值?

1 - pchisq(sd$chisq, length(sd$n) - 1)## [1] 0.001311165

?返回格式化的p值

## [1] 0.001

Cox回歸模型

我們可能想量化單個(gè)變量的效應(yīng)大小,或者將多個(gè)變量包括在回歸模型中以說明多個(gè)變量的效應(yīng)。

Cox回歸模型是半?yún)?shù)模型,可用于擬合具有生存結(jié)果的單變量和多變量回歸模型。

?

?

h(t)h(t):危險(xiǎn)或事件發(fā)生的瞬時(shí)速率h0(t)h0(t):基本基準(zhǔn)危險(xiǎn)

該模型的一些關(guān)鍵假設(shè):

  • 非信息審查

  • 比例危險(xiǎn)

注意:也可以使用用于生存結(jié)果的參數(shù)回歸模型,但是本培訓(xùn)將不涉及這些模型。

我們可以使用coxph函數(shù)擬合生存數(shù)據(jù)的回歸模型,該函數(shù)Surv在左側(cè)使用一個(gè)對象,而在右側(cè)具有用于回歸公式的標(biāo)準(zhǔn)語法R。

  1. ## Call:

  2. ##

  3. ## ? ? ? ?coef exp(coef) se(coef) ? ? ?z ? ? ? p

  4. ## sex -0.5310 ? ?0.5880 ? 0.1672 -3.176 0.00149

  5. ##

  6. ## Likelihood ratio test=10.63 ?on 1 df, p=0.001111

  7. ## n= 228, number of events= 165

格式化Cox回歸結(jié)果

?我們可以看到輸出的整潔版本broom

?

或使用

危險(xiǎn)比

  • 來自Cox回歸模型的關(guān)注數(shù)量是危險(xiǎn)比(HR)。HR表示在任何特定時(shí)間點(diǎn)兩組之間的危險(xiǎn)比率。

  • HR被解釋為感興趣事件中那些仍處于事件風(fēng)險(xiǎn)中的事件的瞬時(shí)發(fā)生率。?

  • 如果您有一個(gè)回歸參數(shù)ββ(來自estimate我們的列coxph),則HR =?經(jīng)驗(yàn)值(β)經(jīng)驗(yàn)值?(β)。

  • HR <1表示死亡危險(xiǎn)降低,而HR> 1表示死亡危險(xiǎn)增加。

  • 因此,我們的HR = 0.59意味著在任何給定時(shí)間,女性死亡的人數(shù)大約是男性的0.6倍。

?

第2部分:地標(biāo)分析和時(shí)間相關(guān)協(xié)變量

在第1部分中,我們介紹了使用對數(shù)秩檢驗(yàn)和Cox回歸來檢驗(yàn)感興趣的協(xié)變量與生存結(jié)果之間的關(guān)聯(lián)。

??

示例:腫瘤反應(yīng)

示例:從治療開始就測量總生存期,關(guān)注的是對治療的完全反應(yīng)與生存之間的關(guān)聯(lián)。

  • Anderson等人(JCO,1983)描述了在這種情況下,為什么傳統(tǒng)方法(如對數(shù)秩檢驗(yàn)或Cox回歸)偏向于響應(yīng)者,并提出了劃時(shí)代的方法。

  • 界標(biāo)方法中的零假設(shè)是,從界標(biāo)生存的過程不依賴于界標(biāo)的響應(yīng)狀態(tài)。

Anderson, J., Cain, K., & Gelber, R. (1983). Analysis of survival by tumor response. Journal of Clinical Oncology : Official Journal of the American Society of Clinical Oncology, 1(11), 710-9.

其他例子

癌癥研究中可能尚未關(guān)注的其他一些可能的協(xié)變量包括:

  • 移植失敗

  • 移植物抗宿主病

  • 第二次切除

  • 輔助治療

  • 合規(guī)

  • 不良事件

示例數(shù)據(jù)?

137例骨髓移植患者的數(shù)據(jù)。 變量包括:

  • T1?死亡時(shí)間或最后一次隨訪時(shí)間(天)

  • delta1死亡指標(biāo);1死0活

  • TA?急性移植物抗宿主病的時(shí)間(以天為單位)

  • deltaA急性移植物抗宿主病指標(biāo);1-發(fā)展為急性移植物抗宿主病,0-從未發(fā)展為急性移植物抗宿主病

讓我們加載數(shù)據(jù)以供整個(gè)示例使用

地標(biāo)法

  1. 選擇基線之后的固定時(shí)間作為界標(biāo)時(shí)間。注意:應(yīng)在檢查數(shù)據(jù)之前根據(jù)臨床信息進(jìn)行操作

  2. 那些人群的子集至少跟蹤到里程碑時(shí)間。注意:請務(wù)必在地標(biāo)時(shí)間之前報(bào)告由于關(guān)注或?qū)彶槭录懦奶柎a。

  3. 計(jì)算具有里程碑意義的時(shí)間,并應(yīng)用傳統(tǒng)的對數(shù)秩檢驗(yàn)或Cox回歸

BMT數(shù)據(jù)感興趣的是急性移植物抗宿主?。╝GVHD)和存活之間的關(guān)聯(lián)。但是aGVHD是在移植后進(jìn)行評估的,這是我們的基線,也就是后續(xù)隨訪的開始時(shí)間。

步驟1選擇地標(biāo)時(shí)間

通常,aGVHD發(fā)生在移植后的前90天內(nèi),因此我們使用90天的界標(biāo)。

人們對急性移植物抗宿主?。╝GVHD)與生存之間的關(guān)系感興趣。但是aGVHD是在移植后進(jìn)行評估的,這是我們的基線,也就是后續(xù)隨訪的開始時(shí)間。

第2步:至少跟蹤到里程碑時(shí)間之前的人群的子集

這將我們的樣本量從137減少到122。

  • 所有15位被排除的患者均在90天里程碑之前死亡

人們對急性移植物抗宿主?。╝GVHD)與生存之間的關(guān)系感興趣。但是aGVHD是在移植后進(jìn)行評估的,這是我們的基線,也就是后續(xù)隨訪的開始時(shí)間。

步驟3根據(jù)地標(biāo)計(jì)算隨訪時(shí)間,并應(yīng)用傳統(tǒng)方法。

使用BMT數(shù)據(jù)的Cox回歸界標(biāo)示例

在Cox回歸中, 可以使用中的subset選項(xiàng)coxph來排除那些在標(biāo)志性時(shí)間內(nèi)沒有被隨訪的患者

時(shí)間相關(guān)協(xié)變量

界標(biāo)分析的替代方法是合并時(shí)間相關(guān)的協(xié)變量。這可能更適合

  • 協(xié)變量的值隨時(shí)間變化

  • 沒有明顯的里程碑時(shí)間

時(shí)間相關(guān)協(xié)變量數(shù)據(jù)設(shè)置

對時(shí)間相關(guān)協(xié)變量的分析R需要建立特殊的數(shù)據(jù)集。?

BMT數(shù)據(jù)中沒有ID變量,這是創(chuàng)建特殊數(shù)據(jù)集所必需的,因此請創(chuàng)建一個(gè)名為的變量my_id。

tmerge函數(shù)與event和函數(shù)一起使用tdc可創(chuàng)建特殊數(shù)據(jù)集。

  • tmerge?為每個(gè)患者的不同協(xié)變量值創(chuàng)建一個(gè)具有多個(gè)時(shí)間間隔的長數(shù)據(jù)集

  • event?創(chuàng)建新的事件指示器,以與新創(chuàng)建的時(shí)間間隔一致

  • tdc?創(chuàng)建與時(shí)間相關(guān)的協(xié)變量指標(biāo),以與新創(chuàng)建的時(shí)間間隔一致

時(shí)間相關(guān)協(xié)變量-單例患者

要了解其作用,讓我們看一下前5名患者的數(shù)據(jù)。

  1. ## ? my_id ? T1 delta1 ? TA deltaA

  2. ## 1 ? ? 1 2081 ? ? ?0 ? 67 ? ? ?1

  3. ## 2 ? ? 2 1602 ? ? ?0 1602 ? ? ?0

  4. ## 3 ? ? 3 1496 ? ? ?0 1496 ? ? ?0

  5. ## 4 ? ? 4 1462 ? ? ?0 ? 70 ? ? ?1

  6. ## 5 ? ? 5 1433 ? ? ?0 1433 ? ? ?0

這些相同患者的新數(shù)據(jù)集?

  1. ## ? my_id ? T1 delta1 id tstart tstop death agvhd

  2. ## 1 ? ? 1 2081 ? ? ?0 ?1 ? ? ?0 ? ?67 ? ? 0 ? ? 0

  3. ## 2 ? ? 1 2081 ? ? ?0 ?1 ? ? 67 ?2081 ? ? 0 ? ? 1

  4. ## 3 ? ? 2 1602 ? ? ?0 ?2 ? ? ?0 ?1602 ? ? 0 ? ? 0

  5. ## 4 ? ? 3 1496 ? ? ?0 ?3 ? ? ?0 ?1496 ? ? 0 ? ? 0

  6. ## 5 ? ? 4 1462 ? ? ?0 ?4 ? ? ?0 ? ?70 ? ? 0 ? ? 0

  7. ## 6 ? ? 4 1462 ? ? ?0 ?4 ? ? 70 ?1462 ? ? 0 ? ? 1

  8. ## 7 ? ? 5 1433 ? ? ?0 ?5 ? ? ?0 ?1433 ? ? 0 ? ? 0

時(shí)間相關(guān)協(xié)變量-Cox回歸

現(xiàn)在,我們可以分析這個(gè)時(shí)間依賴性協(xié)照常使用Cox回歸與coxph?

摘要

我們發(fā)現(xiàn),使用標(biāo)志性分析或時(shí)間依賴性協(xié)變量,急性移植物抗宿主病與死亡無顯著相關(guān)性。

通常,人們會(huì)希望使用地標(biāo)分析對單個(gè)協(xié)變量進(jìn)行可視化, 使用帶有時(shí)間相關(guān)協(xié)變量的Cox回歸進(jìn)行單變量和多變量建模。

第3部分:競爭風(fēng)險(xiǎn)

?

?

什么是競爭風(fēng)險(xiǎn)?

當(dāng)對象在事件發(fā)生時(shí)間設(shè)置中發(fā)生多個(gè)可能的事件時(shí)

例子:

  • 復(fù)發(fā)

  • 因疾病死亡

  • 因其他原因死亡

  • 治療反應(yīng)

在任何給定的研究中,所有這些(或其中一些 以及其他)可能都是可能的事件。

所以有什么問題?

事件時(shí)間之間未觀察到的依賴性是導(dǎo)致需要特殊考慮的基本問題。

例如,可以想象復(fù)發(fā)的患者更有可能死亡,因此復(fù)發(fā)時(shí)間和死亡時(shí)間將不是獨(dú)立事件。

競爭風(fēng)險(xiǎn)的背景

存在多種潛在結(jié)果時(shí)的兩種分析方法:

  1. 給定事件的特定于原因的危險(xiǎn):這表示未因其他事件而失敗的事件中事件的每單位時(shí)間的發(fā)生率

  2. 給定事件的累積發(fā)生率:這表示事件每單位時(shí)間的發(fā)生率以及競爭事件的影響

這些方法中的每一種都可能僅闡明數(shù)據(jù)的一個(gè)重要方面,而有可能使其他方面難以理解,因此所選的方法應(yīng)取決于感興趣的問題。

?黑色素瘤數(shù)據(jù)示例

?它包含變量:

  • time?生存時(shí)間以天為單位,可能經(jīng)過審查。

  • status?1例死于黑色素瘤,2例存活,3例因其他原因死亡。

  • sex?1 =男性,0 =女性。

  • age?年歲。

  • year?操作。

  • thickness?腫瘤厚度(毫米)。

  • ulcer?1 =存在,0 =不存在。

黑色素瘤數(shù)據(jù)的累積發(fā)生率

?在競爭風(fēng)險(xiǎn)的背景下估算累積發(fā)生率。

?

  1. ## Estimates and Variances:

  2. ## $est

  3. ## ? ? ? ? ? 1000 ? ? ? 2000 ? ? ? 3000 ? ? ?4000 ? ? ?5000

  4. ## 1 1 0.12745714 0.23013963 0.30962017 0.3387175 0.3387175

  5. ## 1 3 0.03426709 0.05045644 0.05811143 0.1059471 0.1059471

  6. ##

  7. ## $var

  8. ## ? ? ? ? ? ? 1000 ? ? ? ? 2000 ? ? ? ? 3000 ? ? ? ?4000 ? ? ? ?5000

  9. ## 1 1 0.0005481186 0.0009001172 0.0013789328 0.001690760 0.001690760

  10. ## 1 3 0.0001628354 0.0002451319 0.0002998642 0.001040155 0.001040155

繪制累積發(fā)生率-基數(shù)R

生成 默認(rèn)值的基本圖。


  1. plot(ci_fit)

?

繪制累積發(fā)生率?

?

  • ?

比較組之間的累積發(fā)生率

?用于組間測試。

例如,Melanoma根據(jù)ulcer潰瘍的存在與否比較結(jié)果。測試結(jié)果可以在中找到Tests


  1. ci_ulcer[["Tests"]]

  1. ## ? ? ? ?stat ? ? ? ? ? pv df

  2. ## 1 26.120719 3.207240e-07 ?1

  3. ## 3 ?0.158662 6.903913e-01 ?1

按組繪制累積發(fā)生率?

按組繪制累積發(fā)生率-手動(dòng)

請注意,我個(gè)人發(fā)現(xiàn)該ggcompetingrisks功能缺少自定義功能,尤其是與相比ggsurvplot。我通常會(huì)自己做圖,首先創(chuàng)建cuminc擬合結(jié)果的整潔數(shù)據(jù)集,然后再繪制結(jié)果。有關(guān)底層代碼的詳細(xì)信息,請參見此演示文稿的

繪制單個(gè)事件類型?

通常,只有一種類型的事件會(huì)引起人們的興趣,盡管我們?nèi)砸紤]競爭事件。在那種情況下,感興趣的事件可以單獨(dú)繪制。同樣,我首先通過創(chuàng)建cuminc擬合結(jié)果的整潔數(shù)據(jù)集,然后繪制結(jié)果來手動(dòng)執(zhí)行此操作。有關(guān)底層代碼的詳細(xì)信息,請參見此演示文稿的源代碼。

在風(fēng)險(xiǎn)表中添加數(shù)字

您可能想將風(fēng)險(xiǎn)表的數(shù)量添加到累積發(fā)生率圖中,而據(jù)我所知,沒有簡單的方法可以做到這一點(diǎn)。請參閱此演示文稿的源代碼中的一個(gè)示例


  1. ?

競爭風(fēng)險(xiǎn)回歸

兩種方法:

  1. 特定原因風(fēng)險(xiǎn)

    • 當(dāng)前沒有事件的受試者中給定事件類型的瞬時(shí)發(fā)生率

    • 使用Cox回歸估算?

  2. Subdistribution子分布風(fēng)險(xiǎn)

    • 給定類型事件在沒有經(jīng)歷過此類事件的受試者中的瞬時(shí)發(fā)生率

    • 使用Fine-Gray回歸估算?

黑色素瘤數(shù)據(jù)中的競爭風(fēng)險(xiǎn)回歸-子分布風(fēng)險(xiǎn)法Subdistribution

假設(shè)我們有興趣研究年齡和性別對黑色素瘤死亡的影響,而其他原因的死亡則是競爭事件。

?

  • crr?需要指定協(xié)變量作為矩陣

  • 如果 關(guān)注多個(gè)事件,則可以使用failcode選項(xiàng)請求其他事件的結(jié)果,默認(rèn)情況下會(huì)返回failcode = 1



  1. shr_fit

  1. ## convergence: ?TRUE

  2. ## coefficients:

  3. ## ? ? sex ? ? age

  4. ## 0.58840 0.01259

  5. ## standard errors:

  6. ## [1] 0.271800 0.009301

  7. ## two-sided p-values:

  8. ## ?sex ?age

  9. ## 0.03 0.18

在上一個(gè)示例中,sex和和age均被編碼為數(shù)字變量。 如果存在字符變量,則必須使用model.matrix

格式化來自crr的結(jié)果

或當(dāng)前crr不支持的輸出。?

黑色素瘤數(shù)據(jù)中的競爭風(fēng)險(xiǎn)回歸-因果分析

審查所有沒有引起關(guān)注的對象,在這種情況下是由于黑色素瘤死亡,并且照常使用coxph。因此,現(xiàn)在對因其他原因死亡的患者進(jìn)行針對特定原因的風(fēng)險(xiǎn)評估方法以應(yīng)對競爭風(fēng)險(xiǎn)。

?

第4部分:高級主題

?涵蓋的內(nèi)容

  • 生存分析的基礎(chǔ)知識,包括Kaplan-Meier生存函數(shù)和Cox回歸

  • 地標(biāo)分析和時(shí)間相關(guān)協(xié)變量

  • 競爭風(fēng)險(xiǎn)分析的累積發(fā)生率和回歸

還有什么?

可能會(huì)出現(xiàn)很多零碎的東西 :

  1. 評估比例風(fēng)險(xiǎn)假設(shè)

  2. 生存率繪制平滑的生存圖XX

  3. 有條件的生存

評估比例風(fēng)險(xiǎn)

Cox比例風(fēng)險(xiǎn)回歸模型的一個(gè)假設(shè)是,在整個(gè)隨訪過程中,風(fēng)險(xiǎn)在每個(gè)時(shí)間點(diǎn)都是成比例的。我們?nèi)绾螜z查數(shù)據(jù)是否符合此假設(shè)?

使用cox.zph生存包中的功能。結(jié)果有兩點(diǎn):

  1. 每個(gè)協(xié)變量的效果是否隨時(shí)間變化的假設(shè)檢驗(yàn),以及一次所有協(xié)變量的全局檢驗(yàn)。

    • 這是通過證明協(xié)變量和log(time)之間的交互作用來完成的

    • 顯著的p值表示違反了比例風(fēng)險(xiǎn)假設(shè)

  2. Schoenfeld殘差圖

    • 偏離零坡度線的證據(jù)表明違反了比例風(fēng)險(xiǎn)假設(shè)


  1. print(cz)

  1. ## ? ? ? ? ? ?rho chisq ? ? p

  2. ## sex ? ? 0.1236 2.452 0.117

  3. ## age ? ?-0.0275 0.129 0.719

  4. ## GLOBAL ? ? ?NA 2.651 0.266

plot(cz)

平滑的生存圖-生存分位數(shù)

有時(shí)可能想根據(jù)連續(xù)變量來可視化生存估計(jì)。 求 生存數(shù)據(jù)的分位數(shù)。默認(rèn)分位數(shù)是p = 0.5中位生存期。

  • x代表事件

  • o代表審查

  • 該線是根據(jù)年齡的平均存活率的平滑估計(jì)

?

條件生存

有時(shí),在已經(jīng)存活了一段時(shí)間的患者中產(chǎn)生存活率估計(jì)值很有意義。

?

Zabor, E., Gonen, M., Chapman, P., & Panageas, K. (2013). Dynamic prognostication using conditional survival estimates. Cancer, 119(20), 3589-3592.

條件生存估計(jì)

?讓我們將生存期定為6個(gè)月


  1. map_df(

  2. prob_times,

  3. ~conditional_surv_est(

  4. basekm = fit1,

  5. t1 = 182.625,

  6. t2 = .x)

  7. ) %>%

  8. mutate(months = round(prob_times / 30.4)) %>%

  9. select(months, everything()) %>%

  10. kable()

條件生存圖

我們還可以根據(jù)不同的生存時(shí)間長度可視化條件生存數(shù)據(jù)。?

?

所得出的曲線在我們每次進(jìn)行條件調(diào)整時(shí)都有一條生存曲線。在這種情況下,第一條線是總體生存曲線,因?yàn)樗歉鶕?jù)時(shí)間0進(jìn)行調(diào)節(jié)的。

?

?

參考文獻(xiàn)

1.R語言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實(shí)現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實(shí)現(xiàn)

7.在R語言中實(shí)現(xiàn)Logistic邏輯回歸

8.python用線性回歸預(yù)測股票價(jià)格

9.R語言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)

?


R語言中的生存分析Survival analysis晚期肺癌患者4例的評論 (共 條)

分享到微博請遵守國家法律
阿拉尔市| 宝应县| 石泉县| 侯马市| 平果县| 霍山县| 福泉市| 延长县| 辽源市| 阿鲁科尔沁旗| 阿克| 潜江市| 抚顺县| 明水县| 大名县| 宣城市| 乌鲁木齐市| 日喀则市| 大宁县| 三江| 南京市| 乌审旗| 左权县| 新绛县| 北京市| 营口市| 乡宁县| 千阳县| 渭南市| 扎囊县| 亚东县| 五华县| 治县。| 泽库县| 广元市| 天柱县| 甘泉县| 封丘县| 大荔县| 保定市| 砀山县|