拓端tecdat|R語(yǔ)言使用限制平均生存時(shí)間RMST比較兩條生存曲線分析肝硬化患者
原文鏈接:http://tecdat.cn/?p=23869
原文出處:拓端數(shù)據(jù)部落公眾號(hào)
1 引言
在比較性的縱向臨床研究中,主要終點(diǎn)往往是發(fā)生特定臨床事件的時(shí)間,如死亡、心衰住院、腫瘤進(jìn)展等。風(fēng)險(xiǎn)比例估計(jì)值幾乎被常規(guī)用于量化治療差異。然而,當(dāng)基礎(chǔ)模型假設(shè)(即比例危害假設(shè))被違反時(shí),這種基于模型的組間總結(jié)的臨床意義可能相當(dāng)難以解釋,而且很難保證模型的建立在經(jīng)驗(yàn)上的正確。例如,擬合度檢驗(yàn)的非顯著性結(jié)果并不一定意味著風(fēng)險(xiǎn)比例假設(shè)是 "正確的"。基于限制性平均生存時(shí)間(RMST)的組間總結(jié)指標(biāo)是風(fēng)險(xiǎn)比例或其他基于模型的措施的有用替代方法。本文說(shuō)明了如何使用該包中的函數(shù)來(lái)比較兩組限制平均生存時(shí)間。
2 樣本數(shù)據(jù)
在這個(gè)文章中,我們使用了梅奧診所進(jìn)行的原發(fā)性膽汁性肝硬化(pbc)研究中的部分?jǐn)?shù)據(jù),該研究包括在R語(yǔ)言的生存包中。
生存包中的原始數(shù)據(jù)由418名患者的數(shù)據(jù)組成,其中包括參加了隨機(jī)臨床試驗(yàn)的患者和沒(méi)有參加的患者。在下面的說(shuō)明中,我們只使用了312個(gè)參加了隨機(jī)試驗(yàn)的病例(158個(gè)病例在Dpenicillamine組,154個(gè)病例在安慰劑組)。從原始數(shù)據(jù)文件中選擇子集。?

這里,時(shí)間是指從登記到死亡或最后已知活著的年數(shù),狀態(tài)是事件的指標(biāo)(1:死亡,0:審查),臂膀是治療分配指標(biāo)(1:Dpenicillamin,0:安慰劑)。下面是每個(gè)實(shí)驗(yàn)組的死亡時(shí)間的卡普蘭-梅爾(KM)估計(jì)。?

3 限制平均生存時(shí)間(RMST)和限制平均損失時(shí)間(RMTL
RMST被定義為生存函數(shù)曲線下的面積,直到一個(gè)時(shí)間τ(< ∞)。

其中S(t)是所關(guān)注的時(shí)間-事件變量的生存函數(shù)。對(duì)RMST的解釋是:"當(dāng)我們對(duì)患者進(jìn)行τ的隨訪時(shí),患者平均會(huì)存活μτ",這是對(duì)刪減的生存數(shù)據(jù)的相當(dāng)直接和有臨床意義的總結(jié)。如果沒(méi)有刪減的觀察值,我們可以使用平均生存時(shí)間

而不是μτ。對(duì)μτ的一個(gè)自然估計(jì)是

其中S?(t)是S(t)的KM估計(jì)。?μτ的標(biāo)準(zhǔn)誤差也是用分析法計(jì)算的;詳細(xì)的公式在[3]中給出。請(qǐng)注意,即使在重度刪減的情況下,μτ也是可以估計(jì)的。另一方面,盡管中位生存時(shí)間S-1(0.5)也是生存時(shí)間分布的一個(gè)穩(wěn)健總結(jié),但由于嚴(yán)重刪減或罕見(jiàn)事件,當(dāng)KM曲線沒(méi)有達(dá)到0.5時(shí),它變得不可估計(jì)。
RMTL被定義為截止到某一時(shí)間τ的生存函數(shù)曲線 "上方 "的面積。

在下圖中,粉紅色和橙色的區(qū)域分別是D-青霉胺組的RMST和RMTL估計(jì)值,當(dāng)τ為10年時(shí)。結(jié)果顯示,在10年的隨訪中,D-青霉胺組的平均生存時(shí)間為7.28年。換句話說(shuō),在10年的隨訪中,接受D-青霉胺治療的患者平均減少2.72年。

3.1 未經(jīng)調(diào)整的分析及其實(shí)施
讓?duì)苔樱?)和μτ(0)分別表示治療組1和0的RMST?,F(xiàn)在,我們用RMST或RMTL來(lái)比較這兩條生存曲線。具體來(lái)說(shuō),我們考慮用以下三種措施來(lái)進(jìn)行組間對(duì)比。
1. RMST的差異

2. RMST的比值

3. RMTL的比率

這些估計(jì)是通過(guò)簡(jiǎn)單地用它們的經(jīng)驗(yàn)對(duì)應(yīng)(即分別為μτ(1)和μτ(0))來(lái)取代μτ(1)和μτ(0))。對(duì)于比率度量的推斷,我們使用delta方法來(lái)計(jì)算標(biāo)準(zhǔn)誤差。具體來(lái)說(shuō),我們考慮log{μ?τ(1)}和log{μ?τ(0)},并計(jì)算log-RMST的標(biāo)準(zhǔn)誤差。然后,我們計(jì)算RMST的對(duì)數(shù)比率的置信區(qū)間,并將其轉(zhuǎn)換回原始比率尺度。下面展示了如何實(shí)現(xiàn)這些分析。
?
第一個(gè)參數(shù)(time)是時(shí)間到事件的向量變量。第二個(gè)參數(shù)(status)也是一個(gè)向量變量,其長(zhǎng)度與時(shí)間相同,每個(gè)元素取1(如果有事件)或0(如果沒(méi)有事件)。第三個(gè)參數(shù)(arm)是一個(gè)向量變量,表示每個(gè)受試者的指定實(shí)驗(yàn);這個(gè)向量的元素取1(如果積極實(shí)驗(yàn)組)或0(如果控制組)。第四個(gè)參數(shù)(tau)是一個(gè)標(biāo)量值,用于指定RMST計(jì)算中的截?cái)鄷r(shí)間點(diǎn)τ。請(qǐng)注意,τ需要小于兩組中每組的最大觀察時(shí)間的最小值(我們稱其為最大τ)。
盡管程序代碼允許用戶選擇一個(gè)比默認(rèn)τ大的τ(如果它小于最大的τ),但我們總是確認(rèn),在每組指定的τ下,風(fēng)險(xiǎn)集的規(guī)模足夠大,來(lái)確保KM估計(jì)的穩(wěn)定性。下面是指定τ=10(年)時(shí)的pbc例子的輸出。rmst2函數(shù)返回每組的RMST和RMTL以及上述組間對(duì)比測(cè)量的結(jié)果。

在本例中,RMST的差異(輸出中 "組間對(duì)比 "部分的第一行)為-0.137年。該點(diǎn)估計(jì)表明,在對(duì)病人進(jìn)行10年的跟蹤調(diào)查時(shí),接受積極治療的病人比安慰劑組的病人平均生存時(shí)間短0.137年。雖然沒(méi)有觀察到統(tǒng)計(jì)學(xué)意義(P=0.738),但0.95置信區(qū)間(-0.665至0.939)在0附近相對(duì)緊密,表明RMST的差異最多為+/-1年??梢陨梢粋€(gè)圖。下圖是在運(yùn)行上述未經(jīng)調(diào)整的分析后生成的。?

3.2 調(diào)整后的分析和應(yīng)用
在大多數(shù)隨機(jī)臨床試驗(yàn)中,調(diào)整后的分析通常包括在計(jì)劃分析中的一項(xiàng)。原因之一是對(duì)重要的預(yù)后因素進(jìn)行調(diào)整可以提高檢測(cè)組間差異的能力。另一個(gè)原因是我們有時(shí)會(huì)觀察到一些基準(zhǔn)預(yù)后因素的分布不平衡,即使隨機(jī)化保證了兩組的平均可比性。本文實(shí)現(xiàn)了Tian等人[4]提出的ANCOVA類型的調(diào)整分析,此外還有上一節(jié)中提出的未經(jīng)調(diào)整的分析。設(shè)Y為限制性平均生存時(shí)間,設(shè)Z為治療指標(biāo)。同時(shí),讓X表示一個(gè)q維的基準(zhǔn)協(xié)變量向量。田氏方法考慮以下回歸模型

其中g(shù)(-)是一個(gè)給定的平滑且嚴(yán)格增加的鏈接函數(shù),(α, β, γ0 )是一個(gè)(q + 2)維的未知參數(shù)向量。在Tian等人[4]之前,Andersen等人[5]也研究了這個(gè)回歸模型,并提出了一個(gè)未知模型參數(shù)的推斷程序,使用偽值技術(shù)來(lái)處理刪減的觀測(cè)值。與Andersen的方法[5, 6, 7]相比,Tian的方法[4]利用反概率刪減加權(quán)技術(shù)來(lái)處理刪減的觀測(cè)值。如下圖所示,對(duì)于實(shí)現(xiàn)Tian的RMST的調(diào)整分析,唯一的區(qū)別是用戶是否向函數(shù)傳遞協(xié)變量數(shù)據(jù)。下面是一個(gè)執(zhí)行調(diào)整后分析的示例代碼。
其中covariates是基準(zhǔn)特征數(shù)據(jù)的向量/矩陣的參數(shù),x。為了說(shuō)明問(wèn)題,讓我們?cè)囋囈韵氯齻€(gè)基準(zhǔn)變量,在pbc數(shù)據(jù)中,作為調(diào)整的協(xié)變量。?

rmst2函數(shù)將數(shù)據(jù)擬合到三個(gè)對(duì)比度量(即RMST的差異、RMST的比率和RMTL的比率)中的每個(gè)模型。對(duì)于差異度量,上述模型中的鏈接函數(shù)g(-)是鏈接。對(duì)于比率指標(biāo),采用的是對(duì)數(shù)鏈接。具體來(lái)說(shuō),通過(guò)這個(gè)pbc例子,我們現(xiàn)在試圖將數(shù)據(jù)擬合到以下回歸模型中。
1. RMST的差異

2. RMST的比值

3. RMTL的比率

下面是rmst2對(duì)調(diào)整后的分析所返回的輸出。

輸出的第一塊是調(diào)整后的實(shí)驗(yàn)效果的總結(jié)。隨后,對(duì)三個(gè)模型中的每一個(gè)都進(jìn)行了總結(jié)。
4 結(jié)論
風(fēng)險(xiǎn)比的問(wèn)題在其他地方已經(jīng)討論過(guò)了,也提出了許多替代方法,但風(fēng)險(xiǎn)比的方法仍然被常規(guī)使用。受限的平均生存時(shí)間是一個(gè)穩(wěn)健的、臨床上可解釋的生存時(shí)間分布的總結(jié)方法。與中位生存時(shí)間不同,即使在嚴(yán)重的刪減情況下,它也是可以估計(jì)的。關(guān)于限制性平均生存時(shí)間,有相當(dāng)多的方法學(xué)研究可以替代風(fēng)險(xiǎn)比方法。然而,這些方法在實(shí)踐中似乎很少被使用。缺乏用戶友好的、有明確例子的程序?qū)⑹且粋€(gè)新的替代方法在實(shí)踐中使用的主要障礙。我們希望這個(gè)文章有助于臨床研究人員嘗試超越舒適區(qū)--風(fēng)險(xiǎn)比。
參考文獻(xiàn)
[1] Hernan, M. A. ′ (2010). The hazards of hazard ratios. Epidemiology (Cambridge, Mass) 21, 13–15.
[2] Uno, H., Claggett, B., Tian, L., Inoue, E., Gallo, P., Miyata, T., Schrag, D., Takeuchi, M., Uyama, Y., Zhao, L., Skali, H., Solomon, S., Jacobus, S., Hughes, M., Packer, M. & Wei, L.-J. (2014). Moving beyond the hazard ratio in quantifying the between-group difference in survival Analysis. Journal of clinical oncology : official journal of the American Society of Clinical Oncology 32, 2380–2385.
[3] Miller, R. G. (1981). Survival Analysis. Wiley.

最受歡迎的見(jiàn)解
1.R語(yǔ)言繪制生存曲線估計(jì)|生存分析|如何R作生存曲線圖
2.R語(yǔ)言生存分析可視化分析
3.R語(yǔ)言如何在生存分析與Cox回歸中計(jì)算IDI,NRI指標(biāo)
4.r語(yǔ)言中使用Bioconductor 分析芯片數(shù)據(jù)
5.R語(yǔ)言生存分析數(shù)據(jù)分析可視化案例
6.r語(yǔ)言ggplot2誤差棒圖快速指南
7.R 語(yǔ)言繪制功能富集泡泡圖
8.R語(yǔ)言如何找到患者數(shù)據(jù)中具有差異的指標(biāo)?(PLS—DA分析)
9.R語(yǔ)言中的生存分析Survival Analysis晚期肺癌患者4例