Articles

Log-rank e Wilcoxon

Posizione del menu: Analysis_Survival_Log-rank e Wilcoxon.

Questa funzione fornisce metodi per confrontare due o più curve di sopravvivenza in cui alcune delle osservazioni possono essere censurate e in cui il raggruppamento complessivo può essere stratificato. I metodi sono non parametrici in quanto non fanno ipotesi sulle distribuzioni delle stime di sopravvivenza.

In assenza di censura (ad es. perdita di follow-up, vivo alla fine dello studio) i metodi presentati qui riducono a un test di Mann-Whitney (due campioni di Wilcoxon) per due gruppi di tempi di sopravvivenza e un test di Kruskal-Wallis per più di due gruppi di tempi di sopravvivenza. StatsDirect fornisce una serie completa di test per il confronto dei dati di sopravvivenza che possono essere censurati (Tarone e Ware, 1977; Kalbfleisch e Prentice, 1980; Cox e Oakes, 1984; Le, 1997).

L’ipotesi nulla testata qui è che il rischio di morte/evento è lo stesso in tutti i gruppi.

Il test di log-rank di Peto è generalmente il metodo più appropriato, ma il test di Wilcoxon modificato da Prentice è più sensibile quando il rapporto dei pericoli è più alto nei tempi di sopravvivenza precoce rispetto a quelli tardivi (Peto e Peto, 1972; Kalbfleisch e Prentice, 1980). Il test log-rank è simile al test Mantel-Haenszel e alcuni autori si riferiscono ad esso come test Cox-Mantel (Mantel e Haenszel, 1959; Cox, 1972).

Strata

Una variabile opzionale, strata, consente di sottoclassificare i gruppi specificati nella variabile group identifier e di testare il significato di questa sottoclassificazione (Armitage and Berry, 1994; Lawless, 1982; Kalbfleisch and Prentice, 1980).

Pesi Wilcoxon

StatsDirect offre una scelta di tre diversi metodi di ponderazione per il test Wilcoxon generalizzato, questi sono Peto-Prentice, Gehan-Breslow e Tarone-Ware. Il metodo Peto-Prentice è generalmente più robusto degli altri, ma la statistica di Gehan è calcolata abitualmente da molti pacchetti software statistici (Breslow, 1974; Tarone e Ware, 1977; Kalbfleisch e Prentice, 1980; Miller, 1981; Hosmer e Lemeshow 1999). Si dovrebbe cercare una guida statistica se si prevede di utilizzare qualsiasi metodo di ponderazione diverso da Peto-Prentice.

Hazard-ratio

Un intervallo di confidenza approssimativo per il log hazard-ratio è calcolato utilizzando la seguente stima di standard error (SE):

– dove eij è l’entità dell’esposizione al rischio di morte (a volte chiamato morti attese) per il gruppo i di k al jth tempo osservato distinto (a volte chiamato morti attese) per il gruppo i di k (Armitage e Berry, 1994).

È facoltativamente fornita una stima esatta della massima verosimiglianza condizionale dell’hazard ratio. La stima esatta e il suo intervallo di confidenza (Fisher o mid-P) dovrebbero essere usati di routine in preferenza all’approssimazione di cui sopra. Gli esponenti dei parametri di regressione di Cox sono anche stimatori esatti dell’hazard ratio, ma si noti che non sono esatti se il metodo di Breslow è stato utilizzato per correggere i legami nella regressione. Si prega di consultare uno statistico se si sta pensando di utilizzare la regressione di Cox.

Trend test

Se si dispone di più di due gruppi, StatsDirect calcolerà una variante del test di log-rank per trend. Se si sceglie di non inserire i punteggi di gruppo, vengono assegnati come 1,2,3 … n in ordine di gruppo (Armitage e Berry, 1994; Lawless, 1982; Kalbfleisch e Prentice, 1980).

la validazione Tecnica

La statistica test è calcolato intorno a una distribuzione ipergeometrica del numero di eventi all’evento distinto volte:

– dove il peso wj per il log-rank test è uguale a 1, e wj per generalizzate (test di Wilcoxon test è ni (Gehan-Breslow metodo); per il Tarone-Ware metodo wj è la radice quadrata di ni; e per il Peto-Prentice metodo wj è il metodo di Kaplan-Meier sopravvissuto funzione moltiplicata per (ni diviso da ni +1). eij è l’aspettativa di morte nel gruppo i al momento jth distinto osservato in cui si sono verificati eventi/morti dj. nij è il numero a rischio nel gruppo i poco prima del jth tempo osservato distinto. La statistica di test per l’uguaglianza di sopravvivenza tra i gruppi k (popolazioni campionate) è approssimativamente chi-quadrato distribuito su k-1 gradi di libertà. La statistica di prova per la tendenza monotona è approssimativamente chi-quadrato distribuito su 1 grado di libertà. c è un vettore di punteggi che sono definiti dall’utente o assegnati come 1 a k.

La varianza è stimata dal metodo a cui Peto (1977) si riferisce come “esatto”.

La statistica del test stratificato è espressa come (Kalbfleisch e Prentice, 1980):

– dove le statistiche sopra definite sono calcolate all’interno di strati quindi sommate tra strati prima delle operazioni generalizzate inverse e transpose matrix.

Esempio

Da Armitage e Berry (1994, p. 479).

Cartella di lavoro di test (foglio di lavoro di sopravvivenza: gruppo di fase, Tempo, Censore).

I seguenti dati rappresentano la sopravvivenza in giorni dall’ingresso nello studio su pazienti con linfoma istiocitico diffuso. Vengono confrontati due diversi gruppi di pazienti, quelli con stadio III e quelli con malattia di stadio IV.

Stadio 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*fase 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*

* = dati censurati (paziente è ancora vivo o è morto di un donatore causa)

Per analizzare questi dati in StatsDirect è necessario innanzitutto preparare il loro cartella di lavoro in tre colonne, come illustrato di seguito:

Stage group Time Censor
1 6 1
1 19 1
1 32 1
1 42 1
1 42 1
1 43 0
1 94 1
1 126 0
1 169 0
1 207 1
1 211 0
1 227 0
1 253 1
1 255 0
1 270 0
1 310 0
1 316 0
1 335 0
1 346 0
2 4 1
2 6 1
2 10 1
2 11 1
2 11 1
2 11 1
2 13 1
2 17 1
2 20 1
2 20 1
2 21 1
2 22 1
2 24 1
2 24 1
2 29 1
2 30 1
2 30 1
2 31 1
2 33 1
2 34 1
2 35 1
2 39 1
2 40 1
2 41 0
2 43 0
2 45 1
2 46 1
2 50 1
2 56 1
2 61 0
2 61 0
2 63 1
2 68 1
2 82 1
2 85 1
2 88 1
2 89 1
2 90 1
2 93 1
2 104 1
2 110 1
2 134 1
2 137 1
2 160 0
2 169 1
2 171 1
2 173 1
2 175 1
2 184 1
2 201 1
2 222 1
2 235 0
2 247 0
2 260 0
2 284 0
2 290 0
2 291 0
2 302 0
2 304 0
2 341 0
2 345 0

Alternatively, open the test workbook utilizzando la funzione apri file del menu file. Quindi selezionare Log-rank e Wilcoxon dalla sezione Analisi sopravvivenza del menu analisi. Selezionare la colonna contrassegnata con “Stage group” quando viene richiesto l’identificatore del gruppo, selezionare “Time” quando viene richiesto times e “Censor” per la censura. Fare clic sul pulsante Annulla quando viene chiesto su strata.

Per questo esempio:

Logrank e Wilcoxon test

Log Rank (Peto):

Per il gruppo 1 (Stage group = 1)

Morti osservate = 8

Estensione dell’esposizione al rischio di morte = 16.687031

Tasso relativo = 0.479414

For group 2 (Stage group = 2)

Observed deaths = 46

Extent of exposure to risk of death = 37.312969

Relative rate = 1.232815

test statistics:

-8.687031, 8.687031

variance-covariance matrix:

0.088912 -11.24706
-11.24706 11.24706

Chi-square for equivalence of death rates = 6.70971 P = 0.0096

Hazard Ratio, (approximate 95% confidence interval)

Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.692607)

Condizionale stime di massima verosimiglianza:

il Rapporto di rischio = 0.381485

Esatto di Fisher 95% intervallo di confidenza = 0.154582 per 0.822411

Esatto di Fisher unilaterale P = 0.0051, due lati P = 0.0104

Esattamente la metà di P 95% intervallo di confidenza = 0.167398 per 0.783785

Esattamente la metà di P unilaterale, P = 0,0034, due lati P = 0.0068

Generalizzata test di Wilcoxon (Peto-Prentice):

prova statistiche:

-5.19836, 5.19836

matrice di varianza-covarianza:

0.201506 -4.962627
-4.962627 4.962627

Chi-quadrato per equivalenza dei tassi di mortalità = 5,44529 P = 0,0196

Entrambi i test log-rank e Wilcoxon hanno dimostrato in questo studio una differenza statisticamente significativa nell’esperienza di sopravvivenza tra pazienti di stadio 3 e stadio 4.

Esempio stratificato

Da Peto et al. (1977):

Group Trial Time Censorship Stratum
1 8 1 1
1 8 1 2
2 13 1 1
2 18 1 1
2 23 1 1
1 52 1 1
1 63 1 1
1 63 1 1
2 70 1 2
2 70 1 2
2 180 1 2
2 195 1 2
2 210 1 2
1 220 1 2
1 365 0 2
2 632 1 2
2 700 1 2
1 852 0 2
2 1296 1 2
1 1296 0 2
1 1328 0 2
1 1460 0 2
1 1976 0 2
2 1990 0 2
2 2240 0 2

Censorship 1 = death event

Censorship 0 = lost to follow-up

Stratum 1 = renal impairment

Stratum 2 = no renal impairment

The table above shows you how to prepare data for a test di log-rank stratificato in StatsDirect. Questo esempio è elaborato nel secondo dei due documenti classici di Richard Peto e colleghi (Peto et al., 1977, 1976). Si prega di notare che StatsDirect utilizza le formule di varianza più accurate menzionate nella sezione statistical notes alla fine di Peto et al. (1977).