Log-rank och Wilcoxon
meny plats: Analysis_Survival_Log-rank och Wilcoxon.
denna funktion tillhandahåller metoder för att jämföra två eller flera överlevnadskurvor där några av observationerna kan censureras och där den totala grupperingen kan stratifieras. Metoderna är icke-parametriska genom att de inte gör antaganden om fördelningarna av överlevnadsberäkningar.
i avsaknad av censur (t. ex. de metoder som presenteras här reduceras till ett Mann-Whitney (två prov Wilcoxon)-test för två grupper av överlevnadstider och ett Kruskal-Wallis-test för mer än två grupper av överlevnadstider. StatsDirect ger en omfattande uppsättning tester för jämförelse av överlevnadsdata som kan censureras (Tarone och Ware, 1977; Kalbfleisch och Prentice, 1980; Cox och Oakes, 1984; Le, 1997).
nollhypotesen som testas här är att risken för död/händelse är densamma i alla grupper.
petos log-rank-test är i allmänhet den mest lämpliga metoden men Prentice-modifierat Wilcoxon-test är känsligare när förhållandet mellan faror är högre vid tidiga överlevnadstider än vid sena (Peto och Peto, 1972; Kalbfleisch och Prentice, 1980). Log-rank-testet liknar Mantel-Haenszel-testet och vissa författare hänvisar till det som Cox-Mantel-testet (Mantel och Haenszel, 1959; Cox, 1972).
Strata
en valfri variabel, strata, låter dig underklassificera de grupper som anges i gruppidentifieringsvariabeln och testa betydelsen av denna underklassificering (Armitage and Berry, 1994; Lawless, 1982; Kalbfleisch och Prentice, 1980).
Wilcoxon weights
StatsDirect ger dig ett val av tre olika viktningsmetoder för det generaliserade Wilcoxon-testet, dessa är Peto-Prentice, Gehan-Breslow och Tarone-Ware. Peto-Prentice-metoden är i allmänhet mer robust än de andra men gehan-statistiken beräknas rutinmässigt av många statistiska mjukvarupaket (Breslow, 1974; Tarone and Ware, 1977; Kalbfleisch och Prentice, 1980; Miller, 1981; Hosmer and Lemeshow 1999). Du bör söka statistisk vägledning om du planerar att använda någon annan viktningsmetod än Peto-Prentice.
Hazard-ratio
ett ungefärligt konfidensintervall för log hazard-ratio beräknas med hjälp av följande uppskattning av standardfel (SE):
– där eij är omfattningen av exponering för risk för dödsfall (ibland kallad förväntade dödsfall) för grupp I av k vid JTH distinkt observerad tid (ibland kallad förväntade dödsfall) för grupp I av k (Armitage och Berry, 1994).
en exakt villkorad maximal sannolikhetsuppskattning av hazard ratio ges valfritt. Den exakta uppskattningen och dess konfidensintervall (Fisher eller mid-P) bör rutinmässigt användas i stället för ovanstående approximation. Exponenterna för Cox-regressionsparametrar är också exakta uppskattningar av riskförhållandet, men observera att de inte är exakta om Breslows metod har använts för att korrigera för band i regressionen. Rådgör med en statistiker om du funderar på att använda Cox regression.
Trendtest
Om du har fler än två grupper beräknar StatsDirect en variant av log-rank-testet för trend. Om du väljer att inte ange gruppresultat tilldelas de som 1,2,3 … n i gruppordning (Armitage och Berry, 1994; laglös, 1982; Kalbfleisch och Prentice, 1980).
teknisk validering
den allmänna teststatistiken beräknas runt en hypergeometrisk fördelning av antalet händelser vid olika händelsetider:
– där vikten wj för log-rank-testet är lika med 1, och wj för det generaliserade Wilcoxon-testet är ni (gehan-Breslow-metoden); för Tarone-ware-metoden WJ är kvadratroten av NI; och för peto-Prentice-metoden är WJ Kaplan-Meier Survivor-funktionen multiplicerad med (ni dividerad med ni +1). eij är förväntan om död i grupp i vid JTH distinkt observerad tid där dj-händelser/dödsfall inträffade. nij är antalet i riskzonen i Grupp I strax före JTH distinkt observerad tid. Teststatistiken för jämlikhet av överlevnad över k-grupperna (populationer samplade) är ungefär chi-kvadrat fördelat på k-1 frihetsgrader. Teststatistiken för monoton trend är ungefär chi-kvadrat fördelat på 1 frihetsgrad. c är en vektor av poäng som antingen definieras av användaren eller tilldelas som 1 till k.
variansen beräknas med den metod som Peto (1977) refererar till som ”exakt”.
den stratifierade teststatistiken uttrycks som (Kalbfleisch och Prentice, 1980):
– där statistiken som definieras ovan beräknas inom strata summeras sedan över strata före den generaliserade inversen och transponera matrisoperationerna.
exempel
Från Armitage och Berry (1994, s. 479).
Test arbetsbok (överlevnad kalkylblad: Scengrupp, tid, Censor).
följande data representerar överlevnaden i dagar sedan inträde i studien av patienter med diffust histiocytiskt lymfom. Två olika grupper av patienter, de med stadium III och de med stadium IV-sjukdom, jämförs.
steg 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*
steg 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*
* = censurerade data (patienten fortfarande lever eller dog av en orelaterad orsak)
för att analysera dessa data i StatsDirect måste du först förbereda dem i tre arbetsbokskolumner som visas nedan:
Stage group | Time | Censor |
1 | 6 | 1 |
1 | 19 | 1 |
1 | 32 | 1 |
1 | 42 | 1 |
1 | 42 | 1 |
1 | 43 | 0 |
1 | 94 | 1 |
1 | 126 | 0 |
1 | 169 | 0 |
1 | 207 | 1 |
1 | 211 | 0 |
1 | 227 | 0 |
1 | 253 | 1 |
1 | 255 | 0 |
1 | 270 | 0 |
1 | 310 | 0 |
1 | 316 | 0 |
1 | 335 | 0 |
1 | 346 | 0 |
2 | 4 | 1 |
2 | 6 | 1 |
2 | 10 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 13 | 1 |
2 | 17 | 1 |
2 | 20 | 1 |
2 | 20 | 1 |
2 | 21 | 1 |
2 | 22 | 1 |
2 | 24 | 1 |
2 | 24 | 1 |
2 | 29 | 1 |
2 | 30 | 1 |
2 | 30 | 1 |
2 | 31 | 1 |
2 | 33 | 1 |
2 | 34 | 1 |
2 | 35 | 1 |
2 | 39 | 1 |
2 | 40 | 1 |
2 | 41 | 0 |
2 | 43 | 0 |
2 | 45 | 1 |
2 | 46 | 1 |
2 | 50 | 1 |
2 | 56 | 1 |
2 | 61 | 0 |
2 | 61 | 0 |
2 | 63 | 1 |
2 | 68 | 1 |
2 | 82 | 1 |
2 | 85 | 1 |
2 | 88 | 1 |
2 | 89 | 1 |
2 | 90 | 1 |
2 | 93 | 1 |
2 | 104 | 1 |
2 | 110 | 1 |
2 | 134 | 1 |
2 | 137 | 1 |
2 | 160 | 0 |
2 | 169 | 1 |
2 | 171 | 1 |
2 | 173 | 1 |
2 | 175 | 1 |
2 | 184 | 1 |
2 | 201 | 1 |
2 | 222 | 1 |
2 | 235 | 0 |
2 | 247 | 0 |
2 | 260 | 0 |
2 | 284 | 0 |
2 | 290 | 0 |
2 | 291 | 0 |
2 | 302 | 0 |
2 | 304 | 0 |
2 | 341 | 0 |
2 | 345 | 0 |
Alternatively, open the test workbook använda funktionen Arkiv Öppna på Arkiv-menyn. Välj sedan Log-rank och Wilcoxon från avsnittet överlevnadsanalys i analysmenyn. Välj kolumnen märkt” Scengrupp ”när du blir ombedd för gruppidentifieraren, välj” tid ”när du blir ombedd för tider och” censur ” för censur. Klicka på Avbryt-knappen när du blir frågad om strata.
För detta exempel:
Logrank och Wilcoxon test
Log Rank (Peto):
för Grupp 1 (Stage group = 1)
observerade dödsfall = 8
exponeringsgrad för risk för dödsfall = 16.687031
relativ hastighet = 0.479414
For group 2 (Stage group = 2)
Observed deaths = 46
Extent of exposure to risk of death = 37.312969
Relative rate = 1.232815
test statistics:
-8.687031, 8.687031
variance-covariance matrix:
0.088912 | -11.24706 |
-11.24706 | 11.24706 |
Chi-square for equivalence of death rates = 6.70971 P = 0.0096
Hazard Ratio, (approximate 95% confidence interval)
Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.692607)
villkorliga maximala sannolikhetsbedömningar:
Hazard Ratio = 0,381485
exakt Fisher 95% konfidensintervall = 0,154582 till 0,822411
exakt Fisher ensidig P = 0,0051, tvåsidig P = 0,0104
exakt mid-P 95% konfidensintervall = 0,167398 till 0.783785
exakt Mid-p ensidig p = 0.0034, tvåsidig p = 0.0068
generaliserad Wilcoxon (peto-Prentice):
teststatistik:
-5.19836, 5.19836
varians-kovariansmatris:
0.201506 | -4.962627 | -4.962627 | 4.962627 |
Chi-kvadrat för ekvivalens av dödsfall = 5, 44529 P = 0, 0196
både log-rank och Wilcoxon-tester visade en statistiskt signifikant skillnad i överlevnadsupplevelse mellan steg 3 och steg 4-patienter i denna studie.
stratifierat exempel
Från Peto et al. (1977):
Group | Trial Time | Censorship | Stratum |
1 | 8 | 1 | 1 |
1 | 8 | 1 | 2 |
2 | 13 | 1 | 1 |
2 | 18 | 1 | 1 |
2 | 23 | 1 | 1 |
1 | 52 | 1 | 1 |
1 | 63 | 1 | 1 |
1 | 63 | 1 | 1 |
2 | 70 | 1 | 2 |
2 | 70 | 1 | 2 |
2 | 180 | 1 | 2 |
2 | 195 | 1 | 2 |
2 | 210 | 1 | 2 |
1 | 220 | 1 | 2 |
1 | 365 | 0 | 2 |
2 | 632 | 1 | 2 |
2 | 700 | 1 | 2 |
1 | 852 | 0 | 2 |
2 | 1296 | 1 | 2 |
1 | 1296 | 0 | 2 |
1 | 1328 | 0 | 2 |
1 | 1460 | 0 | 2 |
1 | 1976 | 0 | 2 |
2 | 1990 | 0 | 2 |
2 | 2240 | 0 | 2 |
Censorship 1 = death event
Censorship 0 = lost to follow-up
Stratum 1 = renal impairment
Stratum 2 = no renal impairment
The table above shows you how to prepare data for a stratifierat log-rank-test i StatsDirect. Detta exempel bearbetas i den andra av två klassiska papper av Richard Peto och kollegor (Peto et al., 1977, 1976). Observera att StatsDirect använder de mer exakta variansformlerna som nämns i avsnittet statistiska anteckningar i slutet av Peto et al. (1977).