Articles

Log-rank en Wilcoxon

Menulocatie: Analysis_Survival_Log-rank en Wilcoxon.

Deze functie biedt methoden voor het vergelijken van twee of meer survival curves waar sommige waarnemingen gecensureerd kunnen worden en waar de totale groep gestratificeerd kan worden. De methoden zijn niet-parametrisch in die zin dat ze geen veronderstellingen maken over de verdeling van overlevingsschattingen.

bij afwezigheid van censuur (bijv. loss to follow up, levend aan het einde van de studie) de hier gepresenteerde methoden verminderen tot een Mann-Whitney (twee monster Wilcoxon) test voor twee groepen van overlevingstijden en een Kruskal-Wallis test voor meer dan twee groepen van overlevingstijden. StatsDirect geeft een uitgebreide reeks tests voor de vergelijking van overlevingsdata die gecensureerd kunnen worden (Tarone and Ware, 1977; Kalbfleisch and Prentice, 1980; Cox and Oakes, 1984; Le, 1997).

de nulhypothese die hier wordt getest, is dat het risico op overlijden / voorval in alle groepen hetzelfde is.de log-rank test van Peto is over het algemeen de meest geschikte methode, maar de test met Wilcoxon in Prentice is gevoeliger wanneer de verhouding risico ‘ s op vroege overlevingstijden hoger is dan op late overlevingstijden (Peto en Peto, 1972; Kalbfleisch en Prentice, 1980). De log-rank test is vergelijkbaar met de Mantel-Haenszel test en sommige auteurs verwijzen ernaar als de Cox-Mantel test (Mantel and Haenszel, 1959; Cox, 1972).

Strata

met een optionele variabele, strata, kunt u de groepen die zijn gespecificeerd in de variabele groepsidentificatie subclassificeren en de significantie van deze subclassificatie testen (Armitage and Berry, 1994; Lawless, 1982; Kalbfleisch and Prentice, 1980).

Wilcoxon gewichten

StatsDirect geeft u een keuze uit drie verschillende wegingsmethoden voor de gegeneraliseerde Wilcoxon-test, Dit zijn Peto-Prentice, Gehan-Breslow en Tarone-Ware. De Peto-Prentice-methode is over het algemeen robuuster dan de andere, maar de Gehan-statistiek wordt routinematig berekend door veel statistische softwarepakketten (Breslow, 1974; Tarone and Ware, 1977; Kalbfleisch and Prentice, 1980; Miller, 1981; Hosmer and Lemeshow 1999). U dient statistische begeleiding te zoeken als u van plan bent om een andere wegingsmethode dan Peto-Prentice te gebruiken.

Hazard-ratio ‘ s

een geschatte betrouwbaarheidsinterval voor de log hazard-ratio wordt berekend aan de hand van de volgende schatting van de standaardfout (SE):

– waarbij eij de mate is van blootstelling aan overlijdensrisico (soms verwachte sterfgevallen genoemd) voor groep I van k op het j-de verschillende waargenomen tijdstip (soms verwachte sterfgevallen genoemd) voor groep I van k (Armitage and Berry, 1994).

een exacte voorwaardelijke schatting van de maximale waarschijnlijkheid van de hazard ratio wordt optioneel gegeven. De exacte schatting en het betrouwbaarheidsinterval (Fisher of mid-P) moeten routinematig worden gebruikt in plaats van de bovenstaande benadering. De exponenten van Cox-regressieparameters zijn ook exacte schatters van de hazard ratio, maar houd er rekening mee dat ze niet exact zijn als de methode van Breslow is gebruikt om banden in de regressie te corrigeren. Neem contact op met een statisticus als u overweegt Cox regressie te gebruiken.

Trendtest

Als u meer dan twee groepen hebt, berekent StatsDirect een variant van de log-rank test voor trend. Als u ervoor kiest om geen groepsscores in te voeren, worden deze toegewezen als 1,2,3 … n in groepsorde (Armitage en Berry, 1994; Lawless, 1982; Kalbfleisch en Prentice, 1980).

Technische validatie

De algemene test statistiek wordt berekend rond een hypergeometric verdeling van het aantal evenementen op verschillende tijden:

– waar het gewicht wj voor de log-rank test is gelijk aan 1, en wj voor de gegeneraliseerde Wilcoxon-test is ni (Gehan-Breslow-methode); voor de Tarone-Ware methode wj is de wortel van ni; en voor het Peto-Prentice methode wj is de Kaplan-Meier survivor functie vermenigvuldigd met (ni gedeeld door ni +1). eij is de verwachting van de dood in groep i op het JTH verschillende waargenomen tijdstip waar dj gebeurtenissen / sterfgevallen plaatsvonden. nij is het risicogetal in groep i net voor de JDE waargenomen tijd. De teststatistiek voor de gelijkheid van overleving over de k-groepen (bemonsterde populaties) is ongeveer chi-kwadraat verdeeld over K-1 vrijheidsgraden. De teststatistiek voor monotone trend is ongeveer chi-kwadraat verdeeld over 1 graad van vrijheid. c is een vector van scores die ofwel door de gebruiker zijn gedefinieerd of als 1 Aan k zijn toegewezen.

variantie wordt geschat volgens de methode die Peto (1977) “exact”noemt.

de gestratificeerde teststatistiek wordt uitgedrukt als (Kalbfleisch and Prentice, 1980):

– waarbij de hierboven gedefinieerde statistieken worden berekend binnen strata en vervolgens worden opgeteld over strata voorafgaand aan de veralgemeende inverse en transponeer matrixbewerkingen.

voorbeeld

uit Armitage and Berry (1994, p. 479).

Testwerkmap (Overlevingswerkblad: fase-Groep, tijd, censuur).

de volgende gegevens geven de overleving weer in dagen sinds deelname aan de studie van patiënten met diffuus histiocytair lymfoom. Twee verschillende groepen patiënten, die met stadium III en die met stadium IV ziekte, worden vergeleken.

Fase 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*

Fase 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*

* = gecensureerde gegevens (patiënt nog in leven of overleden zijn van een andere oorzaak)

Om het analyseren van deze gegevens in StatsDirect moet u eerst bereiden ze in drie werkmap kolommen zoals hieronder weergegeven:

Stage group Time Censor
1 6 1
1 19 1
1 32 1
1 42 1
1 42 1
1 43 0
1 94 1
1 126 0
1 169 0
1 207 1
1 211 0
1 227 0
1 253 1
1 255 0
1 270 0
1 310 0
1 316 0
1 335 0
1 346 0
2 4 1
2 6 1
2 10 1
2 11 1
2 11 1
2 11 1
2 13 1
2 17 1
2 20 1
2 20 1
2 21 1
2 22 1
2 24 1
2 24 1
2 29 1
2 30 1
2 30 1
2 31 1
2 33 1
2 34 1
2 35 1
2 39 1
2 40 1
2 41 0
2 43 0
2 45 1
2 46 1
2 50 1
2 56 1
2 61 0
2 61 0
2 63 1
2 68 1
2 82 1
2 85 1
2 88 1
2 89 1
2 90 1
2 93 1
2 104 1
2 110 1
2 134 1
2 137 1
2 160 0
2 169 1
2 171 1
2 173 1
2 175 1
2 184 1
2 201 1
2 222 1
2 235 0
2 247 0
2 260 0
2 284 0
2 290 0
2 291 0
2 302 0
2 304 0
2 341 0
2 345 0

Alternatively, open the test workbook met behulp van de file open functie van het menu bestand. Selecteer vervolgens Log-rank en Wilcoxon in het gedeelte Survival Analysis van het menu analyse. Selecteer de kolom gemarkeerd “fase groep” wanneer gevraagd om de groep identifier, selecteer “tijd” wanneer gevraagd om tijden en” Censor ” voor censuur. Klik op de knop Annuleren wanneer u gevraagd wordt naar strata.

in dit voorbeeld:

Logrank en Wilcoxon testen

Log Rank (Peto):

voor groep 1 (Stadium groep = 1)

waargenomen sterfgevallen = 8

mate van blootstelling aan risico op overlijden = 16.687031

relatieve incidentie = 0.479414

For group 2 (Stage group = 2)

Observed deaths = 46

Extent of exposure to risk of death = 37.312969

Relative rate = 1.232815

test statistics:

-8.687031, 8.687031

variance-covariance matrix:

0.088912 -11.24706
-11.24706 11.24706

Chi-square for equivalence of death rates = 6.70971 P = 0.0096

Hazard Ratio, (approximate 95% confidence interval)

Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.692607)

Conditional maximum likelihood schattingen:

Hazard Ratio = 0.381485

Exacte Fisher 95% – betrouwbaarheidsinterval = 0.154582 te 0.822411

Exacte Fisher eenzijdige P = 0.0051, tweezijdige P = 0.0104

Exacte midden-P 95% – betrouwbaarheidsinterval = 0.167398 te 0.783785

Exacte midden-P eenzijdige P = 0.0034, tweezijdige P = 0.0068

Gegeneraliseerde Wilcoxon (Peto-Prentice):

test statistieken:

-5.19836, 5.19836

de variantie-covariantie matrix:

0.201506 -4.962627
-4.962627 4.962627

Chi-kwadraat voor equivalentie van sterftecijfers = 5.44529 P = 0,0196

beide log-rank-en Wilcoxon-testen toonden een statistisch significant verschil in overlevingservaring aan tussen patiënten in Fase 3 en fase 4 in deze studie.

gestratificeerd voorbeeld

van Peto et al. (1977):

Group Trial Time Censorship Stratum
1 8 1 1
1 8 1 2
2 13 1 1
2 18 1 1
2 23 1 1
1 52 1 1
1 63 1 1
1 63 1 1
2 70 1 2
2 70 1 2
2 180 1 2
2 195 1 2
2 210 1 2
1 220 1 2
1 365 0 2
2 632 1 2
2 700 1 2
1 852 0 2
2 1296 1 2
1 1296 0 2
1 1328 0 2
1 1460 0 2
1 1976 0 2
2 1990 0 2
2 2240 0 2

Censorship 1 = death event

Censorship 0 = lost to follow-up

Stratum 1 = renal impairment

Stratum 2 = no renal impairment

The table above shows you how to prepare data for a gestratificeerde log-rank test in StatsDirect. Dit voorbeeld wordt uitgewerkt in de tweede van twee klassieke papers door Richard Peto en collega ‘ s (Peto et al., 1977, 1976). Houd er rekening mee dat StatsDirect de nauwkeurigere variantieformules gebruikt die worden vermeld in de sectie statistische opmerkingen aan het einde van Peto et al. (1977).