Log-rank i Wilcoxon
lokalizacja Menu: Analysis_Survival_Log-rank i Wilcoxon.
funkcja ta dostarcza metod porównywania dwóch lub więcej krzywych przeżycia, gdzie niektóre obserwacje mogą być ocenzurowane i gdzie ogólna grupa może być stratyfikowana. Metody są nieparametryczne, ponieważ nie przyjmują założeń dotyczących rozkładów szacunków przeżycia.
W przypadku braku cenzury (np. loss to follow up, alive at end of study) metody przedstawione tutaj redukują się do testu Manna-Whitneya (dwie próbki Wilcoxona) dla dwóch grup czasu przeżycia i testu Kruskala-Wallisa dla więcej niż dwóch grup czasu przeżycia. StatsDirect daje kompleksowy zestaw testów dla porównania danych przeżycia, które mogą być ocenzurowane (Tarone and Ware, 1977; Kalbfleisch and Prentice, 1980; Cox and Oakes, 1984; Le, 1997).
hipoteza zerowa testowane tutaj jest to, że ryzyko śmierci/zdarzenia jest taka sama we wszystkich grupach.
test peto log-rank jest na ogół najbardziej odpowiednią metodą, ale zmodyfikowany przez Prentice ’ a test Wilcoxona jest bardziej wrażliwy, gdy stosunek zagrożeń jest wyższy we wczesnym okresie przeżycia niż w późnym (Peto and Peto, 1972; Kalbfleisch and Prentice, 1980). Test log-rank jest podobny do testu Mantela-Haenszela i niektórzy autorzy określają go jako test Coxa-Mantela (Mantel and Haenszel, 1959; Cox, 1972).
warstwy
opcjonalna zmienna, warstwy, pozwala na subklasyfikację grup określonych w zmiennej identyfikacyjnej grupy i przetestowanie znaczenia tej subklasyfikacji (Armitage and Berry, 1994; Lawless, 1982; Kalbfleisch and Prentice, 1980).
wagi Wilcoxona
StatsDirect daje możliwość wyboru trzech różnych metod ważenia dla uogólnionego testu Wilcoxona, są to Peto-Prentice, Gehan-Breslow i Tarone-Ware. Metoda Peto-Prentice jest na ogół bardziej solidna niż inne, ale Statystyka Gehana jest rutynowo obliczana przez wiele pakietów oprogramowania statystycznego (Breslow, 1974; Tarone and Ware, 1977; Kalbfleisch and Prentice, 1980; Miller, 1981; Hosmer and Lemeshow 1999). Powinieneś szukać wskazówek statystycznych, jeśli planujesz użyć innej metody ważenia niż Peto-Prentice.
współczynniki ryzyka
przybliżony przedział ufności dla log współczynnik ryzyka oblicza się przy użyciu następującego oszacowania błędu standardowego (SE):
– gdzie eij jest zakresem narażenia na ryzyko śmierci (czasami nazywane oczekiwanymi zgonami) dla grupy i k w JTH distinct observed time (czasami nazywane oczekiwanymi zgonami) dla grupy i k (Armitage and Berry, 1994).
Opcjonalnie podaje się dokładne warunkowe oszacowanie maksymalnego prawdopodobieństwa współczynnika ryzyka. Dokładne oszacowanie i jego przedział ufności (Fisher lub mid-P) powinny być rutynowo stosowane zamiast powyższego przybliżenia. Wykładniki parametrów regresji Coxa są również dokładnymi estymatorami współczynnika ryzyka, ale należy pamiętać, że nie są one dokładne, jeśli metoda Breslowa została użyta do skorygowania powiązań w regresji. Jeśli rozważasz zastosowanie regresji Coxa, skonsultuj się ze statystykiem.
Test trendu
Jeśli masz więcej niż dwie grupy, StatsDirect obliczy wariant testu log-rank dla trendu. Jeśli zdecydujesz się nie wprowadzać wyników grupowych, zostaną one przydzielone jako 1,2,3 … n w kolejności grupowej (Armitage i Berry, 1994; Lawless, 1982; Kalbfleisch i Prentice, 1980).
Walidacja techniczna
ogólna statystyka testu jest obliczana wokół hipergeometrycznego rozkładu liczby zdarzeń w różnych czasach zdarzeń:
– gdzie waga WJ dla testu log-rank jest równa 1, A WJ dla uogólnionego testu Wilcoxona jest ni (metoda Gehana-Breslowa); dla metody Tarone-Ware jest pierwiastek kwadratowy z ni; a dla metody peto-Prentice ’ a WJ jest funkcją Kaplana-Meiera pomnożoną przez (ni podzielone przez Ni +1). eij to oczekiwanie śmierci w grupie i w JTH distinct observed time, w którym miały miejsce zdarzenia/zgony dj. nij jest liczbą zagrożoną w grupie i tuż przed JTH odrębnym obserwowanym czasem. Statystyka testu na równość przeżycia w grupach k (populacje próbkowane) jest w przybliżeniu chi-kwadrat rozmieszczone na K-1 stopni swobody. Statystyka testu dla monotonnego trendu wynosi w przybliżeniu chi-kwadrat rozłożony na 1 stopniu swobody. c jest wektorem wyników, które są zdefiniowane przez użytkownika lub przydzielone jako 1 do K.
wariancja jest szacowana za pomocą metody, którą Peto (1977) określa jako „dokładną”.
stratyfikowana statystyka testu jest wyrażona jako (Kalbfleisch and Prentice, 1980):
– gdzie statystyki zdefiniowane powyżej są obliczane w warstwach, a następnie sumowane w warstwach przed uogólnionymi operacjami macierzy odwrotnej i transpozycyjnej.
przykład
z Armitage and Berry (1994, s. 479).
skoroszyt testowy (arkusz Survivalowy: Grupa sceniczna, czas, Cenzor).
poniższe dane przedstawiają czas przeżycia w dniach od włączenia do badania pacjentów z rozlanym chłoniakiem histiocytarnym. Porównuje się dwie różne grupy pacjentów, chorych w stadium III i chorych w stadium IV.
Etap 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*
etap 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*
* = ocenzurowane dane (pacjent wciąż żyje lub zmarł z niezwiązanej przyczyny)
aby przeanalizować te dane w StatsDirect, musisz najpierw przygotować je w trzech kolumnach skoroszytu, jak pokazano poniżej:
Stage group | Time | Censor |
1 | 6 | 1 |
1 | 19 | 1 |
1 | 32 | 1 |
1 | 42 | 1 |
1 | 42 | 1 |
1 | 43 | 0 |
1 | 94 | 1 |
1 | 126 | 0 |
1 | 169 | 0 |
1 | 207 | 1 |
1 | 211 | 0 |
1 | 227 | 0 |
1 | 253 | 1 |
1 | 255 | 0 |
1 | 270 | 0 |
1 | 310 | 0 |
1 | 316 | 0 |
1 | 335 | 0 |
1 | 346 | 0 |
2 | 4 | 1 |
2 | 6 | 1 |
2 | 10 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 13 | 1 |
2 | 17 | 1 |
2 | 20 | 1 |
2 | 20 | 1 |
2 | 21 | 1 |
2 | 22 | 1 |
2 | 24 | 1 |
2 | 24 | 1 |
2 | 29 | 1 |
2 | 30 | 1 |
2 | 30 | 1 |
2 | 31 | 1 |
2 | 33 | 1 |
2 | 34 | 1 |
2 | 35 | 1 |
2 | 39 | 1 |
2 | 40 | 1 |
2 | 41 | 0 |
2 | 43 | 0 |
2 | 45 | 1 |
2 | 46 | 1 |
2 | 50 | 1 |
2 | 56 | 1 |
2 | 61 | 0 |
2 | 61 | 0 |
2 | 63 | 1 |
2 | 68 | 1 |
2 | 82 | 1 |
2 | 85 | 1 |
2 | 88 | 1 |
2 | 89 | 1 |
2 | 90 | 1 |
2 | 93 | 1 |
2 | 104 | 1 |
2 | 110 | 1 |
2 | 134 | 1 |
2 | 137 | 1 |
2 | 160 | 0 |
2 | 169 | 1 |
2 | 171 | 1 |
2 | 173 | 1 |
2 | 175 | 1 |
2 | 184 | 1 |
2 | 201 | 1 |
2 | 222 | 1 |
2 | 235 | 0 |
2 | 247 | 0 |
2 | 260 | 0 |
2 | 284 | 0 |
2 | 290 | 0 |
2 | 291 | 0 |
2 | 302 | 0 |
2 | 304 | 0 |
2 | 341 | 0 |
2 | 345 | 0 |
Alternatively, open the test workbook korzystanie z funkcji file open w menu file. Następnie wybierz Log-rank i Wilcoxon z sekcji Analiza przeżycia w menu Analiza. Wybierz kolumnę oznaczoną „Grupa etapu”, gdy zapytasz o identyfikator grupy, wybierz” czas”, gdy zapytasz o czasy i” Cenzuruj”, aby uzyskać cenzurę. Kliknij przycisk Anuluj, gdy zapytasz o warstwy.
dla tego przykładu:
testy Logrank i Wilcoxon
Log Rank (Peto):
dla grupy 1 (grupa etapowa = 1)
obserwowane zgony = 8
zakres narażenia na ryzyko zgonu = 16.687031
względna stopa = 0.479414
For group 2 (Stage group = 2)
Observed deaths = 46
Extent of exposure to risk of death = 37.312969
Relative rate = 1.232815
test statistics:
-8.687031, 8.687031
variance-covariance matrix:
0.088912 | -11.24706 |
-11.24706 | 11.24706 |
Chi-square for equivalence of death rates = 6.70971 P = 0.0096
Hazard Ratio, (approximate 95% confidence interval)
Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.
warunkowe szacunki maksymalnego prawdopodobieństwa:
współczynnik ryzyka = 0,381485
dokładny Fisher 95% przedział ufności = 0,154582 do 0,822411
dokładny Fisher jednostronny P = 0,0051, dwustronny P = 0,0104
dokładny średni P 95% przedział ufności = 0,167398 do 0.783785
dokładny Mid-p jednostronny P = 0.0034, dwustronny p = 0.0068
uogólniony Wilcoxon (peto-Prentice):
statystyki testu:
-5.19836, 5.19836
macierz wariancji-kowariancji:
0.201506 | -4.962627 |
-4.962627 | 4.962627 |
chi-kwadrat równoważności współczynników zgonów = 5, 44529 P = 0, 0196
zarówno testy log-rank, jak i Wilcoxon wykazały statystycznie istotną różnicę w doświadczeniu przeżycia pomiędzy pacjentami w stadium 3 I etapie 4 w tym badaniu.
przykład stratyfikacji
z Peto et al. (1977):
Group | Trial Time | Censorship | Stratum |
1 | 8 | 1 | 1 |
1 | 8 | 1 | 2 |
2 | 13 | 1 | 1 |
2 | 18 | 1 | 1 |
2 | 23 | 1 | 1 |
1 | 52 | 1 | 1 |
1 | 63 | 1 | 1 |
1 | 63 | 1 | 1 |
2 | 70 | 1 | 2 |
2 | 70 | 1 | 2 |
2 | 180 | 1 | 2 |
2 | 195 | 1 | 2 |
2 | 210 | 1 | 2 |
1 | 220 | 1 | 2 |
1 | 365 | 0 | 2 |
2 | 632 | 1 | 2 |
2 | 700 | 1 | 2 |
1 | 852 | 0 | 2 |
2 | 1296 | 1 | 2 |
1 | 1296 | 0 | 2 |
1 | 1328 | 0 | 2 |
1 | 1460 | 0 | 2 |
1 | 1976 | 0 | 2 |
2 | 1990 | 0 | 2 |
2 | 2240 | 0 | 2 |
Censorship 1 = death event
Censorship 0 = lost to follow-up
Stratum 1 = renal impairment
Stratum 2 = no renal impairment
The table above shows you how to prepare data for a stratyfikowany test log-rank w StatsDirect. Przykład ten został opracowany w drugim z dwóch klasycznych prac Richarda Peto i współpracowników (Peto et al., 1977, 1976). Należy pamiętać, że StatsDirect wykorzystuje dokładniejsze wzory wariancji wymienione w sekcji uwag statystycznych na końcu Peto et al. (1977).