Articles

Log-rank i Wilcoxon

lokalizacja Menu: Analysis_Survival_Log-rank i Wilcoxon.

funkcja ta dostarcza metod porównywania dwóch lub więcej krzywych przeżycia, gdzie niektóre obserwacje mogą być ocenzurowane i gdzie ogólna grupa może być stratyfikowana. Metody są nieparametryczne, ponieważ nie przyjmują założeń dotyczących rozkładów szacunków przeżycia.

W przypadku braku cenzury (np. loss to follow up, alive at end of study) metody przedstawione tutaj redukują się do testu Manna-Whitneya (dwie próbki Wilcoxona) dla dwóch grup czasu przeżycia i testu Kruskala-Wallisa dla więcej niż dwóch grup czasu przeżycia. StatsDirect daje kompleksowy zestaw testów dla porównania danych przeżycia, które mogą być ocenzurowane (Tarone and Ware, 1977; Kalbfleisch and Prentice, 1980; Cox and Oakes, 1984; Le, 1997).

hipoteza zerowa testowane tutaj jest to, że ryzyko śmierci/zdarzenia jest taka sama we wszystkich grupach.

test peto log-rank jest na ogół najbardziej odpowiednią metodą, ale zmodyfikowany przez Prentice ’ a test Wilcoxona jest bardziej wrażliwy, gdy stosunek zagrożeń jest wyższy we wczesnym okresie przeżycia niż w późnym (Peto and Peto, 1972; Kalbfleisch and Prentice, 1980). Test log-rank jest podobny do testu Mantela-Haenszela i niektórzy autorzy określają go jako test Coxa-Mantela (Mantel and Haenszel, 1959; Cox, 1972).

warstwy

opcjonalna zmienna, warstwy, pozwala na subklasyfikację grup określonych w zmiennej identyfikacyjnej grupy i przetestowanie znaczenia tej subklasyfikacji (Armitage and Berry, 1994; Lawless, 1982; Kalbfleisch and Prentice, 1980).

wagi Wilcoxona

StatsDirect daje możliwość wyboru trzech różnych metod ważenia dla uogólnionego testu Wilcoxona, są to Peto-Prentice, Gehan-Breslow i Tarone-Ware. Metoda Peto-Prentice jest na ogół bardziej solidna niż inne, ale Statystyka Gehana jest rutynowo obliczana przez wiele pakietów oprogramowania statystycznego (Breslow, 1974; Tarone and Ware, 1977; Kalbfleisch and Prentice, 1980; Miller, 1981; Hosmer and Lemeshow 1999). Powinieneś szukać wskazówek statystycznych, jeśli planujesz użyć innej metody ważenia niż Peto-Prentice.

współczynniki ryzyka

przybliżony przedział ufności dla log współczynnik ryzyka oblicza się przy użyciu następującego oszacowania błędu standardowego (SE):

– gdzie eij jest zakresem narażenia na ryzyko śmierci (czasami nazywane oczekiwanymi zgonami) dla grupy i k w JTH distinct observed time (czasami nazywane oczekiwanymi zgonami) dla grupy i k (Armitage and Berry, 1994).

Opcjonalnie podaje się dokładne warunkowe oszacowanie maksymalnego prawdopodobieństwa współczynnika ryzyka. Dokładne oszacowanie i jego przedział ufności (Fisher lub mid-P) powinny być rutynowo stosowane zamiast powyższego przybliżenia. Wykładniki parametrów regresji Coxa są również dokładnymi estymatorami współczynnika ryzyka, ale należy pamiętać, że nie są one dokładne, jeśli metoda Breslowa została użyta do skorygowania powiązań w regresji. Jeśli rozważasz zastosowanie regresji Coxa, skonsultuj się ze statystykiem.

Test trendu

Jeśli masz więcej niż dwie grupy, StatsDirect obliczy wariant testu log-rank dla trendu. Jeśli zdecydujesz się nie wprowadzać wyników grupowych, zostaną one przydzielone jako 1,2,3 … n w kolejności grupowej (Armitage i Berry, 1994; Lawless, 1982; Kalbfleisch i Prentice, 1980).

Walidacja techniczna

ogólna statystyka testu jest obliczana wokół hipergeometrycznego rozkładu liczby zdarzeń w różnych czasach zdarzeń:

– gdzie waga WJ dla testu log-rank jest równa 1, A WJ dla uogólnionego testu Wilcoxona jest ni (metoda Gehana-Breslowa); dla metody Tarone-Ware jest pierwiastek kwadratowy z ni; a dla metody peto-Prentice ’ a WJ jest funkcją Kaplana-Meiera pomnożoną przez (ni podzielone przez Ni +1). eij to oczekiwanie śmierci w grupie i w JTH distinct observed time, w którym miały miejsce zdarzenia/zgony dj. nij jest liczbą zagrożoną w grupie i tuż przed JTH odrębnym obserwowanym czasem. Statystyka testu na równość przeżycia w grupach k (populacje próbkowane) jest w przybliżeniu chi-kwadrat rozmieszczone na K-1 stopni swobody. Statystyka testu dla monotonnego trendu wynosi w przybliżeniu chi-kwadrat rozłożony na 1 stopniu swobody. c jest wektorem wyników, które są zdefiniowane przez użytkownika lub przydzielone jako 1 do K.

wariancja jest szacowana za pomocą metody, którą Peto (1977) określa jako „dokładną”.

stratyfikowana statystyka testu jest wyrażona jako (Kalbfleisch and Prentice, 1980):

– gdzie statystyki zdefiniowane powyżej są obliczane w warstwach, a następnie sumowane w warstwach przed uogólnionymi operacjami macierzy odwrotnej i transpozycyjnej.

przykład

z Armitage and Berry (1994, s. 479).

skoroszyt testowy (arkusz Survivalowy: Grupa sceniczna, czas, Cenzor).

poniższe dane przedstawiają czas przeżycia w dniach od włączenia do badania pacjentów z rozlanym chłoniakiem histiocytarnym. Porównuje się dwie różne grupy pacjentów, chorych w stadium III i chorych w stadium IV.

Etap 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*

etap 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*

* = ocenzurowane dane (pacjent wciąż żyje lub zmarł z niezwiązanej przyczyny)

aby przeanalizować te dane w StatsDirect, musisz najpierw przygotować je w trzech kolumnach skoroszytu, jak pokazano poniżej:

Stage group Time Censor
1 6 1
1 19 1
1 32 1
1 42 1
1 42 1
1 43 0
1 94 1
1 126 0
1 169 0
1 207 1
1 211 0
1 227 0
1 253 1
1 255 0
1 270 0
1 310 0
1 316 0
1 335 0
1 346 0
2 4 1
2 6 1
2 10 1
2 11 1
2 11 1
2 11 1
2 13 1
2 17 1
2 20 1
2 20 1
2 21 1
2 22 1
2 24 1
2 24 1
2 29 1
2 30 1
2 30 1
2 31 1
2 33 1
2 34 1
2 35 1
2 39 1
2 40 1
2 41 0
2 43 0
2 45 1
2 46 1
2 50 1
2 56 1
2 61 0
2 61 0
2 63 1
2 68 1
2 82 1
2 85 1
2 88 1
2 89 1
2 90 1
2 93 1
2 104 1
2 110 1
2 134 1
2 137 1
2 160 0
2 169 1
2 171 1
2 173 1
2 175 1
2 184 1
2 201 1
2 222 1
2 235 0
2 247 0
2 260 0
2 284 0
2 290 0
2 291 0
2 302 0
2 304 0
2 341 0
2 345 0

Alternatively, open the test workbook korzystanie z funkcji file open w menu file. Następnie wybierz Log-rank i Wilcoxon z sekcji Analiza przeżycia w menu Analiza. Wybierz kolumnę oznaczoną „Grupa etapu”, gdy zapytasz o identyfikator grupy, wybierz” czas”, gdy zapytasz o czasy i” Cenzuruj”, aby uzyskać cenzurę. Kliknij przycisk Anuluj, gdy zapytasz o warstwy.

dla tego przykładu:

testy Logrank i Wilcoxon

Log Rank (Peto):

dla grupy 1 (grupa etapowa = 1)

obserwowane zgony = 8

zakres narażenia na ryzyko zgonu = 16.687031

względna stopa = 0.479414

For group 2 (Stage group = 2)

Observed deaths = 46

Extent of exposure to risk of death = 37.312969

Relative rate = 1.232815

test statistics:

-8.687031, 8.687031

variance-covariance matrix:

0.088912 -11.24706
-11.24706 11.24706

Chi-square for equivalence of death rates = 6.70971 P = 0.0096

Hazard Ratio, (approximate 95% confidence interval)

Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.

warunkowe szacunki maksymalnego prawdopodobieństwa:

współczynnik ryzyka = 0,381485

dokładny Fisher 95% przedział ufności = 0,154582 do 0,822411

dokładny Fisher jednostronny P = 0,0051, dwustronny P = 0,0104

dokładny średni P 95% przedział ufności = 0,167398 do 0.783785

dokładny Mid-p jednostronny P = 0.0034, dwustronny p = 0.0068

uogólniony Wilcoxon (peto-Prentice):

statystyki testu:

-5.19836, 5.19836

macierz wariancji-kowariancji:

0.201506 -4.962627
-4.962627 4.962627

chi-kwadrat równoważności współczynników zgonów = 5, 44529 P = 0, 0196

zarówno testy log-rank, jak i Wilcoxon wykazały statystycznie istotną różnicę w doświadczeniu przeżycia pomiędzy pacjentami w stadium 3 I etapie 4 w tym badaniu.

przykład stratyfikacji

z Peto et al. (1977):

Group Trial Time Censorship Stratum
1 8 1 1
1 8 1 2
2 13 1 1
2 18 1 1
2 23 1 1
1 52 1 1
1 63 1 1
1 63 1 1
2 70 1 2
2 70 1 2
2 180 1 2
2 195 1 2
2 210 1 2
1 220 1 2
1 365 0 2
2 632 1 2
2 700 1 2
1 852 0 2
2 1296 1 2
1 1296 0 2
1 1328 0 2
1 1460 0 2
1 1976 0 2
2 1990 0 2
2 2240 0 2

Censorship 1 = death event

Censorship 0 = lost to follow-up

Stratum 1 = renal impairment

Stratum 2 = no renal impairment

The table above shows you how to prepare data for a stratyfikowany test log-rank w StatsDirect. Przykład ten został opracowany w drugim z dwóch klasycznych prac Richarda Peto i współpracowników (Peto et al., 1977, 1976). Należy pamiętać, że StatsDirect wykorzystuje dokładniejsze wzory wariancji wymienione w sekcji uwag statystycznych na końcu Peto et al. (1977).