Rango Logarítmico y Wilcoxon
Ubicación del menú: Analysis_Survival_Log-rank y Wilcoxon.
Esta función proporciona métodos para comparar dos o más curvas de supervivencia donde algunas de las observaciones pueden ser censuradas y donde la agrupación general puede ser estratificada. Los métodos no son paramétricos, ya que no hacen suposiciones sobre la distribución de las estimaciones de supervivencia.
En ausencia de censura (p. ej. pérdida de seguimiento, vivo al final del estudio) los métodos presentados aquí se reducen a una prueba de Mann-Whitney (dos muestras de Wilcoxon) para dos grupos de tiempos de supervivencia y una prueba de Kruskal-Wallis para más de dos grupos de tiempos de supervivencia. StatsDirect ofrece un conjunto completo de pruebas para la comparación de datos de supervivencia que pueden ser censurados (Tarone y Ware, 1977; Kalbfleisch y Prentice, 1980; Cox y Oakes, 1984; Le, 1997).
La hipótesis nula probada aquí es que el riesgo de muerte/evento es el mismo en todos los grupos.
La prueba de rango logarítmico de Peto es generalmente el método más apropiado, pero la prueba de Wilcoxon modificada de Prentice es más sensible cuando la proporción de riesgos es mayor en los tiempos de supervivencia temprana que en los tardíos (Peto y Peto, 1972; Kalbfleisch y Prentice, 1980). La prueba de rango logarítmico es similar a la prueba de Mantel-Haenszel y algunos autores se refieren a ella como la prueba de Cox-Mantel (Mantel y Haenszel, 1959; Cox, 1972).
Strata
Una variable opcional, strata, le permite subclasificar los grupos especificados en la variable identificador de grupo y probar la significación de esta subclasificación (Armitage y Berry, 1994; Lawless, 1982; Kalbfleisch y Prentice, 1980).
Pesos Wilcoxon
StatsDirect le ofrece una selección de tres métodos de ponderación diferentes para la prueba generalizada de Wilcoxon, estos son Peto-Prentice, Gehan-Breslow y Tarone-Ware. El método Peto-Prentice es generalmente más robusto que los demás, pero la estadística de Gehan se calcula rutinariamente por muchos paquetes de software estadístico (Breslow, 1974; Tarone y Ware, 1977; Kalbfleisch y Prentice, 1980; Miller, 1981; Hosmer y Lemeshow, 1999). Debe buscar orientación estadística si planea utilizar cualquier método de ponderación que no sea Peto-Prentice.
Cocientes de riesgo
Se calcula un intervalo de confianza aproximado para la relación de riesgo log utilizando la siguiente estimación de error estándar (SE):
– donde eij es el grado de exposición al riesgo de muerte (a veces llamado muertes esperadas) para el grupo i de k en el j-ésimo momento observado distinto (a veces llamado muertes esperadas) para el grupo i de k (Armitage y Berry, 1994).
Se proporciona opcionalmente una estimación de máxima verosimilitud condicional exacta de la razón de riesgos. La estimación exacta y su intervalo de confianza (Fisher o P medio) se deben utilizar de forma rutinaria en lugar de la aproximación anterior. Los exponentes de los parámetros de regresión de Cox también son estimadores exactos de la razón de riesgos, pero tenga en cuenta que no son exactos si se ha utilizado el método de Breslow para corregir los lazos en la regresión. Consulte con un estadístico si está considerando usar regresión de Cox.
Prueba de tendencia
Si tiene más de dos grupos, StatsDirect calculará una variante de la prueba de rango logarítmico para tendencia. Si elige no ingresar las puntuaciones de grupo, se asignan como 1,2,3 … n en orden de grupo (Armitage y Berry, 1994; Lawless, 1982; Kalbfleisch y Prentice, 1980).
Validación técnica
El estadístico general de la prueba se calcula en torno a una distribución hipergeométrica del número de eventos en distintos momentos de eventos:
– donde el peso wj para la prueba de rango logarítmico es igual a 1, y wj para la prueba generalizada de Wilcoxon es ni (método Gehan-Breslow); para el método Tarone-Ware wj es la raíz cuadrada de ni; y para el método Peto-Prentice wj es la función sobreviviente de Kaplan-Meier multiplicada por (ni dividido por ni +1). eij es la expectativa de muerte en el grupo i en el j-ésimo tiempo observado distinto donde ocurrieron los eventos/muertes de dj. nij es el número en riesgo en el grupo i justo antes del j-ésimo tiempo observado distinto. El estadístico de prueba para la igualdad de supervivencia entre los grupos k (poblaciones muestreadas) es aproximadamente chi-cuadrado distribuido en grados de libertad k-1. La estadística de prueba para la tendencia monótona es aproximadamente chi-cuadrado distribuido en 1 grado de libertad. c es un vector de puntuaciones definidas por el usuario o asignadas de 1 a k.
La varianza se estima por el método al que Peto (1977) se refiere como «exacta».
El estadístico de prueba estratificado se expresa como (Kalbfleisch y Prentice, 1980):
– donde las estadísticas definidas anteriormente se calculan dentro de los estratos y luego se suman entre los estratos antes de las operaciones de matriz inversa y de transposición generalizadas.
Ejemplo
De Armitage y Berry (1994, p. 479).
Libro de trabajo de prueba (Hoja de trabajo de supervivencia: Grupo de Escenario, Tiempo, Censor).
Los siguientes datos representan la supervivencia en días desde el inicio del ensayo de pacientes con linfoma histiocítico difuso. Se comparan dos grupos diferentes de pacientes, aquellos con enfermedad en estadio III y aquellos con enfermedad en estadio IV.
Etapa 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*
Etapa 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*
* = datos censurados (paciente vivo o muerto por una causa no relacionada)
Para analizar estos datos en StatsDirect, primero debe prepararlos en tres columnas de libro de trabajo, como se muestra a continuación:
Stage group | Time | Censor |
1 | 6 | 1 |
1 | 19 | 1 |
1 | 32 | 1 |
1 | 42 | 1 |
1 | 42 | 1 |
1 | 43 | 0 |
1 | 94 | 1 |
1 | 126 | 0 |
1 | 169 | 0 |
1 | 207 | 1 |
1 | 211 | 0 |
1 | 227 | 0 |
1 | 253 | 1 |
1 | 255 | 0 |
1 | 270 | 0 |
1 | 310 | 0 |
1 | 316 | 0 |
1 | 335 | 0 |
1 | 346 | 0 |
2 | 4 | 1 |
2 | 6 | 1 |
2 | 10 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 13 | 1 |
2 | 17 | 1 |
2 | 20 | 1 |
2 | 20 | 1 |
2 | 21 | 1 |
2 | 22 | 1 |
2 | 24 | 1 |
2 | 24 | 1 |
2 | 29 | 1 |
2 | 30 | 1 |
2 | 30 | 1 |
2 | 31 | 1 |
2 | 33 | 1 |
2 | 34 | 1 |
2 | 35 | 1 |
2 | 39 | 1 |
2 | 40 | 1 |
2 | 41 | 0 |
2 | 43 | 0 |
2 | 45 | 1 |
2 | 46 | 1 |
2 | 50 | 1 |
2 | 56 | 1 |
2 | 61 | 0 |
2 | 61 | 0 |
2 | 63 | 1 |
2 | 68 | 1 |
2 | 82 | 1 |
2 | 85 | 1 |
2 | 88 | 1 |
2 | 89 | 1 |
2 | 90 | 1 |
2 | 93 | 1 |
2 | 104 | 1 |
2 | 110 | 1 |
2 | 134 | 1 |
2 | 137 | 1 |
2 | 160 | 0 |
2 | 169 | 1 |
2 | 171 | 1 |
2 | 173 | 1 |
2 | 175 | 1 |
2 | 184 | 1 |
2 | 201 | 1 |
2 | 222 | 1 |
2 | 235 | 0 |
2 | 247 | 0 |
2 | 260 | 0 |
2 | 284 | 0 |
2 | 290 | 0 |
2 | 291 | 0 |
2 | 302 | 0 |
2 | 304 | 0 |
2 | 341 | 0 |
2 | 345 | 0 |
Alternatively, open the test workbook usando la función abrir archivo del menú archivo. A continuación, seleccione Log-rank y Wilcoxon en la sección Análisis de supervivencia del menú análisis. Seleccione la columna marcada como «Grupo de escenario» cuando se le solicite el identificador de grupo, seleccione » Hora «cuando se le solicite horarios y» Censor » para censura. Haga clic en el botón cancelar cuando se le pregunte sobre strata.
en este ejemplo:
long-rank y Wilcoxon pruebas
Log Rank (Peto):
Para el grupo 1 (Fase de grupo = 1)
muertes Observadas = 8
Medida de la exposición al riesgo de muerte = 16.687031
tasa Relativa = 0.479414
For group 2 (Stage group = 2)
Observed deaths = 46
Extent of exposure to risk of death = 37.312969
Relative rate = 1.232815
test statistics:
-8.687031, 8.687031
variance-covariance matrix:
0.088912 | -11.24706 |
-11.24706 | 11.24706 |
Chi-square for equivalence of death rates = 6.70971 P = 0.0096
Hazard Ratio, (approximate 95% confidence interval)
Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.692607)
Estimaciones de máxima verosimilitud condicionales:
Razón de riesgo = 0,381485
Intervalo de confianza exacto de Fisher al 95% = 0,154582 a 0,822411
Fisher exacto un lado P = 0,0051, dos lados P = 0,0104
Intervalo de confianza medio exacto del 95% = 0,167398 a 0,783785
P media exacta P unilateral = 0,0034, P bilateral = 0,0068
Wilcoxon generalizado (Peto-Prentice):
estadísticas de prueba:
-5.19836, 5.19836
matriz de covarianza de varianza:
0.201506 | -4.962627 |
-4.962627 | 4.962627 |
Chi-cuadrado para la equivalencia de las tasas de mortalidad = 5,44529 P = 0,0196
Las pruebas log-rank y Wilcoxon demostraron una diferencia estadísticamente significativa en la experiencia de supervivencia entre los pacientes en estadio 3 y estadio 4 en este estudio.
Ejemplo estratificado
De Peto et al. (1977):
Group | Trial Time | Censorship | Stratum |
1 | 8 | 1 | 1 |
1 | 8 | 1 | 2 |
2 | 13 | 1 | 1 |
2 | 18 | 1 | 1 |
2 | 23 | 1 | 1 |
1 | 52 | 1 | 1 |
1 | 63 | 1 | 1 |
1 | 63 | 1 | 1 |
2 | 70 | 1 | 2 |
2 | 70 | 1 | 2 |
2 | 180 | 1 | 2 |
2 | 195 | 1 | 2 |
2 | 210 | 1 | 2 |
1 | 220 | 1 | 2 |
1 | 365 | 0 | 2 |
2 | 632 | 1 | 2 |
2 | 700 | 1 | 2 |
1 | 852 | 0 | 2 |
2 | 1296 | 1 | 2 |
1 | 1296 | 0 | 2 |
1 | 1328 | 0 | 2 |
1 | 1460 | 0 | 2 |
1 | 1976 | 0 | 2 |
2 | 1990 | 0 | 2 |
2 | 2240 | 0 | 2 |
Censorship 1 = death event
Censorship 0 = lost to follow-up
Stratum 1 = renal impairment
Stratum 2 = no renal impairment
The table above shows you how to prepare data for a prueba de rango logarítmico estratificado en StatsDirect. Este ejemplo se ha trabajado en el segundo de dos artículos clásicos de Richard Peto y sus colegas (Peto et al., 1977, 1976). Tenga en cuenta que StatsDirect utiliza las fórmulas de varianza más precisas mencionadas en la sección de notas estadísticas al final de Peto et al. (1977).