Log-rank et Wilcoxon
Emplacement du menu: Analysis_Survival_Log-rank et Wilcoxon.
Cette fonction fournit des méthodes pour comparer deux courbes de survie ou plus où certaines des observations peuvent être censurées et où le groupe global peut être stratifié. Les méthodes sont non paramétriques en ce sens qu’elles ne font pas d’hypothèses sur les distributions des estimations de survie.
En l’absence de censure (p. ex. les méthodes présentées ici se réduisent à un test de Mann-Whitney (deux échantillons de Wilcoxon) pour deux groupes de temps de survie et à un test de Kruskal-Wallis pour plus de deux groupes de temps de survie. StatsDirect fournit un ensemble complet de tests pour la comparaison des données de survie qui peuvent être censurées (Tarone et Ware, 1977; Kalbfleisch et Prentice, 1980; Cox et Oakes, 1984; Le, 1997).
L’hypothèse nulle testée ici est que le risque de décès / événement est le même dans tous les groupes.
Le test de rang log de Peto est généralement la méthode la plus appropriée, mais le test de Wilcoxon modifié par Prentice est plus sensible lorsque le rapport des risques est plus élevé aux premiers temps de survie qu’aux derniers (Peto et Peto, 1972; Kalbfleisch et Prentice, 1980). Le test log-rank est similaire au test Mantel-Haenszel et certains auteurs l’appellent le test Cox-Mantel (Mantel et Haenszel, 1959; Cox, 1972).
Strata
Une variable facultative, strata, vous permet de sous-classer les groupes spécifiés dans la variable identificateur de groupe et de tester l’importance de cette sous-classification (Armitage et Berry, 1994; Lawless, 1982; Kalbfleisch et Prentice, 1980).
Poids de Wilcoxon
StatsDirect vous donne le choix entre trois méthodes de pondération différentes pour le test de Wilcoxon généralisé, à savoir Peto-Prentice, Gehan-Breslow et Tarone-Ware. La méthode de Peto-Prentice est généralement plus robuste que les autres, mais la statistique de Gehan est calculée régulièrement par de nombreux logiciels statistiques (Breslow, 1974; Tarone et Ware, 1977; Kalbfleisch et Prentice, 1980; Miller, 1981; Hosmer et Lemeshow, 1999). Vous devriez demander des conseils statistiques si vous envisagez d’utiliser une méthode de pondération autre que Peto-Prentice.
Rapports de risque
Un intervalle de confiance approximatif pour le rapport de risque logarithmique est calculé à l’aide de l’estimation suivante de l’erreur type (SE):
– où l’eij est l’étendue de l’exposition au risque de décès (parfois appelé décès attendus) pour le groupe i de k au jème moment distinct observé (parfois appelé décès attendus) pour le groupe i de k (Armitage et Berry, 1994).
Une estimation exacte du maximum de vraisemblance conditionnelle du rapport de risque est éventuellement donnée. L’estimation exacte et son intervalle de confiance (Fisher ou mid-P) devraient être systématiquement utilisés de préférence à l’approximation ci-dessus. Les exposants des paramètres de régression de Cox sont également des estimateurs exacts du rapport de risque, mais veuillez noter qu’ils ne sont pas exacts si la méthode de Breslow a été utilisée pour corriger les liens dans la régression. Veuillez consulter un statisticien si vous envisagez d’utiliser la régression de Cox.
Test de tendance
Si vous avez plus de deux groupes, StatsDirect calculera une variante du test de rang de journal pour la tendance. Si vous choisissez de ne pas entrer les scores de groupe, ils sont attribués en tant que 1,2,3… n dans l’ordre de groupe (Armitage et Berry, 1994; Lawless, 1982; Kalbfleisch et Prentice, 1980).
Validation technique
La statistique générale du test est calculée autour d’une distribution hypergéométrique du nombre d’événements à des moments d’événement distincts:
– où le poids wj pour le test log-rank est égal à 1, et wj pour le test généralisé de Wilcoxon est ni (méthode de Gehan-Breslow); pour la méthode de Tarone-Ware, wj est la racine carrée de ni; et pour la méthode de Peto-Prentice, wj est la fonction de survivant de Kaplan-Meier multipliée par (ni divisée par ni +1). l’eij est l’attente de décès dans le groupe i au jème moment observé distinct où les événements / décès dj se sont produits. nij est le nombre à risque dans le groupe i juste avant le jième temps observé distinct. La statistique de test pour l’égalité de survie entre les groupes k (populations échantillonnées) est approximativement du chi carré distribué sur k-1 degrés de liberté. La statistique de test pour la tendance monotone est approximativement du chi carré distribué sur 1 degré de liberté. c est un vecteur de scores définis par l’utilisateur ou attribués de 1 à k.
La variance est estimée par la méthode que Peto (1977) qualifie d' » exacte « .
La statistique de test stratifiée est exprimée comme suit (Kalbfleisch et Prentice, 1980):
– où les statistiques définies ci-dessus sont calculées dans des strates puis additionnées entre strates avant les opérations de matrice inverse et de transposition généralisées.
Exemple
D’Armitage et Berry (1994, p. 479).
Classeur de test (Feuille de survie: Groupe de scène, Temps, Censeur).
Les données suivantes représentent la survie en jours depuis l’entrée dans l’essai des patients atteints de lymphome histiocytaire diffus. Deux groupes différents de patients, ceux de stade III et ceux de stade IV, sont comparés.
Étape 3: 6, 19, 32, 42, 42, 43*, 94, 126*, 169*, 207, 211*, 227*, 253, 255*, 270*, 310*, 316*, 335*, 346*
Étape 4: 4, 6, 10, 11, 11, 11, 13, 17, 20, 20, 21, 22, 24, 24, 29, 30, 30, 31, 33, 34, 35, 39, 40, 41*, 43*, 45, 46, 50, 56, 61*, 61*, 63, 68, 82, 85, 88, 89, 90, 93, 104, 110, 134, 137, 160*, 169, 171, 173, 175, 184, 201, 222, 235*, 247*, 260*, 284*, 290*, 291*, 302*, 304*, 341*, 345*
*=données censurées (patient encore vivant ou décédé d’une cause non liée)
Pour analyser ces données dans StatsDirect, vous devez d’abord les préparer dans trois colonnes du classeur, comme indiqué ci-dessous:
Stage group | Time | Censor |
1 | 6 | 1 |
1 | 19 | 1 |
1 | 32 | 1 |
1 | 42 | 1 |
1 | 42 | 1 |
1 | 43 | 0 |
1 | 94 | 1 |
1 | 126 | 0 |
1 | 169 | 0 |
1 | 207 | 1 |
1 | 211 | 0 |
1 | 227 | 0 |
1 | 253 | 1 |
1 | 255 | 0 |
1 | 270 | 0 |
1 | 310 | 0 |
1 | 316 | 0 |
1 | 335 | 0 |
1 | 346 | 0 |
2 | 4 | 1 |
2 | 6 | 1 |
2 | 10 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 11 | 1 |
2 | 13 | 1 |
2 | 17 | 1 |
2 | 20 | 1 |
2 | 20 | 1 |
2 | 21 | 1 |
2 | 22 | 1 |
2 | 24 | 1 |
2 | 24 | 1 |
2 | 29 | 1 |
2 | 30 | 1 |
2 | 30 | 1 |
2 | 31 | 1 |
2 | 33 | 1 |
2 | 34 | 1 |
2 | 35 | 1 |
2 | 39 | 1 |
2 | 40 | 1 |
2 | 41 | 0 |
2 | 43 | 0 |
2 | 45 | 1 |
2 | 46 | 1 |
2 | 50 | 1 |
2 | 56 | 1 |
2 | 61 | 0 |
2 | 61 | 0 |
2 | 63 | 1 |
2 | 68 | 1 |
2 | 82 | 1 |
2 | 85 | 1 |
2 | 88 | 1 |
2 | 89 | 1 |
2 | 90 | 1 |
2 | 93 | 1 |
2 | 104 | 1 |
2 | 110 | 1 |
2 | 134 | 1 |
2 | 137 | 1 |
2 | 160 | 0 |
2 | 169 | 1 |
2 | 171 | 1 |
2 | 173 | 1 |
2 | 175 | 1 |
2 | 184 | 1 |
2 | 201 | 1 |
2 | 222 | 1 |
2 | 235 | 0 |
2 | 247 | 0 |
2 | 260 | 0 |
2 | 284 | 0 |
2 | 290 | 0 |
2 | 291 | 0 |
2 | 302 | 0 |
2 | 304 | 0 |
2 | 341 | 0 |
2 | 345 | 0 |
Alternatively, open the test workbook utilisation de la fonction d’ouverture de fichier du menu fichier. Sélectionnez ensuite Log-rank et Wilcoxon dans la section Analyse de survie du menu analyse. Sélectionnez la colonne « Groupe de scène » lorsqu’on vous demande l’identifiant du groupe, sélectionnez « Heure » lorsqu’on vous demande des heures et « Censurer » pour la censure. Cliquez sur le bouton annuler lorsque vous êtes interrogé sur les strates.
Pour cet exemple :
Tests de Logrank et de Wilcoxon
Log Rank (Peto):
Pour le groupe 1 (groupe de stade = 1)
Décès observés = 8
Étendue de l’exposition au risque de décès = 16,687031
Taux relatif = 0.479414
For group 2 (Stage group = 2)
Observed deaths = 46
Extent of exposure to risk of death = 37.312969
Relative rate = 1.232815
test statistics:
-8.687031, 8.687031
variance-covariance matrix:
0.088912 | -11.24706 |
-11.24706 | 11.24706 |
Chi-square for equivalence of death rates = 6.70971 P = 0.0096
Hazard Ratio, (approximate 95% confidence interval)
Group 1 vs. Group 2 = 0.388878, (0.218343 to 0.692607)
Estimations conditionnelles du maximum de vraisemblance :
Rapport de risque = 0,381485
Intervalle de confiance exact à 95 % de Fisher = 0,154582 à 0,822411
Fisher exact à un côté P = 0,0051, à deux côtés P = 0,0104
Intervalle de confiance exact à 95 % à mi-P = 0,167398 à 0,783785
Milieu exact P un côté = 0,0034, deux côtés P= 0,0068
Wilcoxon généralisé (Peto-Prentice):
statistiques de test:
-5,19836, 5,19836
Matrice de variance-covariance:
0,201506 | -4,962627 |
-4,962627 | 4.962627 |
Chi-carré pour l’équivalence des taux de mortalité = 5,44529 P= 0,0196
Les tests log-rank et Wilcoxon ont démontré une différence statistiquement significative dans l’expérience de survie entre les patients de stade 3 et de stade 4 dans cette étude.
Exemple stratifié
D’Après Peto et al. (1977):
Group | Trial Time | Censorship | Stratum |
1 | 8 | 1 | 1 |
1 | 8 | 1 | 2 |
2 | 13 | 1 | 1 |
2 | 18 | 1 | 1 |
2 | 23 | 1 | 1 |
1 | 52 | 1 | 1 |
1 | 63 | 1 | 1 |
1 | 63 | 1 | 1 |
2 | 70 | 1 | 2 |
2 | 70 | 1 | 2 |
2 | 180 | 1 | 2 |
2 | 195 | 1 | 2 |
2 | 210 | 1 | 2 |
1 | 220 | 1 | 2 |
1 | 365 | 0 | 2 |
2 | 632 | 1 | 2 |
2 | 700 | 1 | 2 |
1 | 852 | 0 | 2 |
2 | 1296 | 1 | 2 |
1 | 1296 | 0 | 2 |
1 | 1328 | 0 | 2 |
1 | 1460 | 0 | 2 |
1 | 1976 | 0 | 2 |
2 | 1990 | 0 | 2 |
2 | 2240 | 0 | 2 |
Censorship 1 = death event
Censorship 0 = lost to follow-up
Stratum 1 = renal impairment
Stratum 2 = no renal impairment
The table above shows you how to prepare data for a test de rang de journal stratifié dans StatsDirect. Cet exemple est traité dans le deuxième des deux articles classiques de Richard Peto et ses collègues (Peto et al., 1977, 1976). Veuillez noter que StatsDirect utilise les formules de variance les plus précises mentionnées dans la section notes statistiques à la fin de Peto et al. (1977).