Articles

pontos p-értékek a Friedman-rangösszegek páros összehasonlításához, az osztályozók összehasonlításához

november 21, 2021 by admin

Friedman-adatok
nullhipotézis
Friedman-teszt statisztika
páronkénti összehasonlító tesztek és hozzávetőleges kritikus különbség
statisztikai teljesítmény és alternatív vizsgálatok
pontos Eloszlás és gyors p-érték számítás
szoftver implementáció
hiányos rangsor
pontos és közepes p-értékek
kötött rangsor

Friedman-adatok

a Friedman-teszt elvégzéséhez a megfigyelt adatok teljes kétirányú elrendezés formájában vannak elrendezve, mint az 1a táblázatban, ahol a k sorok a csoportokat (osztályozókat), az n oszlopok pedig a blokkokat (adatkészleteket) képviselik.

1.táblázat kétirányú elrendezés a Friedman-teszthez

az adatok n blokkból állnak, minden blokkon belül k megfigyeléssel. Feltételezzük, hogy a különböző blokkokban végzett megfigyelések függetlenek. Ez a feltételezés nem vonatkozik a K megfigyelések egy blokkon belül. A vizsgálati eljárás a blokkon belüli függőségek ellenére is érvényes marad . A Friedman-teszt statisztikáját rangsorolt adatok alapján határozzák meg, így hacsak az eredeti nyers adatok nem egész értékű rangpontok, a nyers adatokat rangsorolják. Az 1B táblázat rangbejegyzéseit úgy kapjuk meg, hogy először a nyers adatokat rendezzük {x ij ; i = 1,…, n, j = 1,…, k} az 1a táblázatban oszloponként a legkisebbtől a legnagyobbig, az egyes n blokkokon belül külön-külön és függetlenül, majd az 1,…, K egész számokat hozzárendeljük a blokkon belüli K megfigyelések rangpontszámaihoz. Bármely J csoport sorainak sorösszege az R J = 6 n i = 1 r ij.

nullhipotézis

a Friedman-teszt általános nullhipotézise az, hogy az összes k blokkolt minta, mindegyik n méretű, azonos, de meghatározatlan populáció-eloszlásból származik. Ennek a nullhipotézisnek a részletesebb meghatározásához x ij jelöljön egy véletlen változót ismeretlen kumulatív eloszlási függvénnyel F ij, x IJ pedig X IJ megvalósítását .

a nullhipotézis kétféleképpen definiálható, attól függően, hogy a blokkok fixek vagy véletlenszerűek . Ha a blokkok fixek, akkor az összes k 6 n mérési érték Független. Ha vannak k csoportok véletlenszerűen hozzárendelve a tartáshoz K független X ij minden blokkon belül, mint egy randomizált teljes blokktervben, akkor az a nullhipotézis, miszerint a k csoportok azonos eloszlásúak, megfogalmazható:

H 0: F i1(x) = … = F ik (x) = F I (x) minden egyes i = 1,…, n,

ahol F i (x) a megfigyelések eloszlása az i-edik blokkban . Ugyanezt a hipotézist kapjuk, de konkrétabb, ha feltételezzük, hogy a szokásos additív modell generálta az x ij-t a kétirányú elrendezésben . Az additív modell a mérési értékre gyakorolt teljes hatást bontja le egy teljes hatásra, az I. blokk hatásra, az I. blokk hatásra és a J csoport hatásra, a J. csoport hatásra . Ha az eloszlásfüggvényt F ij (x) = F(x − 6 − i − j) jelöljük, akkor a K csoportok közötti különbség nélküli nullhipotézis

$$ {H}_0:\kern0.5em {\tau}_1=\dots ={\tau}_k, $$

az Általános alternatív hipotézis pedig

$ {H}_1:\kern0.5EM {\tau}_{j_1}\ne {\tau}_{j_2} $ legalább egy (j 1, J 2) pár számára.

vegye figyelembe, hogy ez az ábrázolás azt is állítja, hogy az alapul szolgáló eloszlási függvények F i1(x),…, F ik (x) az I blokkon belül ugyanazok, azaz F I1(x) = … = F ik (x) = F I (x), minden rögzített i = 1,…, n.

Ha a blokkok véletlenszerűek, akkor ugyanazon véletlenszerű blokk mérései pozitívan korrelálnak. Például, ha egyetlen alany alkot egy blokkot, és k megfigyelést végeznek az alanyon, esetleg randomizált sorrendben, akkor a blokkon belüli megfigyelések függenek. Ez a függőség egy ismételt mérési tervben fordul elő, ahol n alanyt figyelnek meg, és mindegyik alanyt k körülmények között tesztelik. Jelölje az I. blokkon belüli megfigyelések közös eloszlási függvényét F I-vel (x 1, …, x k ). Ezután a K csoportok közötti különbségek nélküli nullhipotézis az X I1, …, X ik véletlen változók kicserélhetőségének hipotézise , amelyet

h 0-ként fogalmaznak meg : F i (x 1, …, x k ) = F I (x 6), …, x 6(k)) az i = 1, …, n,

esetében, ahol a(1),…,…, k) minden 1,…, k permutációját jelöli. A hipotézis alapjául szolgáló modell az, hogy a véletlen változók X ij cserélhető eloszlással rendelkezik. Ez megfelelő modell az ismételt intézkedésekhez, ahol nem helyénvaló függetlenséget vállalni egy blokkon belül . Azt is megjegyezzük, hogy a nullhipotézisnek ez a megfogalmazása és a rögzített blokkokra vonatkozó megfogalmazása konzisztens ugyanazon alternatívával szemben, nevezetesen a H 0 tagadása. A kérdés részletes megvitatását lásd:.

függetlenül attól, hogy a blokkok fixek vagy véletlenszerűek-e, ha a nullhipotézis igaz, akkor az 1,…, k összes permutációja egyformán valószínű. Vannak k ! az egyes blokkokon belüli K csoportokhoz k rang pontszámok hozzárendelésének lehetséges módjai, és ezek a blokkon belüli permutációk h 0 alatt egyenértékűek. Mivel ugyanaz a permutációs argumentum vonatkozik az egyes n független blokkokra, vannak (k !) n egyformán valószínű rang konfigurációk a rang pontszámok r ij a kétirányú elrendezés . Ezen permutációk mindegyikének valószínűsége (k !)- n megvalósul. Ez a funkció az R J rangösszegek null eloszlásának értékelésére szolgál, a rangok kétirányú elrendezésének összes permutációjának felsorolásával.

Friedman-teszt statisztika

a Friedman-nullhipotézis szerint az egyes csoportok sorainak várható sorösszege egyenlő n(k + 1) / 2. A Friedman-teszt statisztikája

$ $ {X}_r^2= \ frac{12}{nk \ left( k + 1 \ right)} {\displaystyle \ sum_{j=1}^k {\left \ {{R}_j-n \ left (k+1\right)/2 \ right\}}^2} $$

összegzi az egyes csoportok megfigyelt rangösszegeinek négyzetbeli eltéréseit, R j, az egyes csoportok közös várható értékétől, n (k + 1) / 2, feltételezve, hogy a k csoport eloszlása azonos. A K és n kis értékek esetében az X 2 r pontos eloszlását például Friedman javasolta . A Friedman rangösszegek pontos közös eloszlásának kiszámítására szolgáló algoritmust a null alatt tárgyaljuk . Két párosított minta speciális esetét lásd:.

a tesztstatisztika kiszámítása a (k !) n lehetséges permutációk időigényes, ha k nagy. Friedman azonban kimutatta, hogy mivel n hajlamos a végtelenre, X 2 r eloszlásban konvergál a következőre: 6 DF = K − 1 , egy khi-négyzet véletlen változó K − 1 szabadságfokkal. Ezt az eredményt az aszimptotikus Friedman-tesztben használják. A Friedman-teszt elutasítja a H 0-t egy előre meghatározott szignifikancia szinten, ha a tesztstatisztika X 2 r meghaladja az X 2 r korlátozó khi-négyzet eloszlásának 100 (1-6)percentilisét k-1 szabadságfok. A tesztstatisztikát ki kell igazítani, ha a blokkokon belül kötött sorok vannak . A Friedman-teszt különféle módosításait is javasolták, például A F eloszlás a chi-négyzet eloszlás alternatívájaként, valamint általánosítások, például a Skillings-Mack teszt statisztika hiányzó adatok jelenlétében történő felhasználásra. Ezeket, valamint a Friedman-teszt különböző egyéb kiigazításait és nem paraméteres versenytársait (pl. Kruskal-Wallis, Quade, Friedman igazított rangok teszt) itt nem tárgyaljuk (lásd ).

páronkénti összehasonlító tesztek és hozzávetőleges kritikus különbség

gyakran előfordul, hogy a kutatók nem csak a csoportok egyenlőségének globális hipotézisének tesztelésére törekszenek, hanem, vagy még inkább, a csoportok egyenlőségének egyenlőségére vonatkozó következtetésekre is. Továbbá, még akkor is, ha az embert elsősorban a H 0 érdekli, és a hipotézist elutasítják, nyomon követési elemzést lehet végezni az elutasítás lehetséges okainak meghatározására. Az ilyen elemzés felfedheti a csoportkülönbségeket, de azt is felfedheti, hogy a párok egyike sem különbözik jelentősen, a globálisan jelentős teszteredmény ellenére.

ezeknek a kérdéseknek a kezelésére célszerű az egyenlőség hipotéziseinek tesztelése csoportpárok számára egyidejű összehasonlító tesztek segítségével. Ezek a többszörös összehasonlítási eljárások magukban foglalhatják 1-ben (vagy sok-egy) összehasonlítások, az összes nem kontrollcsoport egyenlőségének K − 1 hipotéziseinek tesztelése a vizsgálati kontroll ellen, vagy N-ben N (összes pár) összehasonlítások, figyelembe véve k(k-1)/2 az összes csoportpár közötti egyenlőség hipotézisei. Mindkét típusú összehasonlításhoz nagy mintájú hozzávetőleges teszteket terveztek. Ezek abból a helyzetből származnak, amikor n, a blokkok száma (azaz a minta mérete) nagy.

a 2.táblázat a kritikus különbség (CD) közelítő tesztjeit mutatja be a Friedman-rangok 1. számú és N. számú összehasonlításához, amint azt a gyakran idézett monográfiák és tanulmányok, valamint a nem paraméteres statisztikákról szóló népszerű tankönyvek javasolják. A kritikus különbség a rangösszegek minimálisan szükséges különbsége ahhoz, hogy egy csoportpár az előre meghatározott alfa szignifikancia szinten eltérjen. Meg kell jegyezni, hogy sok publikációban a CD-statisztikát a rangösszeg átlagainak különbsége alapján számítják ki, azaz RJ /n, nem pedig rangösszegek. Az eredmények azonosak, mivel minden csoportnak n megfigyelése van, ha a tesztstatisztikai képleteket megfelelően módosítják.

2 .táblázat ajánlott kritikus különbség (CD) közelítő tesztek 1 db n és N db N Friedman rangösszegek összehasonlításához

Ha a n független rangsorban a rangok egyenlőségének nullhipotézise igaz, és a nagy mintaméret feltétele a következő: met, a rangösszegek különbségei megközelítőleg normálisan oszlanak meg. Legyen d = R i-R j , i-vel j, legyen a rang összege különbség egy pár csoport között i és j. a rang összege különbség támogatása d a lezárás . A nullhipotézis szerint a várható érték E(d) = 0 és a variancia Var(d) = nk (k + 1)/6 . Mivel a D eloszlása szimmetrikus körül E (d) = 0, a ferdeség nulla, mint minden páratlan rend pillanat. A kurtosis együttható, amelyet Whitfield vezet le

$$ \mathrm{Kurt}(d)=3-\frac{3}{5 n}-\frac{12}{5 n k}-\frac{6}{5 n k\left( k+1\right)}, $$

kevesebb, mint 3 (azaz negatív felesleges kurtosis), ami azt jelenti, hogy a diszkrét rangösszegkülönbség-eloszlásnak vékonyabb a farka mint a normális. Figyeljük meg azonban, hogy a kurtosis hajlamos 3 növekvő n, így a normális közelítés ésszerű. Ez azt jelenti, hogy d aszimptotikus n(0, Var( d)) eloszlású, és hogy a normális eltérés \ (d/\sqrt{\mathrm{Var} (d)} \) aszimptotikusan N (0, 1).

mint a 2. táblázatban látható, a normál hozzávetőleges tesztet különböző szerzők javasolják, amikor az összes csoportot páronként kell összehasonlítani. Azt is tárgyalja Demo-nak, mint tesztstatisztikát, amelyet akkor kell alkalmazni, ha az összes csoportot egyetlen kontrollal hasonlítják össze. Vegye figyelembe, hogy a szokásos vizsgálati eljárások a családonkénti I. típusú hibaarányt úgy szabályozzák, hogy a teljes szignifikanciaszintet elosztják az elvégzett összehasonlítások számával (azaz c 1 az 1-ből n, c 2 az N-ből N N összehasonlítások). Ennek a Bonferroni típusú korrekciónak erősebb versenytársai vannak, mint például a Holm, Hochberg és Hommel eljárások. Az Általános hamis pozitív hibaarány ellenőrzésére szolgáló módszereket ez a dokumentum nem részletezi. Oktatóanyagért az osztályozó összehasonlításának területén, lásd Derrac et al. .

a szokásos normál közelítés mellett egyidejű teszteket javasoltak, amelyek kihasználják a rangösszegek közötti különbségek értékeinek eloszlásának kovariancia szerkezetét. Míg az n rangsor egymástól független a H 0 alatt, a rangösszegek és a rangösszegkülönbségek is függenek és korrelálnak. A rangösszeg-különbségek közötti korreláció az érintett rangösszegektől függ. Pontosabban, amint Miller jelentette , amikor a nullhipotézis igaz

$$ \mathrm{C}\mathrm{o}\mathrm{r}\left({R}_i-{R}_j,{R}_i-{R}_l\right)={\scriptscriptstyle \frac{1}{2}}\kern2.25em i\ne j\ne l $$

$$ \mathrm{C}\mathrm{o}\mathrm{r}\left({R}_i-{r}_j,{r}_l-{r}_m\right)=0\kern2.25em i\ne j\ne l\ne m. $$

ezért a korreláció nulla a rang összegbeli különbségek párjai esetén, ahol nincs közös csoport, és 0,5 a különbségek párjai esetén, ahol egy csoport közös mindkét különbségre. A korrelált párok száma csökken k növekedésével. A K csoportokat érintő vizsgálat esetében a korrelált párok aránya 4/(k + 1) . Ezért amikor k = 7, például a párok 50% – a korrelál, de amikor k = 79 csak 5% korrelál.

amint azt különböző tanulmányok (pl.,) megjegyezték, 1 db n összehasonlításnál ez a korrelációs struktúra azt jelenti, hogy amikor H 0 igaz és n végtelenre hajlik, a K − 1 csoport rangösszegek és a kontroll rang összeg közötti különbségek eloszlása egybeesik egy aszimptotikus (k − 1) -variálja a normál eloszlást nulla átlaggal. A kritikus különbség értéke tehát közelíthető a 2. táblázatban CD M címkével ellátott tesztstatisztikával, ahol az állandó $ {m}_{\alpha, df= k-1,\rho ={\scriptscriptstyle \ frac{1}{2}}} $ A (k − 1) egyenlően Korrelált n(0,1) véletlen változók maximális értékének eloszlásának felső ath percentilis pontja közös korrelációval \( \rho ={\scriptscriptstyle \frac{1}{2}}. \ ) Az eljárás egy aszimptotikus családonkénti hibaarány egyenlő 6 fővel .

N (N) N összehasonlítás esetén ez azt jelenti, hogy a rangösszegbeli különbségek kovarianciája megegyezik a K független, nulla középértékű és NK(k + 1)/12 varianciájú véletlen változók közötti különbségek kovarianciájával. Így a $ max\left\{\left|{R}_i-{R}_j\right|\right\}/\sqrt{nk\left( k+1\right)/12} $ aszimptotikus eloszlása egybeesik a K független n (0, 1) véletlen változók tartományának(Q k, ons) eloszlásával. A kapcsolódó tesztstatisztika az CD Q, ahol az állandó q (DF = k), DF = k, (k) szabadsági fokokkal rendelkező Studentizált tartomány (q) Eloszlás felső ATH percentilis pontja . Ismét, mivel a teszt az összes k csoport abszolút különbségét egyszerre veszi figyelembe, az aszimptotikus családonként hibaarány egyenlő 6 .

maga a Friedman statisztikai teszt eredményezi a 2.táblázat alsó sorában említett egyidejű tesztet. A nullhipotézis akkor fogadható el, ha a rangösszegek különbsége nem haladja meg a kritikus értéket \( C{D}_{\chi^2}. \ ) Ez az aszimptotikus khi-négyzet közelítés ajánlott néhány népszerű tankönyvben, bár Miller azzal érvelt, hogy a valószínűségi állítás nem a legélesebb teszt.

statisztikai teljesítmény és alternatív vizsgálatok

vegye figyelembe, hogy a 2.táblázatban bemutatott CD-tesztstatisztikák nem igényelnek információt a kísérletben meghatározott blokkokon belüli rangokról. Inkább az egyidejű rangtesztek feltételezik, hogy az egyes blokkokon belül minden megfigyelésnek ugyanolyan valószínűséggel van elérhető rangja. Ha ez igaz, a mennyiség (k + 1) (k − 1)/12 a blokkon belüli rangok varianciája, az nk (k + 1)/6 pedig a két rangösszeg közötti különbség varianciája . Ezért a D null eloszlása a populációban nulla átlaggal és ismert szórással rendelkezik. Ez a pontos oka annak, hogy a normál hozzávetőleges tesztek A Z-pontszámot használják tesztstatisztikaként. Fontos azonban ebben az összefüggésben hangsúlyozni, hogy a négyzetgyök nak, – nek nk(k + 1)/6 a szórása d ha az Általános nullhipotézis igaz, de nem akkor, ha hamis. A p-értékekhez hasonlóan csak egy adott modellben, azaz H 0; olyan modell, amely igaz lehet vagy nem. Ha a nullhipotézis hamis, az nk(k + 1)/6 mennyiség általában a variancia túlbecslése, és ez egyidejű, hozzávetőleges és pontos teszteket eredményez.

rendelkezésre állnak páros összehasonlító tesztek a Friedman rangösszegekre vonatkozóan, amelyeket a megfigyelt rangeredmények alapján számítanak ki, nem pedig a rangösszegek alapján. Ezek a tesztek, mint például a Rosenthal-Ferguson teszt és a népszerű Conover teszt, a T-pontszámot használják tesztstatisztikaként. A páros t-tesztek gyakran erősebbek, mint a fent tárgyalt egyidejű tesztek, azonban vannak hátrányai is. Röviden, A Rosenthal-Ferguson-teszt a megfigyelt varianciákat és kovarianciát használja az egyes csoportpárok rangsorolási pontszámainak, hogy megkapja a standard hiba nak, – nek d a páronkénti rangösszeg különbség szignifikanciájának tesztjéhez. Ez a standard hiba érvényes, függetlenül attól, hogy a páros különbség nélküli nullhipotézis igaz-e vagy sem. A teszt formális korlátozása mellett azonban n nagyobbnak kell lennie, mint k + 1, a variancia nak,-nek d rosszul becsülhető meg, mivel általában kevés szabadságfok áll rendelkezésre a (társ)variancia becsléséhez kis mintájú Friedman-tesztalkalmazásokban. Ezenkívül a megfigyelt (Társ)varianciák minden csoportpár esetében eltérőek. Következésképpen nem következik egy adott a rangösszeg különbségének jelentőségéből egy másik B rangösszegtől, hogy egy harmadik C rangösszeg, amely jobban különbözik az A-tól, mint B, szintén jelentősen eltérne. Ez a teszt kellemetlen jellemzője.

a Conover-teszt becsüli a D szórását egy összesített standard hiba kiszámításával az összes csoport megfigyelt rangpontszámainak (Társ)varianciáiból, ezáltal növelve a statisztikai teljesítményt. A módszer hasonló Fisher védett legkevésbé szignifikáns különbség (LSD) tesztjéhez, amelyet a rangsorolási pontszámokra alkalmaznak. Ebben a módszertanban a p-értékek többszörös tesztelésére nem kerül sor, hogy megőrizzék a családonkénti hibaarányt a nominális szignifikancia szintjén. Inkább a teszt védett abban az értelemben, hogy nem végeznek páros összehasonlításokat, hacsak a teljes tesztstatisztika nem jelentős. A Fisher által védett LSD eljáráshoz hasonlóan a Conover-tesztnek az a tulajdonsága, hogy a teljes teszt megfigyelt F-értékét beépíti a következtetési döntési folyamatba. A Fisher által védett LSD-vel ellentétben, amely a megfigyelt F-értéket csak 0-1 (‘go/no go’) módon használja, a Conover-teszt az F-értéket zökkenőmentesen használja az LSD kiszámításakor. Vagyis az a szokatlan jellemzője, hogy minél nagyobb a teljes tesztstatisztika, annál kisebb a legkevésbé szignifikáns különbségi küszöb a rangösszeg-különbség szignifikánsnak nyilvánításához. A Duncan-Waller tesztnek ugyanaz a jellemzője, de ez a teszt a Bayes-féle megközelítést támogatja a Bayes LSD-vel való többszörös összehasonlításhoz. Mivel a második szakaszban az összehasonlító tesztek az első szakasz eredményétől függenek, a páros Conover-tesztben használt névleges alfa-szintnek nincs valós valószínűségi jelentése a frequentista értelemben. Conover és Iman szerint (: 2), “Mivel a második szakasz tesztjének 6.szintje általában nem ismert, ez már nem a szokásos értelemben vett hipotézis teszt, hanem csupán egy kényelmes mérce egyes kezelések elválasztására másoktól.”

pontos Eloszlás és gyors p-érték számítás

pontos tesztet mutatunk be a Friedman-rangösszegek egyidejű páros összehasonlítására. A pontos nulleloszlást a valószínűséggeneráló függvény módszerével határozzuk meg. A generáló függvények elegáns módot nyújtanak az eloszlásmentes tesztstatisztikák valószínűségi vagy frekvenciaeloszlásainak megszerzésére . A generáló függvény módszer alkalmazása a következő tételt eredményezi, amelynek igazolása az 1.kiegészítő fájlban található.

1. tétel n kölcsönösen független egész értékű rangsor esetén, mindegyik egyformán valószínű rangsorolási pontszámmal 1-től k-ig terjed, a pontos valószínűség a páros különbség megszerzéséhez d bármely két rangösszegre egyenlő

$$ P\left( D= d; k, n\right)={\left\{ k\left( k – 1\right)\right\}}^ {- n} w\left( D= d; k, N\right), $$

$$ p\left( D= D; K, N \ right), $ $ $ $ p \ left (D = D;>

ahol

$ $ w \ balra (D = D; k, n\right)={\left\{ k\bal( k-1\right)\right\}}^n{\displaystyle \sum_{h=0}^n\left(\begin{array}{c}\hfill n\hfill \\ {}\hfill h\hfill \end{array}\right)}\ \frac{1}{K^h{\left(1 – K\right)}^n}{\displaystyle \sum_{i=0}^h{\displaystyle \sum_{j=0}^h{\left(-1\right)}^{\left( J – I\right)}}\left(\begin{array} {C}\hfill h\hfill \ \ {} \hfill I\hfill \end{array}\right)\left(\begin{array} {C}\hfill h\hfill \ \ {} \hfill j\hfill \end{array}\right)\left(\begin{array} {C}\hfill k\left( j – i\right)- d+ h-1\hfill \ \ {} \hfill k\left( j – i\right)- d – h\hfill \end{array}\right) $$

a különböző módok a rangösszeg különbsége d felmerülhet, Val Vel d támogatása van d = .

az 1. Kiegészítő fájl zárt formájú kifejezést is kínál a pontos p-értékére d.A p-értéket úgy definiáljuk, mint annak valószínűségét, hogy legalább olyan szélsőséges eredményt kapjunk, mint a megfigyelt, tekintettel arra, hogy a nullhipotézis igaz. Ezt úgy kapjuk meg, mint az összes lehetséges d valószínűségének összegét ugyanarra a k-ra és n-re, amelyek ugyanolyan valószínűek vagy kevésbé valószínűek, mint a null alatti d megfigyelt értéke. A pontos p-értéket jelöljük P(D! D); k, n), és a

$$ \begin{array}{l} p\left (D \ ge d; k, n\jobb)={\displaystyle \sum_{h=0}^n\bal(\kezdő{tömb}{c}\hfill n\hfill \\ {}\hfill h\hfill \end{tömb}\jobb)}\ \frac{1}{K^h{\bal(1 – k\jobb)}^n}{\displaystyle \sum_{i=0}^h{\displaystyle \sum_{j=0}^h{\displaystyle\sum_ {j= 0}^h {\bal(-1\right)} ^ {\left( J – I\right)}}\left (\begin {array} {C} \ hfill h \ hfill \\{} \hfill I\hfill\end{array}\right)\left (\begin {array} {C} \ hfill k \ left (j – i\right)\left (\begin{array} {C}\hfill k\left( j – i\right) – d+ h\hfill\\{}\hfill k \ bal( j – i \ jobb) – d – h\hfill\end{array}\jobb),\\{}\kern27.5EM d = -n\ bal( K-1\ jobb), \pontok, n\bal (k-1\jobb).\end{array} $$

a pontos p-érték kiszámítása ezzel a hármas összegzési kifejezéssel nagyságrendek gyorsulását eredményezi az összes lehetséges kimenetel és valószínűségük teljes felsorolásánál brute-force permutációs megközelítéssel. Nagyobb n értékek esetén azonban a pontos számítás kissé időigényes, és az egzakt tesztek elvégzésének gyakorlati tartományának kiterjesztése érdekében kívánatos a p-érték hatékonyabb kiszámítása.

Továbbá, mivel a gyakorlatban több összehasonlító teszt abszolút különbségekkel foglalkozik, célszerű kiszámítani a rangsorösszegek közötti különbségek abszolút értékének kumulatív valószínűségét. Mivel a tömegpontok száma a szimmetrikus Eloszlás nak, − nek d a forma egész száma 2N(k-1) + 1, az eloszlásnak páratlan számú valószínűsége van. Ez azt jelenti, hogy mivel a D valószínűségi tömegfüggvénye nulla körül szimmetrikus, a D = 0-tól balra eső valószínűségi tömeg áthajtható, ami a nem negatív d összehajtott eloszlását eredményezi. Következésképpen a nem negatív d egyoldalú p-értéke a D = 1, …, n(k-1) tartományban megkapható a szimmetrikus Eloszlás két egyoldalú p-értékének összegeként d = támasztékkal . Mivel az egyoldalú p-érték megkétszerezése D = 0-ra olyan P-értéket eredményez, amely meghaladja az egységet, a d = 0 (csak) p-értékét P-ként számítjuk ki(D 0); k, n) = P(D = 0) + P(D 1), és ez pontosan egyenlő 1-vel.

a számítás felgyorsítása érdekében átalakítjuk a kettős összegzést az I és j indexek felett a P kifejezésben (d) d; k, n) egyetlen index összegzésére, s mondjuk, a 2. tétel használatával. A bizonyítékot a 2. Kiegészítő fájl tartalmazza.

2. tétel d és k nem negatív egész számokra

$$ {\displaystyle \sum_{i=0}^h{\displaystyle \sum_{j=0}^h{\left(-1\right)}^{\left( j – i\right)}}}\left(\begin{array}{c}\hfill h\hfill \\ {}\hfill I\hfill \end{array}\right)\left(\begin{array}{C}\hfill h\hfill \\ {}\hfill j\hfill \end{array}\right)\left(\begin{array}{C}\hfill k\left( j – i\right)- d+ h\hfill \\ {}\hfill k\left( j – i\right)- d – h\hfill \end{array}\right)={\displaystyle \sum_{s=0}^h{\left(-1\right)}^s}\left(\begin{array}{C}\hfill 2 h\hfill \\ {}\hfill h+ S\hfill \end{array}\right)\left(\begin{array}{C}\hfill k s- d + h \ hfill \ \ {} \ hfill k s-d-h \ hfill \ end{array} \ jobb). $$

Ez az egyösszegű függvényre történő redukció azt jelenti, hogy a p-érték alternatívaként kiszámítható a sokkal egyszerűbb kifejezésből

$$ P \ left( D \ ge \ \ left / d \ right|; k, n\right)=\left\{\begin{array}{c}\hfill 2\ {\displaystyle \sum_{h=0}^n\left(\begin{array}{c}\hfill n\hfill \\ {}\hfill h\hfill \end{array}\right)}\frac{1}{K^h{\left(1 – K\right)}^n}{\displaystyle \sum_{s=0}^h{\left(-1\jobb)}^s\bal(\kezdődik{array}{C}\hfill 2 h\hfill \\ {}\hfill h+ S\hfill \end{array}\jobb)\bal(\kezdődik{array}{C}\hfill KS – d+ h\hfill \\ {}\hfill ks – d – h\hfill \end{array}\jobb)}, \kern1.8EM D=1,\pontok, n\bal( k-1\jobb)\hfill \\ {}1\kern22.5EM D=0,\kern3em \end{array}\jobb. $$

és, mint megmutatjuk, még nagyobb n értékekre is számítási gyorsasággal.

szoftver implementáció

bár a pontos p-érték két kifejezése matematikailag helyes, az egyszerű számítás számítási hibákat eredményezhet. Még mérsékelt értékek esetén is n (20 vagy úgy), a binomiális együttható, amelynek van d Az indexekben rendkívül nagy lehet, és ezeknek a számoknak a későbbi szorzáshoz való tárolása numerikus túlcsordulást eredményez a rögzített pontosságú aritmetika pontossági korlátozása miatt. A hiba kezelésének egyik módja egy olyan ismétlődési reláció használata, amely kielégíti a generáló függvényt . Az általunk vizsgált rekurziók számítási szempontból drágák voltak, kivéve a kis értékeket n és / vagy k. a pontos p-érték helyes kiszámításának gyorsabb módja az önkényes pontosságú aritmetikai számítás használata olyan számok kezelésére, amelyek tetszőleges nagy méretűek lehetnek, csak a rendelkezésre álló számítógép memóriája korlátozza.

A D és n abszolút rangösszeg különbség p-értékének kiszámítása R-ben történik . Az R kód, amely megköveteli a csomag Rmpfr nagy pontosságú számtani kell telepíteni, van további Fájl 3. A pexactfrsd címkével ellátott szkript kiszámítja a pontos p-értéket P(D ++ |d|), és emellett lehetőséget ad a valószínűség kiszámítására P (D = |d|), valamint a D (azaz W(D = |d|) és W(D ++ |d|)) kompozícióinak (kumulatív) számát. Az R kód és a lehetséges jövőbeli frissítések a http://www.ru.nl/publish/pages/726696/friedmanrsd.zipcímen is elérhetők.

a levezetések szemléltetésére a 4. Kiegészítő fájl egy kis méretű numerikus példát kínál (k = 3, n = 2), az 5 .Kiegészítő fájl pedig táblázatba foglalja a D kompozícióinak számát A K = n = 2,…, 6 kombinációihoz az OEIS-be való felvételhez. Amint az az 5. további fájlban is látható, n kis értékei esetén d kibontott, szimmetrikus eloszlása bimodális, + 1 és − 1 módokkal . Ez a tulajdonság gyorsan eltűnik, ahogy n növekszik, különösen a k > 2 N 6-nál.

a továbbiakban, hacsak másként nem jelezzük, a D rangösszeg − különbség értékét nullának vagy pozitívnak tekintjük, 0-tól n-ig(k-1), és így az abszolút érték szimbólumot d körül dobjuk.

hiányos rangsor

mivel az n rangsor {1,2,…,k} egymástól független, két (vagy több), egyenlő vagy egyenlőtlen méretű részre oszthatjuk őket, (D 1; k, n 1) és (D 2; k, n 2) jelöléssel, 2 t = 1 D T = D, és D t jelöli a két rész rangösszegeinek különbségeit. A pontos p-érték a következő módon érhető el:

$$ p\left( D\ge d; k, n\right)= P\left( D\ge d; k,{n}_1,{n}_2\right)={\displaystyle \sum_{i=-{n}_1\left( k-1\right)}^{n_1\left( k-1\right)} p\left({D}_1= i; k,{n}_1\jobbra)}\alkalommal p\balra({D}_2\ge \balra( D – i\jobbra); k,{n}_2\right), $$

ahol – amint azt az összegzés alsó határa jelzi – a számítást a p-érték kifejezés, amely lehetővé teszi a negatív d. a pontos módszer egyedülálló és hasznos tulajdonsága, amelyet a tárgyalt hozzávetőleges módszerek nem osztanak meg, az, hogy könnyen kiszámítható p-érték valószínűségek egyenlőtlen blokkméretekkel rendelkező terveknél k; például olyan tervek, amelyekben n 1 sorai vannak {1, 2,…, k 1}, és n 2 sorai {1, 2,…, K 2}, val vel k 1 ons 2. Egy általános kifejezés a pontos p-érték kiszámítására hiányos tervekben J egyenlőtlen méretű részekkel

$$ \begin{array}{l} p\left( D\ge d;{k}_1,{n}_1,{k}_2,{n}_2,\cdots, {k}_j,{n}_j\right)={\displaystyle \sum_{i_1=-{n}_1\left({k}_1-1\right)}^{n_1\bal({k}_1-1\jobb)}{\displaystyle \sum_{i_2=-{n}_2\bal({k}_2-1\jobb)}^{n_2\bal({k}_2-1\jobb)}\cdots {\displaystyle \sum_{I_{J-1}=-{N}_{J-1}\Bal({k}_{j-1}-1\jobb)}^{n_{J-1}\Bal({k}_{j-1}-1\jobb)}} p\BAL({D}_1={I}_1;{K}_1,{n}_1\jobb) \alkalommal }}\ \\ {}\kern4.25em \\ {}\kern4em p\BAL({D}_2={I}_2;{k}_2,{n}_2\jobb)\alkalommal \cdots \alkalommal p\BAL({D}_{J-1}={i}_{j-1};{k}_{j-1},{n}_{j-1}\jobb)\alkalommal p\BAL({D}_j\ge \BAL( d-{i}_1-{i}_2\cdots -{I}_{j-1}\jobb);{k}_j,{n}_j\jobb),\end{array} $$

ahol J T = 1 D T = D, és egy példa, amelyben n három részre van felosztva, mindegyik egyedi értéke k (k 1, K 2, K 3),

$$ \begin{array}{l} p\left( D\ge d;{k}_1,{n}_1,{k}_2,{n}_2,{k}_3,{n}_3\jobbra)={\displaystyle \sum_{i=-{n}_1\balra({k}_1-1\jobbra)}^{n_1\balra({k}_1-1\jobbra)}{\displaystyle \sum_{j=-{n}_2\balra({k}_2-1\jobbra)}^{n_2\bal({k}_2-1\jobb)} p\BAL({D}_1= i;{k}_1,{n}_1\jobb) \alkalommal }}\\ {}\\ {}\kern13.5em P\BAL({D}_2= j;{k}_2,{n}_2\jobb)\alkalommal p\BAL({D}_3\ge \BAL( d – I – j\jobb);{k}_3,{n}_3\jobb).\end{array} $$

bár az összegfüggvények lassítják a számítást, a pontos p-érték kiszámításának ez az egyedülálló tulajdonsága lehetővé teszi érvényes egyidejű szignifikancia tesztek elvégzését, amikor néhány blokkon belüli sor hiányzik a tervezésből. Az ilyen teszteket nehéz lenne elvégezni a nagy mintájú közelítési módszerek egyikével. Empirikus példát adunk az alkalmazás részben.

pontos és közepes p-értékek

mivel a páros különbségek a D = támogatásával szimmetrikusan eloszlanak nulla körül a H 0 alatt, az egyoldalú p-érték megduplázása a legtermészetesebb és legnépszerűbb választás egy közönséges egzakt teszthez. A pontos p-értéket használó teszt garantálja, hogy az I. típusú hiba elkövetésének valószínűsége nem haladja meg a névleges szignifikancia szintet. Mivel azonban az I. típusú hibaarány mindig a névleges szint alatt van, a szignifikancia teszt pontos p-érték konzervatív megközelítés a teszteléshez, különösen, ha a teszt nagyon diszkrét eloszlást tartalmaz . A középső p-érték, amelyet általában a megfigyelt statisztika valószínűségének feleként határoznak meg, plusz a szélsőségesebb értékek valószínűsége, azaz

$$ {p}_{\mathrm{mid}}\left( D\ge d; k, n\right)={\scriptscriptstyle \frac{1}{2}} p\left( D= D\right)+ P\left( D> d\right), $$

enyhíti ezt a problémát. A középső p-érték mindig közelebb van a névleges szinthez, mint a pontos p-érték, annak rovására, hogy alkalmanként meghaladja a névleges méretet.

kötött rangsor

a középső p-érték használható a kötött rangsor kezelésére is. Amikor a kötések blokkokon belül fordulnak elő, a midrank (azaz a rangok átlaga) általában minden kötött értékhez hozzá van rendelve. Ha a kötött rangok eredményeként a megfigyelt rangösszeg-különbség d plusz 0,5 egész érték, akkor a p-érték a szomszédos D és d + 1 egész számok pontos p-értékeinek átlaga, azaz $ {\scriptscriptstyle \frac{1}{2}}\left,$, és ez egyenértékű a középső p-értékkel. Meg kell jegyezni, hogy a kapott valószínűség nem pontosan érvényes. A pontos p-értékek bizonyos események pontos gyakorisági valószínűségeit jelentik, a középső p-értékeknek pedig nincs ilyen frekvenciaértelmezésük. Érvelhetünk azonban azzal, hogy ez az értelmezési hátrány kevés gyakorlati aggodalomra ad okot, és hogy a mid p-értékek használata szinte pontos gyakorisági megközelítés. A kapcsolatok egyéb kezeléseinek megvitatására a rangtesztekben, lát .

Company Pride