pontos p-értékek a Friedman-rangösszegek páros összehasonlításához, az osztályozók összehasonlításához
- Friedman-adatok
- nullhipotézis
- Friedman-teszt statisztika
- páronkénti összehasonlító tesztek és hozzávetőleges kritikus különbség
- statisztikai teljesítmény és alternatív vizsgálatok
- pontos Eloszlás és gyors p-érték számítás
- szoftver implementáció
- hiányos rangsor
- pontos és közepes p-értékek
- kötött rangsor
Friedman-adatok
a Friedman-teszt elvégzéséhez a megfigyelt adatok teljes kétirányú elrendezés formájában vannak elrendezve, mint az 1a táblázatban, ahol a k sorok a csoportokat (osztályozókat), az n oszlopok pedig a blokkokat (adatkészleteket) képviselik.
az adatok n blokkból állnak, minden blokkon belül k megfigyeléssel. Feltételezzük, hogy a különböző blokkokban végzett megfigyelések függetlenek. Ez a feltételezés nem vonatkozik a K megfigyelések egy blokkon belül. A vizsgálati eljárás a blokkon belüli függőségek ellenére is érvényes marad . A Friedman-teszt statisztikáját rangsorolt adatok alapján határozzák meg, így hacsak az eredeti nyers adatok nem egész értékű rangpontok, a nyers adatokat rangsorolják. Az 1B táblázat rangbejegyzéseit úgy kapjuk meg, hogy először a nyers adatokat rendezzük {x ij ; i = 1,…, n, j = 1,…, k} az 1a táblázatban oszloponként a legkisebbtől a legnagyobbig, az egyes n blokkokon belül külön-külön és függetlenül, majd az 1,…, K egész számokat hozzárendeljük a blokkon belüli K megfigyelések rangpontszámaihoz. Bármely J csoport sorainak sorösszege az R J = 6 n i = 1 r ij.
nullhipotézis
a Friedman-teszt általános nullhipotézise az, hogy az összes k blokkolt minta, mindegyik n méretű, azonos, de meghatározatlan populáció-eloszlásból származik. Ennek a nullhipotézisnek a részletesebb meghatározásához x ij jelöljön egy véletlen változót ismeretlen kumulatív eloszlási függvénnyel F ij, x IJ pedig X IJ megvalósítását .
a nullhipotézis kétféleképpen definiálható, attól függően, hogy a blokkok fixek vagy véletlenszerűek . Ha a blokkok fixek, akkor az összes k 6 n mérési érték Független. Ha vannak k csoportok véletlenszerűen hozzárendelve a tartáshoz K független X ij minden blokkon belül, mint egy randomizált teljes blokktervben, akkor az a nullhipotézis, miszerint a k csoportok azonos eloszlásúak, megfogalmazható:
H 0: F i1(x) = … = F ik (x) = F I (x) minden egyes i = 1,…, n,
ahol F i (x) a megfigyelések eloszlása az i-edik blokkban . Ugyanezt a hipotézist kapjuk, de konkrétabb, ha feltételezzük, hogy a szokásos additív modell generálta az x ij-t a kétirányú elrendezésben . Az additív modell a mérési értékre gyakorolt teljes hatást bontja le egy teljes hatásra, az I. blokk hatásra, az I. blokk hatásra és a J csoport hatásra, a J. csoport hatásra . Ha az eloszlásfüggvényt F ij (x) = F(x − 6 − i − j) jelöljük, akkor a K csoportok közötti különbség nélküli nullhipotézis
az Általános alternatív hipotézis pedig
\( {H}_1:\kern0.5EM {\tau}_{j_1}\ne {\tau}_{j_2} \) legalább egy (j 1, J 2) pár számára.
vegye figyelembe, hogy ez az ábrázolás azt is állítja, hogy az alapul szolgáló eloszlási függvények F i1(x),…, F ik (x) az I blokkon belül ugyanazok, azaz F I1(x) = … = F ik (x) = F I (x), minden rögzített i = 1,…, n.
Ha a blokkok véletlenszerűek, akkor ugyanazon véletlenszerű blokk mérései pozitívan korrelálnak. Például, ha egyetlen alany alkot egy blokkot, és k megfigyelést végeznek az alanyon, esetleg randomizált sorrendben, akkor a blokkon belüli megfigyelések függenek. Ez a függőség egy ismételt mérési tervben fordul elő, ahol n alanyt figyelnek meg, és mindegyik alanyt k körülmények között tesztelik. Jelölje az I. blokkon belüli megfigyelések közös eloszlási függvényét F I-vel (x 1, …, x k ). Ezután a K csoportok közötti különbségek nélküli nullhipotézis az X I1, …, X ik véletlen változók kicserélhetőségének hipotézise , amelyet
h 0-ként fogalmaznak meg : F i (x 1, …, x k ) = F I (x 6), …, x 6(k)) az i = 1, …, n,
esetében, ahol a(1),…,…, k) minden 1,…, k permutációját jelöli. A hipotézis alapjául szolgáló modell az, hogy a véletlen változók X ij cserélhető eloszlással rendelkezik. Ez megfelelő modell az ismételt intézkedésekhez, ahol nem helyénvaló függetlenséget vállalni egy blokkon belül . Azt is megjegyezzük, hogy a nullhipotézisnek ez a megfogalmazása és a rögzített blokkokra vonatkozó megfogalmazása konzisztens ugyanazon alternatívával szemben, nevezetesen a H 0 tagadása. A kérdés részletes megvitatását lásd:.
függetlenül attól, hogy a blokkok fixek vagy véletlenszerűek-e, ha a nullhipotézis igaz, akkor az 1,…, k összes permutációja egyformán valószínű. Vannak k ! az egyes blokkokon belüli K csoportokhoz k rang pontszámok hozzárendelésének lehetséges módjai, és ezek a blokkon belüli permutációk h 0 alatt egyenértékűek. Mivel ugyanaz a permutációs argumentum vonatkozik az egyes n független blokkokra, vannak (k !) n egyformán valószínű rang konfigurációk a rang pontszámok r ij a kétirányú elrendezés . Ezen permutációk mindegyikének valószínűsége (k !)- n megvalósul. Ez a funkció az R J rangösszegek null eloszlásának értékelésére szolgál, a rangok kétirányú elrendezésének összes permutációjának felsorolásával.
Friedman-teszt statisztika
a Friedman-nullhipotézis szerint az egyes csoportok sorainak várható sorösszege egyenlő n(k + 1) / 2. A Friedman-teszt statisztikája
összegzi az egyes csoportok megfigyelt rangösszegeinek négyzetbeli eltéréseit, R j, az egyes csoportok közös várható értékétől, n (k + 1) / 2, feltételezve, hogy a k csoport eloszlása azonos. A K és n kis értékek esetében az X 2 r pontos eloszlását például Friedman javasolta . A Friedman rangösszegek pontos közös eloszlásának kiszámítására szolgáló algoritmust a null alatt tárgyaljuk . Két párosított minta speciális esetét lásd:.
a tesztstatisztika kiszámítása a (k !) n lehetséges permutációk időigényes, ha k nagy. Friedman azonban kimutatta, hogy mivel n hajlamos a végtelenre, X 2 r eloszlásban konvergál a következőre: 6 DF = K − 1 , egy khi-négyzet véletlen változó K − 1 szabadságfokkal. Ezt az eredményt az aszimptotikus Friedman-tesztben használják. A Friedman-teszt elutasítja a H 0-t egy előre meghatározott szignifikancia szinten, ha a tesztstatisztika X 2 r meghaladja az X 2 r korlátozó khi-négyzet eloszlásának 100 (1-6)percentilisét k-1 szabadságfok. A tesztstatisztikát ki kell igazítani, ha a blokkokon belül kötött sorok vannak . A Friedman-teszt különféle módosításait is javasolták, például A F eloszlás a chi-négyzet eloszlás alternatívájaként, valamint általánosítások, például a Skillings-Mack teszt statisztika hiányzó adatok jelenlétében történő felhasználásra. Ezeket, valamint a Friedman-teszt különböző egyéb kiigazításait és nem paraméteres versenytársait (pl. Kruskal-Wallis, Quade, Friedman igazított rangok teszt) itt nem tárgyaljuk (lásd ).
páronkénti összehasonlító tesztek és hozzávetőleges kritikus különbség
gyakran előfordul, hogy a kutatók nem csak a csoportok egyenlőségének globális hipotézisének tesztelésére törekszenek, hanem, vagy még inkább, a csoportok egyenlőségének egyenlőségére vonatkozó következtetésekre is. Továbbá, még akkor is, ha az embert elsősorban a H 0 érdekli, és a hipotézist elutasítják, nyomon követési elemzést lehet végezni az elutasítás lehetséges okainak meghatározására. Az ilyen elemzés felfedheti a csoportkülönbségeket, de azt is felfedheti, hogy a párok egyike sem különbözik jelentősen, a globálisan jelentős teszteredmény ellenére.
ezeknek a kérdéseknek a kezelésére célszerű az egyenlőség hipotéziseinek tesztelése csoportpárok számára egyidejű összehasonlító tesztek segítségével. Ezek a többszörös összehasonlítási eljárások magukban foglalhatják 1-ben (vagy sok-egy) összehasonlítások, az összes nem kontrollcsoport egyenlőségének K − 1 hipotéziseinek tesztelése a vizsgálati kontroll ellen, vagy N-ben N (összes pár) összehasonlítások, figyelembe véve k(k-1)/2 az összes csoportpár közötti egyenlőség hipotézisei. Mindkét típusú összehasonlításhoz nagy mintájú hozzávetőleges teszteket terveztek. Ezek abból a helyzetből származnak, amikor n, a blokkok száma (azaz a minta mérete) nagy.
a 2.táblázat a kritikus különbség (CD) közelítő tesztjeit mutatja be a Friedman-rangok 1. számú és N. számú összehasonlításához, amint azt a gyakran idézett monográfiák és tanulmányok, valamint a nem paraméteres statisztikákról szóló népszerű tankönyvek javasolják. A kritikus különbség a rangösszegek minimálisan szükséges különbsége ahhoz, hogy egy csoportpár az előre meghatározott alfa szignifikancia szinten eltérjen. Meg kell jegyezni, hogy sok publikációban a CD-statisztikát a rangösszeg átlagainak különbsége alapján számítják ki, azaz RJ /n, nem pedig rangösszegek. Az eredmények azonosak, mivel minden csoportnak n megfigyelése van, ha a tesztstatisztikai képleteket megfelelően módosítják.
Ha a n független rangsorban a rangok egyenlőségének nullhipotézise igaz, és a nagy mintaméret feltétele a következő: met, a rangösszegek különbségei megközelítőleg normálisan oszlanak meg. Legyen d = R i-R j , i-vel j, legyen a rang összege különbség egy pár csoport között i és j. a rang összege különbség támogatása d a lezárás . A nullhipotézis szerint a várható érték E(d) = 0 és a variancia Var(d) = nk (k + 1)/6 . Mivel a D eloszlása szimmetrikus körül E (d) = 0, a ferdeség nulla, mint minden páratlan rend pillanat. A kurtosis együttható, amelyet Whitfield vezet le
kevesebb, mint 3 (azaz negatív felesleges kurtosis), ami azt jelenti, hogy a diszkrét rangösszegkülönbség-eloszlásnak vékonyabb a farka mint a normális. Figyeljük meg azonban, hogy a kurtosis hajlamos 3 növekvő n, így a normális közelítés ésszerű. Ez azt jelenti, hogy d aszimptotikus n(0, Var( d)) eloszlású, és hogy a normális eltérés \ (d/\sqrt{\mathrm{Var} (d)} \) aszimptotikusan N (0, 1).
mint a 2. táblázatban látható, a normál hozzávetőleges tesztet különböző szerzők javasolják, amikor az összes csoportot páronként kell összehasonlítani. Azt is tárgyalja Demo-nak, mint tesztstatisztikát, amelyet akkor kell alkalmazni, ha az összes csoportot egyetlen kontrollal hasonlítják össze. Vegye figyelembe, hogy a szokásos vizsgálati eljárások a családonkénti I. típusú hibaarányt úgy szabályozzák, hogy a teljes szignifikanciaszintet elosztják az elvégzett összehasonlítások számával (azaz c 1 az 1-ből n, c 2 az N-ből N N összehasonlítások). Ennek a Bonferroni típusú korrekciónak erősebb versenytársai vannak, mint például a Holm, Hochberg és Hommel eljárások. Az Általános hamis pozitív hibaarány ellenőrzésére szolgáló módszereket ez a dokumentum nem részletezi. Oktatóanyagért az osztályozó összehasonlításának területén, lásd Derrac et al. .
a szokásos normál közelítés mellett egyidejű teszteket javasoltak, amelyek kihasználják a rangösszegek közötti különbségek értékeinek eloszlásának kovariancia szerkezetét. Míg az n rangsor egymástól független a H 0 alatt, a rangösszegek és a rangösszegkülönbségek is függenek és korrelálnak. A rangösszeg-különbségek közötti korreláció az érintett rangösszegektől függ. Pontosabban, amint Miller jelentette , amikor a nullhipotézis igaz
ezért a korreláció nulla a rang összegbeli különbségek párjai esetén, ahol nincs közös csoport, és 0,5 a különbségek párjai esetén, ahol egy csoport közös mindkét különbségre. A korrelált párok száma csökken k növekedésével. A K csoportokat érintő vizsgálat esetében a korrelált párok aránya 4/(k + 1) . Ezért amikor k = 7, például a párok 50% – a korrelál, de amikor k = 79 csak 5% korrelál.
amint azt különböző tanulmányok (pl.,) megjegyezték, 1 db n összehasonlításnál ez a korrelációs struktúra azt jelenti, hogy amikor H 0 igaz és n végtelenre hajlik, a K − 1 csoport rangösszegek és a kontroll rang összeg közötti különbségek eloszlása egybeesik egy aszimptotikus (k − 1) -variálja a normál eloszlást nulla átlaggal. A kritikus különbség értéke tehát közelíthető a 2. táblázatban CD M címkével ellátott tesztstatisztikával, ahol az állandó \( {m}_{\alpha, df= k-1,\rho ={\scriptscriptstyle \ frac{1}{2}}} \) A (k − 1) egyenlően Korrelált n(0,1) véletlen változók maximális értékének eloszlásának felső ath percentilis pontja közös korrelációval \( \rho ={\scriptscriptstyle \frac{1}{2}}. \ ) Az eljárás egy aszimptotikus családonkénti hibaarány egyenlő 6 fővel .
N (N) N összehasonlítás esetén ez azt jelenti, hogy a rangösszegbeli különbségek kovarianciája megegyezik a K független, nulla középértékű és NK(k + 1)/12 varianciájú véletlen változók közötti különbségek kovarianciájával. Így a \( max\left\{\left|{R}_i-{R}_j\right|\right\}/\sqrt{nk\left( k+1\right)/12} \) aszimptotikus eloszlása egybeesik a K független n (0, 1) véletlen változók tartományának(Q k, ons) eloszlásával. A kapcsolódó tesztstatisztika az CD Q, ahol az állandó q (DF = k), DF = k, (k) szabadsági fokokkal rendelkező Studentizált tartomány (q) Eloszlás felső ATH percentilis pontja . Ismét, mivel a teszt az összes k csoport abszolút különbségét egyszerre veszi figyelembe, az aszimptotikus családonként hibaarány egyenlő 6 .
maga a Friedman statisztikai teszt eredményezi a 2.táblázat alsó sorában említett egyidejű tesztet. A nullhipotézis akkor fogadható el, ha a rangösszegek különbsége nem haladja meg a kritikus értéket \( C{D}_{\chi^2}. \ ) Ez az aszimptotikus khi-négyzet közelítés ajánlott néhány népszerű tankönyvben, bár Miller azzal érvelt, hogy a valószínűségi állítás nem a legélesebb teszt.
statisztikai teljesítmény és alternatív vizsgálatok
vegye figyelembe, hogy a 2.táblázatban bemutatott CD-tesztstatisztikák nem igényelnek információt a kísérletben meghatározott blokkokon belüli rangokról. Inkább az egyidejű rangtesztek feltételezik, hogy az egyes blokkokon belül minden megfigyelésnek ugyanolyan valószínűséggel van elérhető rangja. Ha ez igaz, a mennyiség (k + 1) (k − 1)/12 a blokkon belüli rangok varianciája, az nk (k + 1)/6 pedig a két rangösszeg közötti különbség varianciája . Ezért a D null eloszlása a populációban nulla átlaggal és ismert szórással rendelkezik. Ez a pontos oka annak, hogy a normál hozzávetőleges tesztek A Z-pontszámot használják tesztstatisztikaként. Fontos azonban ebben az összefüggésben hangsúlyozni, hogy a négyzetgyök nak, – nek nk(k + 1)/6 a szórása d ha az Általános nullhipotézis igaz, de nem akkor, ha hamis. A p-értékekhez hasonlóan csak egy adott modellben, azaz H 0; olyan modell, amely igaz lehet vagy nem. Ha a nullhipotézis hamis, az nk(k + 1)/6 mennyiség általában a variancia túlbecslése, és ez egyidejű, hozzávetőleges és pontos teszteket eredményez.
rendelkezésre állnak páros összehasonlító tesztek a Friedman rangösszegekre vonatkozóan, amelyeket a megfigyelt rangeredmények alapján számítanak ki, nem pedig a rangösszegek alapján. Ezek a tesztek, mint például a Rosenthal-Ferguson teszt és a népszerű Conover teszt, a T-pontszámot használják tesztstatisztikaként. A páros t-tesztek gyakran erősebbek, mint a fent tárgyalt egyidejű tesztek, azonban vannak hátrányai is. Röviden, A Rosenthal-Ferguson-teszt a megfigyelt varianciákat és kovarianciát használja az egyes csoportpárok rangsorolási pontszámainak, hogy megkapja a standard hiba nak, – nek d a páronkénti rangösszeg különbség szignifikanciájának tesztjéhez. Ez a standard hiba érvényes, függetlenül attól, hogy a páros különbség nélküli nullhipotézis igaz-e vagy sem. A teszt formális korlátozása mellett azonban n nagyobbnak kell lennie, mint k + 1, a variancia nak,-nek d rosszul becsülhető meg, mivel általában kevés szabadságfok áll rendelkezésre a (társ)variancia becsléséhez kis mintájú Friedman-tesztalkalmazásokban. Ezenkívül a megfigyelt (Társ)varianciák minden csoportpár esetében eltérőek. Következésképpen nem következik egy adott a rangösszeg különbségének jelentőségéből egy másik B rangösszegtől, hogy egy harmadik C rangösszeg, amely jobban különbözik az A-tól, mint B, szintén jelentősen eltérne. Ez a teszt kellemetlen jellemzője.
a Conover-teszt becsüli a D szórását egy összesített standard hiba kiszámításával az összes csoport megfigyelt rangpontszámainak (Társ)varianciáiból, ezáltal növelve a statisztikai teljesítményt. A módszer hasonló Fisher védett legkevésbé szignifikáns különbség (LSD) tesztjéhez, amelyet a rangsorolási pontszámokra alkalmaznak. Ebben a módszertanban a p-értékek többszörös tesztelésére nem kerül sor, hogy megőrizzék a családonkénti hibaarányt a nominális szignifikancia szintjén. Inkább a teszt védett abban az értelemben, hogy nem végeznek páros összehasonlításokat, hacsak a teljes tesztstatisztika nem jelentős. A Fisher által védett LSD eljáráshoz hasonlóan a Conover-tesztnek az a tulajdonsága, hogy a teljes teszt megfigyelt F-értékét beépíti a következtetési döntési folyamatba. A Fisher által védett LSD-vel ellentétben, amely a megfigyelt F-értéket csak 0-1 (‘go/no go’) módon használja, a Conover-teszt az F-értéket zökkenőmentesen használja az LSD kiszámításakor. Vagyis az a szokatlan jellemzője, hogy minél nagyobb a teljes tesztstatisztika, annál kisebb a legkevésbé szignifikáns különbségi küszöb a rangösszeg-különbség szignifikánsnak nyilvánításához. A Duncan-Waller tesztnek ugyanaz a jellemzője, de ez a teszt a Bayes-féle megközelítést támogatja a Bayes LSD-vel való többszörös összehasonlításhoz. Mivel a második szakaszban az összehasonlító tesztek az első szakasz eredményétől függenek, a páros Conover-tesztben használt névleges alfa-szintnek nincs valós valószínűségi jelentése a frequentista értelemben. Conover és Iman szerint (: 2), “Mivel a második szakasz tesztjének 6.szintje általában nem ismert, ez már nem a szokásos értelemben vett hipotézis teszt, hanem csupán egy kényelmes mérce egyes kezelések elválasztására másoktól.”
pontos Eloszlás és gyors p-érték számítás
pontos tesztet mutatunk be a Friedman-rangösszegek egyidejű páros összehasonlítására. A pontos nulleloszlást a valószínűséggeneráló függvény módszerével határozzuk meg. A generáló függvények elegáns módot nyújtanak az eloszlásmentes tesztstatisztikák valószínűségi vagy frekvenciaeloszlásainak megszerzésére . A generáló függvény módszer alkalmazása a következő tételt eredményezi, amelynek igazolása az 1.kiegészítő fájlban található.
1. tétel n kölcsönösen független egész értékű rangsor esetén, mindegyik egyformán valószínű rangsorolási pontszámmal 1-től k-ig terjed, a pontos valószínűség a páros különbség megszerzéséhez d bármely két rangösszegre egyenlő
$$ p\left( D= D; K, N \ right), $ $ $ $ p \ left (D = D;>
ahol
a különböző módok a rangösszeg különbsége d felmerülhet, Val Vel d támogatása van d = .
az 1. Kiegészítő fájl zárt formájú kifejezést is kínál a pontos p-értékére d.A p-értéket úgy definiáljuk, mint annak valószínűségét, hogy legalább olyan szélsőséges eredményt kapjunk, mint a megfigyelt, tekintettel arra, hogy a nullhipotézis igaz. Ezt úgy kapjuk meg, mint az összes lehetséges d valószínűségének összegét ugyanarra a k-ra és n-re, amelyek ugyanolyan valószínűek vagy kevésbé valószínűek, mint a null alatti d megfigyelt értéke. A pontos p-értéket jelöljük P(D! D); k, n), és a
a pontos p-érték kiszámítása ezzel a hármas összegzési kifejezéssel nagyságrendek gyorsulását eredményezi az összes lehetséges kimenetel és valószínűségük teljes felsorolásánál brute-force permutációs megközelítéssel. Nagyobb n értékek esetén azonban a pontos számítás kissé időigényes, és az egzakt tesztek elvégzésének gyakorlati tartományának kiterjesztése érdekében kívánatos a p-érték hatékonyabb kiszámítása.
Továbbá, mivel a gyakorlatban több összehasonlító teszt abszolút különbségekkel foglalkozik, célszerű kiszámítani a rangsorösszegek közötti különbségek abszolút értékének kumulatív valószínűségét. Mivel a tömegpontok száma a szimmetrikus Eloszlás nak, − nek d a forma egész száma 2N(k-1) + 1, az eloszlásnak páratlan számú valószínűsége van. Ez azt jelenti, hogy mivel a D valószínűségi tömegfüggvénye nulla körül szimmetrikus, a D = 0-tól balra eső valószínűségi tömeg áthajtható, ami a nem negatív d összehajtott eloszlását eredményezi. Következésképpen a nem negatív d egyoldalú p-értéke a D = 1, …, n(k-1) tartományban megkapható a szimmetrikus Eloszlás két egyoldalú p-értékének összegeként d = támasztékkal . Mivel az egyoldalú p-érték megkétszerezése D = 0-ra olyan P-értéket eredményez, amely meghaladja az egységet, a d = 0 (csak) p-értékét P-ként számítjuk ki(D 0); k, n) = P(D = 0) + P(D 1), és ez pontosan egyenlő 1-vel.
a számítás felgyorsítása érdekében átalakítjuk a kettős összegzést az I és j indexek felett a P kifejezésben (d) d; k, n) egyetlen index összegzésére, s mondjuk, a 2. tétel használatával. A bizonyítékot a 2. Kiegészítő fájl tartalmazza.
2. tétel d és k nem negatív egész számokra
Ez az egyösszegű függvényre történő redukció azt jelenti, hogy a p-érték alternatívaként kiszámítható a sokkal egyszerűbb kifejezésből
és, mint megmutatjuk, még nagyobb n értékekre is számítási gyorsasággal.
szoftver implementáció
bár a pontos p-érték két kifejezése matematikailag helyes, az egyszerű számítás számítási hibákat eredményezhet. Még mérsékelt értékek esetén is n (20 vagy úgy), a binomiális együttható, amelynek van d Az indexekben rendkívül nagy lehet, és ezeknek a számoknak a későbbi szorzáshoz való tárolása numerikus túlcsordulást eredményez a rögzített pontosságú aritmetika pontossági korlátozása miatt. A hiba kezelésének egyik módja egy olyan ismétlődési reláció használata, amely kielégíti a generáló függvényt . Az általunk vizsgált rekurziók számítási szempontból drágák voltak, kivéve a kis értékeket n és / vagy k. a pontos p-érték helyes kiszámításának gyorsabb módja az önkényes pontosságú aritmetikai számítás használata olyan számok kezelésére, amelyek tetszőleges nagy méretűek lehetnek, csak a rendelkezésre álló számítógép memóriája korlátozza.
A D és n abszolút rangösszeg különbség p-értékének kiszámítása R-ben történik . Az R kód, amely megköveteli a csomag Rmpfr nagy pontosságú számtani kell telepíteni, van további Fájl 3. A pexactfrsd címkével ellátott szkript kiszámítja a pontos p-értéket P(D ++ |d|), és emellett lehetőséget ad a valószínűség kiszámítására P (D = |d|), valamint a D (azaz W(D = |d|) és W(D ++ |d|)) kompozícióinak (kumulatív) számát. Az R kód és a lehetséges jövőbeli frissítések a http://www.ru.nl/publish/pages/726696/friedmanrsd.zipcímen is elérhetők.
a levezetések szemléltetésére a 4. Kiegészítő fájl egy kis méretű numerikus példát kínál (k = 3, n = 2), az 5 .Kiegészítő fájl pedig táblázatba foglalja a D kompozícióinak számát A K = n = 2,…, 6 kombinációihoz az OEIS-be való felvételhez. Amint az az 5. további fájlban is látható, n kis értékei esetén d kibontott, szimmetrikus eloszlása bimodális, + 1 és − 1 módokkal . Ez a tulajdonság gyorsan eltűnik, ahogy n növekszik, különösen a k > 2 N 6-nál.
a továbbiakban, hacsak másként nem jelezzük, a D rangösszeg − különbség értékét nullának vagy pozitívnak tekintjük, 0-tól n-ig(k-1), és így az abszolút érték szimbólumot d körül dobjuk.
hiányos rangsor
mivel az n rangsor {1,2,…,k} egymástól független, két (vagy több), egyenlő vagy egyenlőtlen méretű részre oszthatjuk őket, (D 1; k, n 1) és (D 2; k, n 2) jelöléssel, 2 t = 1 D T = D, és D t jelöli a két rész rangösszegeinek különbségeit. A pontos p-érték a következő módon érhető el:
ahol – amint azt az összegzés alsó határa jelzi – a számítást a p-érték kifejezés, amely lehetővé teszi a negatív d. a pontos módszer egyedülálló és hasznos tulajdonsága, amelyet a tárgyalt hozzávetőleges módszerek nem osztanak meg, az, hogy könnyen kiszámítható p-érték valószínűségek egyenlőtlen blokkméretekkel rendelkező terveknél k; például olyan tervek, amelyekben n 1 sorai vannak {1, 2,…, k 1}, és n 2 sorai {1, 2,…, K 2}, val vel k 1 ons 2. Egy általános kifejezés a pontos p-érték kiszámítására hiányos tervekben J egyenlőtlen méretű részekkel
ahol J T = 1 D T = D, és egy példa, amelyben n három részre van felosztva, mindegyik egyedi értéke k (k 1, K 2, K 3),
bár az összegfüggvények lassítják a számítást, a pontos p-érték kiszámításának ez az egyedülálló tulajdonsága lehetővé teszi érvényes egyidejű szignifikancia tesztek elvégzését, amikor néhány blokkon belüli sor hiányzik a tervezésből. Az ilyen teszteket nehéz lenne elvégezni a nagy mintájú közelítési módszerek egyikével. Empirikus példát adunk az alkalmazás részben.
pontos és közepes p-értékek
mivel a páros különbségek a D = támogatásával szimmetrikusan eloszlanak nulla körül a H 0 alatt, az egyoldalú p-érték megduplázása a legtermészetesebb és legnépszerűbb választás egy közönséges egzakt teszthez. A pontos p-értéket használó teszt garantálja, hogy az I. típusú hiba elkövetésének valószínűsége nem haladja meg a névleges szignifikancia szintet. Mivel azonban az I. típusú hibaarány mindig a névleges szint alatt van, a szignifikancia teszt pontos p-érték konzervatív megközelítés a teszteléshez, különösen, ha a teszt nagyon diszkrét eloszlást tartalmaz . A középső p-érték, amelyet általában a megfigyelt statisztika valószínűségének feleként határoznak meg, plusz a szélsőségesebb értékek valószínűsége, azaz
enyhíti ezt a problémát. A középső p-érték mindig közelebb van a névleges szinthez, mint a pontos p-érték, annak rovására, hogy alkalmanként meghaladja a névleges méretet.
kötött rangsor
a középső p-érték használható a kötött rangsor kezelésére is. Amikor a kötések blokkokon belül fordulnak elő, a midrank (azaz a rangok átlaga) általában minden kötött értékhez hozzá van rendelve. Ha a kötött rangok eredményeként a megfigyelt rangösszeg-különbség d plusz 0,5 egész érték, akkor a p-érték a szomszédos D és d + 1 egész számok pontos p-értékeinek átlaga, azaz \( {\scriptscriptstyle \frac{1}{2}}\left,\), és ez egyenértékű a középső p-értékkel. Meg kell jegyezni, hogy a kapott valószínűség nem pontosan érvényes. A pontos p-értékek bizonyos események pontos gyakorisági valószínűségeit jelentik, a középső p-értékeknek pedig nincs ilyen frekvenciaértelmezésük. Érvelhetünk azonban azzal, hogy ez az értelmezési hátrány kevés gyakorlati aggodalomra ad okot, és hogy a mid p-értékek használata szinte pontos gyakorisági megközelítés. A kapcsolatok egyéb kezeléseinek megvitatására a rangtesztekben, lát .