Articles

MeasuringU: mi az erős korreláció?

a dohányzás rákot okoz.

a cigarettacímkéken és az egészségügyi szervezetektől kapott figyelmeztetések egyértelműen kijelentik, hogy a dohányzás rákot okoz.

de honnan tudjuk?

a dohányzás megelőzi a rákot (főleg a tüdőrákot). Azok az emberek, akik cigarettáznak, hajlamosak tüdő-és egyéb rákos megbetegedésekre, mint azok, akik nem dohányoznak. Azt mondjuk, hogy a dohányzás korrelál a rákkal. Óvatosan zárja ki az egyéb okokat, és rendelkezik az összetevőkkel az ok-okozati összefüggés megállapításához.

a korreláció szükséges, de nem elegendő összetevő az okozati összefüggéshez. Vagy ahogy kétségtelenül hallottad: a korreláció nem egyenlő az okozati összefüggéssel. A korreláció számszerűsíti a két dolog közötti összefüggést. De a korrelációnak nem kell bizonyítania az okozati összefüggést, hogy hasznos legyen. Gyakran csak egy dolog ismerete megelőzi vagy megjósolja valami mást, nagyon hasznos. Például annak ismerete, hogy az állásjelöltek teljesítménye a munkamintákon megjósolja jövőbeli munkateljesítményüket, segít a vezetőknek a megfelelő jelöltek felvételében. Azt mondanánk, hogy a munkaminta teljesítménye korrelál a munka teljesítményével (előrejelzi), annak ellenére, hogy a munkaminták nem okoznak jobb munkateljesítményt.

a korreláció kiszámításának általános (de nem az egyetlen) módja a Pearson-korreláció (R-vel jelölve), amelyet Karl Pearson az 1880-as évek végén híressé tett (de nem származtatott). a tökéletes pozitív korrelációtól (+1) a tökéletes negatív korrelációig (-1) vagy a korreláció hiányáig (r = 0) terjed. A gyakorlatban az 1 tökéletes korrelációja teljesen felesleges információ, ezért nem valószínű, hogy találkozik vele.

a korrelációs együtthatónak vannak hiányosságai, és nem tekinthető “robusztusnak” olyan dolgokkal szemben, mint a nem normalitás, a nemlinearitás, a különböző varianciák, a kiugró értékek hatása és az értékek korlátozott tartománya. Hiányosságok azonban, ne tegye haszontalanná vagy végzetesen hibássá. Következésképpen, sok tudományágban széles körben használják a kapcsolatok erősségének leírására, mert még mindig gyakran értelmes. Ez egyfajta közös asszociációs nyelv, mivel a korrelációk számos mérésen kiszámíthatók (például két bináris mérték vagy rangsor között).

visszatérve a dohányzás és a rák kapcsolatára, egy becslés egy 25 éves tanulmányból a dohányzás és a tüdőrák közötti összefüggésről az Egyesült Államokban r=.08-alig 0 feletti korreláció. Lehet, hogy ismert egy egész életen át tartó dohányzót, aki nem kapott rákot—szemléltetve azt a pontot (és a korreláció alacsony mértékét), hogy nem mindenki, aki dohányzik (még sokat is) kap rákot.

egyes becslések szerint az egész életen át tartó nehéz dohányosok 75-85% – a nem kap rákot. Valójában a tüdőrákban szenvedő emberek 80-90% – a nem dohányzik, vagy soha nem dohányzik!

de egy tanulmány ritkán az utolsó szó a megállapításról, és biztosan nem korreláció. A dohányzási rák kapcsolat mérésének számos módja van, és a korreláció attól függően változik, hogy kit és hogyan mérnek.

például egy másik, fejlődő országokat vizsgáló tanulmányban a felnőtt lakosság dohányzó százaléka és a várható élettartam közötti összefüggés r = .40, ami minden bizonnyal nagyobb, mint a .08 Az amerikai tanulmányból, de messze van attól a közel tökéletes korrelációtól, amelyet a hagyományos bölcsesség és figyelmeztető címkék jelentenének.

bár a korrelációk nem feltétlenül a legjobb módszer a tevékenységekkel kapcsolatos kockázatok leírására, mégis hasznos a kapcsolat megértésében. De fontos, hogy a korreláció kialakulásának részleteinek megértése és következményeinek megértése kritikus lépés a korrelációk perspektívába helyezésében.

érvényesség vs. Megbízhatósági korrelációk

bár valószínűleg nem a közegészségügyet tanulmányozza, szakmai és személyes élete tele van olyan összefüggésekkel, amelyek két dolgot kapcsolnak össze (például a dohányzás és a rák, a teszteredmények és az iskolai eredmények, vagy a kávéfogyasztás és a jobb egészség). Ezeket a korrelációkat érvényességi korrelációnak nevezzük. Az érvényesség arra utal, hogy valami méri-e azt, amit mérni szándékozik. Azt mondanánk, hogy egy sor interjúkérdés, amely megjósolja a munka teljesítményét, érvényes. Vagy egy használhatósági kérdőív akkor érvényes, ha korrelál a termék feladatának teljesítésével. A korreláció erőssége az érvényességi igény erősségére utal.

a MeasuringU-nál részletesen írunk saját és mások kutatásairól, és gyakran idézünk korrelációs együtthatókat. Azonban nem minden korreláció jön létre egyenlően, és nem mindegyik érvényességi korreláció. Egy másik gyakori korreláció a megbízhatósági korreláció (a válaszok konzisztenciája) és a résztvevők ugyanazon mintájából származó korrelációk (monometódus korrelációk). A monometódus korrelációkat könnyebb összegyűjteni (csak egy adatmintára van szükség), de mivel az adatok ugyanazon résztvevőktől származnak, a korrelációk általában felfújódnak. A megbízhatósági összefüggéseket általában gyakran jelentik a szakértői véleményekben, és általában sokkal magasabbak is, gyakran r > .7. Ezeknek a magasabb korrelációknak a rendelkezésre állása hozzájárulhat ahhoz az elképzeléshez, hogy a korrelációk, például r =.3 vagy akár r = .1 értelmetlen.

például azt találtuk, hogy a Net Promoter pontszám teszt-újratesztelési megbízhatósága r = .7. Példák a monometódus korrelációra az SUS és az NPS közötti korreláció (r = .62), az egyes SUS tételek és a teljes sus pontszám között (r = .9), és a sus és az UMUX-Lite között (r = .83), mind ugyanabból a mintából és a résztvevőkből gyűjtötték össze. Ezek szintén legitim érvényességi korrelációk (ún egyidejű érvényesség), de általában magasabbak, mert a kritérium és a predikciós értékek ugyanabból a forrásból származnak.

érvényességi korrelációs együtthatók értelmezése

sok mezőnek megvan a saját konvenciója arról, hogy mi minősül erős vagy gyenge korrelációnak. Ban, – ben viselkedéstudományok az egyezmény (nagyrészt Cohen állapította meg) az összefüggések (mint a hatásméret mértéke, amely magában foglalja az érvényességi összefüggéseket is) felett .5 “nagy”, körül .3 “közepes”, és .10 alatt pedig ” kicsi.”

A Cohen-féle egyezményt használva azonban a dohányzás és a tüdőrák közötti kapcsolat gyenge az egyik vizsgálatban, és talán közepes a másikban. De még a viselkedéstudományokon belül is, a kontextus számít. Még egy kis összefüggés a következményes eredménnyel (a pszichoterápia hatékonysága) még mindig élet-halál következményekkel járhat.

a korreláció négyszögesítése (az úgynevezett determinációs együttható) egy másik általános gyakorlat a korreláció (és a hatásméret) értelmezésében, de alábecsülheti a változók közötti kapcsolat erősségét is, és gyakran a standard r használatát részesítik előnyben. A korrelációk értelmezésének további módjait egy későbbi cikkben fogjuk megvizsgálni.

több tudományágban összegyűjtöttem az érvényességi korrelációkat több publikált cikkből (sok metaanalízisből), amelyek magukban foglalják az orvosi és pszichológiai hatásokat, a munkateljesítményt, a főiskolai teljesítményt, valamint a saját kutatásunkat az ügyfelek és a felhasználók viselkedéséről, hogy kontextust biztosítsunk az érvényességi korrelációkhoz. A táblázatban szereplő tanulmányok közül sok Meyer befolyásos cikkéből származik et al. (2001).

Description Correlation
Aspirin and reduced risk of heart attack 0.02
Ever Smoking and Lung Cancer after 25 years 0.08
College Grades and Job Performance 0.16
Years of Experience & Job Performance 0.18
SAT pontszámok és kumulatív GPA a Pennsylvaniai Egyetemen (fehér & Ázsiai hallgatók) 0,20
HS osztály rang és kumulatív GPA a Pennsylvaniai Egyetemen (fehér & Ázsiai hallgatók) 0,26
pszichoterápia és az azt követő jólét 0,32
nyers nettó promoter pontszámok és a jövőbeni cég bevétel növekedése 14 iparágban 0,35
gre kvantitatív érvelés és MBA GPA 0.37
strukturálatlan állásinterjúk és munkateljesítmény 0.38
Viagra és jobb szexuális működés 0.38
magasság és súly 639 bangladesi diákok (átlagos férfiak és nők) 0.38
múltbeli viselkedés a jövőbeli viselkedés előrejelzőjeként 0.39
a felnőtt lakosság% – a dohányzik és a várható élettartam a fejlődő országokban 0.40
főiskolai felvételi vizsga és főiskolai GPA Jemenben 0.41
SAT pontszámok és kumulatív GPA a Dartmouth diákok 0.43
magasság és súly az USA-ban 16.948 résztvevők 0.44
NPS rangok és a jövőbeli cég bevétel növekedése 14 Iparágak 0.44
Rorschach PRS pontszámok és az azt követő pszichoterápiás eredmény 0,44
a technológia használatának szándéka és a tényleges használat 0,50
általános mentális képesség és munkateljesítmény 0.51
vásárlási szándék és beszerzési Meta analízis (60 tanulmány) 0.53
munka minta és a munka teljesítménye 0.54
tiszta pontszámok a szakértőktől és SUPR-Q pontszámok a felhasználóktól 0.55
tiszta pontszámok a szakértőktől és a felhasználók seq pontjai 0.67
az ajánlott és ajánlott arány valószínűsége (legutóbbi ajánlás) 0.69
sus pontszámok és a jövőbeli szoftverbevétel növekedése (kiválasztott termékek) 0.74
vásárlási szándék és vásárlási Arány új termékek esetében (n=18) 0,75
SUPR-Q kvintilisek és 90 napos vásárlási Arány 0,78
valószínűség, hogy ajánlani és ajánlani Arány (legutóbbi vásárlás) 0,79
tiszta pontszámok szakértői és task time pontszámok a felhasználók 0.88
pontossága pulzoximéter és oxigén telítettség 0.89
valószínűsége, hogy javasoljuk, és jelentett ajánlási arány (márka) 0.90

orvosi eredmények

például az 1 .táblázat első bejegyzése azt mutatja, hogy az összefüggés az aszpirin szedése és a szívroham kockázatának csökkentése között r=.02. Ez a legkisebb korreláció a táblázatban, alig 0 felett. Az aszpirin azonban évtizedek óta a szív egészségére vonatkozó ajánlások alapanyaga, bár most megkérdőjelezik.

a kasszasiker gyógyszer (és TV kereskedelmi rendszeres) Viagra korreláció r=.38 A ” jobb teljesítmény.”A pszichoterápia korrelációja “csak” r = .32 a jövő jólétéről. A hagyományosan erősen korrelálónak tartott magasság és súly korrelációja r = .44 objektíven mérve az Egyesült Államokban vagy r = .38 Bangladesi mintából. Ez nem annyira különbözik a tintafoltok érvényességétől egy tanulmányban. A kapcsolat a “pulse-ox” érzékelők teszel az ujját az orvos és a tényleges oxigén a vérben r=.89. Mindez a korábban tárgyalt két dohányzási összefüggéssel összefüggésben látható, r = .08 és r = .40.

munkateljesítmény

az 1. táblázat a munkateljesítmény több mutatójának korrelációit mutatja, beleértve a főiskolai osztályzatokat (r = .16), éves tapasztalat (r = .18), strukturálatlan interjúk (r=.38), általános mentális képesség (r = .51); a munkateljesítmény legjobb előrejelzője a munkaminták, r =.54. Nézze meg, hogyan működik a Google, hogy megvitassa, hogyan igazította a Google ezen adatok alapján a felvételi gyakorlatait.

főiskolai teljesítmény

a dohányzáshoz hasonlóan az alkalmassági tesztek és a teljesítmény közötti kapcsolatot is alaposan tanulmányozták. Az 1. táblázat több példát is tartalmaz a standardizált tesztelés és a tényleges főiskolai teljesítmény közötti összefüggésekre: fehérek és ázsiai hallgatók számára az Ivy League University of Pennsylvania (r = .20), főiskolai GPA a jemeni hallgatók számára (r = .41), gre kvantitatív érvelés és MBA GPA (r = .37) a 10 állami egyetemek Floridában, és SAT pontszámok és kumulatív GPA A Ivy League Dartmouth College minden diák (r=.43).

ügyfél és felhasználói viselkedés

számos érvényességi korrelációt tartalmaztam a MeasuringU-nál végzett munkánkból, beleértve az ajánlási szándék és a 90 napos ajánlási arány közötti korrelációt a legutóbbi vásárláshoz (r = .79), SUS pontszámok és a szoftveripar növekedése (r = .74), a nettó Promoter pontszám és növekedési mutatók 14 iparágban (r = .35), értékelők tiszta pontszámok és a felhasználók feladat-könnyű pontszámok (r = .67). Hasonló összefüggések figyelhetők meg az emberek vásárlási szándékáról és a vásárlási arányokról szóló közzétett tanulmányok között is (r = .53) és a felhasználási szándék és a tényleges használat (r = .50) mint láttuk a TAM.

a tanulság az, hogy bár egyes korrelációk értéke kicsi, a következményeket nem lehet figyelmen kívül hagyni. Ez az, ami megnehezíti az összefüggések általános szabályainak alkalmazását. Remélem, hogy az érvényességi korrelációk táblázata itt az eltérő területekről segít másoknak kritikusan gondolkodni az egyes társulások összegyűjtésére irányuló erőfeszítésekről és azok hatásairól.

összefoglaló és elvihető

Ez a vita a korreláció, mint az intézkedés az asszociáció és elemzése érvényességi korrelációs együtthatók kiderült:

korrelációk számszerűsíteni kapcsolatok. A Pearson-korreláció r a leggyakoribb (de nem csak) módja a változók közötti kapcsolat leírására, és közös nyelv a hatások méretének leírására a tudományágak között.

az érvényességi és megbízhatósági együtthatók eltérőek. Nem minden korreláció jön létre egyenlően. Az ugyanabból a mintából nyert korrelációk (monometódus) vagy a megbízhatósági korrelációk (ugyanazt a mértéket használva) gyakran magasabbak r (r > .7) és irreálisan magas korrelációs sávhoz vezethet.

a korrelációk gyengék, de hatásosak lehetnek. Még a számszerűen “kicsi” összefüggések is érvényesek és értelmesek, ha figyelembe vesszük a hatások összefüggéseit (például az egészségügyi következményeket), valamint a mérési erőfeszítéseket és költségeket. A dohányzás, aszpirin, sőt a pszichoterápiás korrelációk jó példák arra, hogy mit lehet durván értelmezni gyenge vagy szerény korrelációként, de ahol az eredmény meglehetősen következményes.

ne állítson irreálisan magas sávokat az érvényességhez. A korreláció kontextusának megértése segít jelentést adni. Ha valami könnyen és alacsony költséggel mérhető, de még szerény képessége is van arra, hogy megjósolja a hatásos eredményt (például vállalati teljesítmény, főiskolai teljesítmény, várható élettartam vagy munkahelyi teljesítmény), akkor értékes lehet. A dohányzás és a rák közötti” alacsony ” összefüggés (r=.08) jó emlékeztető erre.