Měření: co je silná korelace?
kouření způsobuje rakovinu.
varování na etiketách cigaret a od zdravotnických organizací dávají jasné prohlášení, že kouření způsobuje rakovinu.
ale jak to víme?
kouření předchází rakovině (většinou rakovině plic). Lidé, kteří kouří cigarety, mají tendenci dostat plíce a jiné druhy rakoviny více než ti, kteří nekouří. Říkáme, že kouření souvisí s rakovinou. Pečlivě vyloučit jiné příčiny a máte ingredience, aby se případ pro příčinné souvislosti.
korelace je nezbytnou, ale ne dostatečnou složkou pro příčinnou souvislost. Nebo jak jste bezpochyby slyšeli: korelace se nerovná příčinné souvislosti. Korelace kvantifikuje souvislost mezi dvěma věcmi. Korelace však nemusí prokazovat, že příčinná souvislost je užitečná. Často je velmi užitečné vědět, že jedna věc předchází nebo předpovídá něco jiného. Například vědomí, že výkon uchazečů o zaměstnání na vzorcích práce předpovídá jejich budoucí pracovní výkon, pomáhá manažerům najmout správné kandidáty. Řekli bychom, že výkon pracovního vzorku koreluje s (předpovídá) pracovním výkonem, i když pracovní vzorky nezpůsobují lepší pracovní výkon.
běžný (ale ne jediný) způsob, jak vypočítat korelace Pearsonův korelační (označena r), vyrobený slavný (ale ne odvozené) Karl Pearson v pozdních 1880s. To se pohybuje od perfektní pozitivní korelace (+1) až perfektní negativní korelace (-1) nebo žádnou korelaci (r = 0). V praxi je dokonalá korelace 1 zcela nadbytečná informace, takže je nepravděpodobné, že se s ní setkáte.
korelační koeficient má své nedostatky a není považován za „robustní“ proti věcem, jako je nenormálnost, nelinearita, různé odchylky, vliv odlehlých hodnot a omezený rozsah hodnot. Nedostatky však nedělají to zbytečné nebo fatálně vadné. Tudíž, je široce používán v mnoha vědeckých oborech k popisu síly vztahů, protože je stále často smysluplný. Je to druh společného jazyka asociace, protože korelace lze vypočítat na mnoha opatřeních (například mezi dvěma binárními opatřeními nebo řadami).
Návrat na kouření a rakovinu připojení, jeden odhad z 25-leté studie o vztahu mezi kouřením a rakovinou plic v USA je r = .08-korelace sotva nad 0. Možná jste znali celoživotního kuřáka, který nedostal rakovinu-ilustrující bod (a nízkou velikost korelace), že ne každý, kdo kouří (i hodně), dostane rakovinu.
podle některých odhadů 75% -85% celoživotních těžkých kuřáků nedostane rakovinu. Ve skutečnosti 80% -90% lidí, kteří dostanou rakovinu plic, nejsou kuřáci nebo nikdy nekouřili!
ale jedna studie je zřídka konečné slovo o nálezu a už vůbec ne korelace. Existuje mnoho způsobů, jak měřit souvislost s rakovinou kouření a korelace se liší v závislosti na tom, kdo je měřen a jak.
například v jiné studii rozvojových zemí je korelace mezi procentem dospělé populace, která kouří, a očekávanou délkou života r = .40, což je jistě větší než.08 z americké studie, ale zdaleka to není téměř dokonalá korelace, kterou by konvenční moudrost a varovné štítky naznačovaly.
i když korelace nemusí být nutně nejlepším způsobem, jak popsat riziko spojené s aktivitami, je to stále užitečné při porozumění vztahu. Ale důležité je, pochopení podrobností, na nichž byla korelace vytvořena, a pochopení jejich důsledků jsou kritickými kroky při uvádění korelací do perspektivy.
validita vs. Spolehlivost Korelace
i Když pravděpodobně ne studium veřejné zdraví, váš profesní a osobní život jsou plné korelace spojující dvě věci (například, kouření a rakoviny, výsledky testů a výsledky ve škole, nebo pití kávy a zlepšení zdraví). Tyto korelace se nazývají korelace platnosti. Platnost se týká toho, zda něco měří to, co má v úmyslu měřit. Řekli bychom, že sada otázek na pohovor, která předpovídá výkon práce, je platná. Nebo dotazník použitelnosti je platný, pokud koreluje s dokončením úkolu na produktu. Síla korelace hovoří o síle tvrzení o platnosti.
na MeasuringU píšeme rozsáhle o našem vlastním a druhém výzkumu a často citujeme korelační koeficienty. Nicméně, ne všechny korelace jsou vytvořeny stejné a ne všechny jsou korelace platnosti. Další společnou korelací je korelace spolehlivosti (konzistence odpovědí) a korelace, které pocházejí ze stejného vzorku účastníků (nazývané monometodové korelace). Monomethod korelace je snadnější sbírat (stačí pouze jeden vzorek dat), ale protože data pochází ze stejného účastníci korelace mají tendenci být nahuštěny. Spolehlivost korelace také mají tendenci být jak se běžně uvádí v recenzovaných dokumentů a jsou také obvykle mnohem vyšší, často r > .7. Dostupnost těchto vyšších korelací může přispět k myšlence, že korelace jako r =.3 nebo dokonce r = .1 jsou nesmyslné.
například jsme zjistili, že spolehlivost testu-opakovaného testu skóre čistého promotoru je r = .7. Příklady monometodové korelace jsou korelace mezi SUS a NPS (r = .62), mezi jednotlivými položkami SUS a celkovým skóre sus (r = .9) a mezi SUS a UMUX-Lite (r = .83), všechny shromážděné ze stejného vzorku a účastníků. Jedná se také o legitimní korelace platnosti (nazývané souběžná platnost), ale mají tendenci být vyšší, protože hodnoty kritéria a predikce jsou odvozeny ze stejného zdroje.
interpretace korelačních koeficientů platnosti
mnoho polí má svou vlastní konvenci o tom, co představuje silnou nebo slabou korelaci. V behaviorálních vědách je konvence (z velké části stanovená Cohenem), že korelace (jako měřítko velikosti efektu, která zahrnuje korelaci platnosti) výše .5 jsou“ velké“, kolem .3 jsou „střední,“ a .10 a Níže jsou “ malé.“
Použitím Cohenovy konvence je však souvislost mezi kouřením a rakovinou plic slabá v jedné studii a možná Střední v druhé. Ale i v rámci behaviorálních věd záleží na kontextu. I malá korelace s následným výsledkem (účinnost psychoterapie)může mít stále následky na život a smrt.
Kvadratura korelace (koeficient determinace), je další běžná praxe interpretace korelace (a velikost účinku), ale může také podceňují sílu vztahu mezi proměnnými, a pomocí standardní r je často přednostní. Budeme zkoumat další způsoby interpretace korelace v budoucím článku.
já jsem zjišťovat platnost korelace přes více oborů z několika publikovaných prací (mnoha meta-analýz), které zahrnují studium na lékařské a psychologické účinky, práce, výkon, vysokou výkonnost, a naše vlastní výzkum na zákazníka a chování uživatele, aby poskytnout kontext k platnosti korelace. Mnoho studií v tabulce pochází z vlivného dokumentu Meyer et al. (2001).
Description | Correlation |
---|---|
Aspirin and reduced risk of heart attack | 0.02 |
Ever Smoking and Lung Cancer after 25 years | 0.08 |
College Grades and Job Performance | 0.16 |
Years of Experience & Job Performance | 0.18 |
SAT Skóre a Kumulativní GPA na University of Pennsylvania (Bílá & Asijské Studenti) | 0.20 |
HS Třídy Hodnost a Kumulativní GPA na University of Pennsylvania (Bílá & Asijské Studenty) | 0.26 |
Psychoterapie a Následné Pohody | 0.32 |
Raw Net Promoter Skóre a Budoucnost Firmy, Růst Příjmů ve 14 průmyslových Odvětví | 0,35 a |
GRE Kvantitativní Uvažování a MBA GPA | 0.37 |
Nestrukturované Pohovory a Pracovní Výkon | 0.38 |
Viagra a zlepšení sexuální funkce | 0.38 |
Výška a Váha od 639 Bangladéšské Studenty (Průměr Muži a Ženy) | 0.38 |
Chování v Minulosti jako Prediktor Budoucího Chování | 0.39 |
% z Dospělé Populace Kouří a průměrná Délka Života v Rozvojových Zemích | 0.40 |
vysoká škola Přijímací Zkoušky a Vysoké školy GPA v Jemenu | 0.41 |
SAT Skóre a Kumulativní GPA z Dartmouth Studenty | 0.43 |
Výška a Váha v NÁS od 16,948 účastníků | 0.44 |
NPS Řad a Budoucnost Firmy, Růst Příjmů ve 14 průmyslových Odvětví | 0.44 |
Rorschach VAS skóre a následné psychoterapie výsledek | 0.44 |
Záměr použití technologie a skutečné použití | 0.50 |
Obecné Duševní Schopnosti a Pracovní Výkon | 0.51 |
Nákup Záměr a Nákup Meta Analýza (60 Studie) | 0.53 |
Práce Vzorek a Pracovní Výkon | 0.54 |
ČISTÉ Skóre Z Odborných a SUPR-Q Skóre od Uživatelů | 0.55 |
ČISTÉ Skóre Z Odborných a NÁSL. Skóre od Uživatelů | 0.67 |
Pravděpodobnost, Doporučit a Doporučit Sazba (Posledních Doporučení) | 0.69 |
SUS Skóre a Budoucí Softwarové Růst Tržeb (Vybrané Produkty) | 0.74 |
Nákup Záměr a Nákup Sazba pro Nové Výrobky (n=18) | 0.75 |
SUPR-Q quintiles a 90 Den nákupu sazby | 0.78 |
Pravděpodobnost, Doporučit a Doporučit Sazba (Nedávná Koupě) | 0.79 |
ČISTÉ Skóre Z Odborných a Úkol Čase Skóre od Uživatelů | 0.88 |
Přesnost Pulzní Oximetr a Saturace Kyslíkem | 0.89 |
Pravděpodobnost Doporučit a Hlásil, Doporučujeme Sazba (Značek) | 0.90 |
Lékařské Výsledky,
například, první položka v Tabulce 1 vyplývá, že korelace mezi vezme aspirin a snížení rizika srdečního infarktu je r = .02. Toto je nejmenší korelace v tabulce a sotva nad 0. Aspirin je však po celá desetiletí základem doporučení pro zdraví srdce, i když je nyní zpochybňován.
trhák lék (a televizní reklama pravidelný) Viagra má korelaci r = .38 s “ zlepšeným výkonem.“Psychoterapie má korelaci“ pouze “ r = .32 o budoucím blahu. Výška a hmotnost, které jsou tradičně považovány za silně korelované, mají korelaci r = .44 při objektivním měření v USA nebo r = .38 z Bangladéšského vzorku. To se neliší od platnosti inkoustových skvrn v jedné studii. Spojení mezi senzory“ pulse-ox“, které si položíte na prst u lékaře, a skutečným kyslíkem v krvi je r = .89. To vše lze vidět v kontextu se dvěma kuřáckými korelacemi diskutovanými dříve, r = .08 A r = .40.
pracovní výkon
Tabulka 1 ukazuje korelace pro několik ukazatelů pracovní výkonnosti, včetně vysokoškolských stupňů (r = .16), dlouholeté zkušenosti (r = .18), nestrukturované rozhovory (r=.38), obecná mentální schopnost (r = .51); nejlepším prediktorem výkonu práce jsou vzorky práce, r =.54. Podívejte se, jak Google pracuje na diskusi o tom, jak Google přizpůsobil své náborové postupy na základě těchto údajů.
vysokoškolský výkon
stejně jako kouření byla rozsáhle studována souvislost mezi testy způsobilosti a úspěchem. Tabulka 1 rovněž obsahuje několik příkladů korelace mezi standardizované testování a aktuální vysokou výkonnost: pro Bílé a Asijské studenty na Ivy League University of Pennsylvania (r = .20), Vysoká škola GPA pro studenty v Jemenu (r = .41), GRE kvantitativní uvažování a MBA GPA (r = .37) z 10 státní univerzity na Floridě, a SAT skóre a kumulativní GPA z prestižní Dartmouth College pro všechny studenty (r = .43).
Zákazník a Chování Uživatelů
uvedl jsem několik platnosti korelace z práce, kterou jsme udělali na MeasuringU, včetně korelace mezi záměrem doporučit a 90 den, doporučuji sazby pro poslední nákup (r = .79), skóre SUS a růst softwarového průmyslu (r = .74), skóre čistého promotoru a metriky růstu ve 14 průmyslových odvětvích (r = .35), čisté skóre hodnotitelů a skóre Snadné úlohy uživatelů (r = .67). Podobné korelace jsou také pozorovány mezi publikovanými studiemi o záměru lidí nakupovat a nakupovat (r = .53) a záměr používat a skutečné použití (r = .50) jak jsme viděli s TAM.
poučením je, že zatímco hodnota některých korelací je malá, důsledky nelze ignorovat. A to je to, co dělá obecná pravidla korelace tak obtížné aplikovat. Doufám, že tabulka korelací platnosti zde z nesourodých polí pomůže ostatním kriticky přemýšlet o úsilí o shromažďování a dopadu každého sdružení.
Shrnutí a Takeaways
diskuse o korelaci jako míra asociace a analýza platnosti korelační koeficienty odhalil:
Korelace kvantifikovat vztahy. Pearsonova korelace r je nejběžnějším (ale nejen) způsobem popisu vztahu mezi proměnnými a je běžným jazykem pro popis velikosti efektů napříč disciplínami.
koeficienty Validity a spolehlivosti se liší. Ne všechny korelace jsou vytvořeny stejné. Korelace získaných ze stejného vzorku (monomethod) nebo spolehlivost korelace (pomocí stejné opatření), jsou často vyšší, r (r > .7) a může vést k nerealisticky vysoké korelační liště.
korelace mohou být slabé, ale působivé. Dokonce i numericky „malé“ korelace jsou platné a smysluplné, pokud jsou zohledněny kontexty dopadu (např. zdravotní důsledky) a úsilí a náklady na měření. Kouření, aspirin, a dokonce i psychoterapeutické korelace jsou dobrými příklady toho, co lze hrubě interpretovat jako slabé až skromné korelace, ale kde je výsledek docela následný.
nenastavujte nereálně vysoké sloupce pro platnost. Pochopení kontextu korelace pomáhá poskytnout smysl. Pokud něco lze měřit snadno a za nízké náklady, ale mají i sebemenší schopnost předvídat působivých výsledků (jako je výkonnost podniku, vysokou výkonnost, délku života, nebo pracovní výkon), to může být cenná. „Nízká“ korelace mezi kouřením a rakovinou (r = .08) je to dobrá připomínka.