MeasuringU: ce este o corelație puternică?
fumatul cauzează cancer.
avertismentele de pe etichetele țigărilor și de la organizațiile de sănătate fac afirmația clară că fumatul provoacă cancer.
dar de unde știm?
fumatul precede cancerul (mai ales cancerul pulmonar). Persoanele care fumează țigări tind să facă cancer pulmonar și alte tipuri de cancer mai mult decât cei care nu fumează. Spunem că fumatul este corelat cu cancerul. Excludeți cu atenție alte cauze și aveți ingredientele pentru a face cazul cauzalității.
corelația este un ingredient necesar, dar nu suficient pentru cauzalitate. Sau, după cum ați auzit fără îndoială: corelația nu este egală cu cauzalitatea. O corelație cuantifică asocierea dintre două lucruri. Dar corelația nu trebuie să dovedească cauzalitatea ca fiind utilă. Adesea, doar știind că un lucru precede sau prezice altceva este foarte util. De exemplu, știind că performanța candidaților la un loc de muncă pe eșantioane de lucru prezice performanța lor viitoare la locul de muncă îi ajută pe manageri să angajeze candidații potriviți. Am spune că performanța eșantionului de lucru se corelează cu (prezice) performanța muncii, chiar dacă eșantioanele de lucru nu provoacă performanțe de lucru mai bune.
o modalitate comună (dar nu singura) de a calcula o corelație este corelația Pearson (notată cu un r), făcută faimoasă (dar nu derivată) de Karl Pearson la sfârșitul anilor 1880. aceasta variază de la o corelație pozitivă perfectă (+1) la o corelație negativă perfectă (-1) sau fără corelație (r = 0). În practică, o corelație perfectă de 1 este o informație complet redundantă, deci este puțin probabil să o întâlniți.
coeficientul de corelație are neajunsurile sale și nu este considerat „robust” împotriva unor lucruri precum non-normalitatea, neliniaritatea, varianțele diferite, influența valorilor aberante și o gamă restrânsă de valori. Deficiențe cu toate acestea, nu-l face inutil sau fatal defectuos. În consecință, este utilizat pe scară largă în multe discipline științifice pentru a descrie puterea relațiilor, deoarece este încă adesea semnificativă. Este un fel de limbaj comun de asociere, deoarece corelațiile pot fi calculate pe mai multe măsuri (de exemplu, între două măsuri binare sau ranguri).revenind la legătura dintre fumat și cancer, o estimare dintr-un studiu de 25 de ani privind corelația dintre fumat și cancerul pulmonar în SUA este r = .08-o corelație abia peste 0. Este posibil să fi cunoscut un fumător de—a lungul vieții care nu a făcut cancer-ilustrând punctul (și magnitudinea scăzută a corelației) că nu toți cei care fumează (chiar și foarte mult) fac cancer.conform unor estimări, 75% -85% dintre fumătorii grei de-a lungul vieții nu fac cancer. De fapt, 80% -90% dintre persoanele care fac cancer pulmonar nu sunt fumători sau nu au fumat niciodată!
dar un studiu este rareori ultimul cuvânt pe o constatare și cu siguranță nu o corelație. Există multe modalități de a măsura legătura cancerului de fumat, iar corelația variază în funcție de cine este măsurat și cum.
de exemplu, într-un alt studiu al țărilor în curs de dezvoltare, corelația dintre procentul populației adulte care fumează și speranța de viață este r = .40, care este cu siguranță mai mare decât .08 din studiul american, dar este departe de corelația aproape perfectă pe care ar implica-o înțelepciunea convențională și etichetele de avertizare.în timp ce corelațiile nu sunt neapărat cel mai bun mod de a descrie riscul asociat activităților, este totuși util în înțelegerea relației. Dar, important, înțelegerea detaliilor pe care s-a format corelația și înțelegerea consecințelor acestora sunt pașii critici în punerea corelațiilor în perspectivă.
validitate vs. Corelații de fiabilitate
în timp ce probabil nu studiați sănătatea publică, viața profesională și personală sunt pline de corelații care leagă două lucruri (de exemplu, fumatul și cancerul, scorurile testelor și realizările școlare sau consumul de cafea și îmbunătățirea sănătății). Aceste corelații se numesc corelație de validitate. Valabilitatea se referă la faptul dacă ceva măsoară ceea ce intenționează să măsoare. Am spune că un set de întrebări de interviu care prezice performanța locului de muncă este valabil. Sau un chestionar de utilizare este valabil dacă se corelează cu finalizarea sarcinii pe un produs. Puterea corelației vorbește despre puterea revendicării de valabilitate.
la MeasuringU scriem pe larg despre cercetările noastre și ale altora și cităm adesea coeficienți de corelație. Cu toate acestea, nu toate corelațiile sunt create egale și nu toate sunt corelații de valabilitate. O altă corelație comună este corelația de fiabilitate (consistența răspunsurilor) și corelațiile care provin din același eșantion de participanți (numite corelații monometode). Corelațiile monometode sunt mai ușor de colectat (aveți nevoie doar de un eșantion de date), dar deoarece datele provin de la aceiași participanți, corelațiile tind să fie umflate. Corelațiile de fiabilitate tind, de asemenea, să fie raportate în mod obișnuit în lucrări revizuite de colegi și sunt, de asemenea, de obicei mult mai mari, adesea r > .7. Disponibilitatea acestor corelații superioare poate contribui la ideea că corelații precum r =.3 sau chiar r = .1 sunt lipsite de sens.
de exemplu, am găsit fiabilitatea test-retestare a scorului Net Promotor este r = .7. Exemple de corelație monometodă sunt corelația dintre SUS și NPS (r = .62), între elementele SUS individuale și Scorul total SUS (r = .9), și între SUS și UMUX-Lite (r = .83), toate colectate din același eșantion și participanți. Acestea sunt, de asemenea, corelații legitime de valabilitate (numite validitate concurentă), dar tind să fie mai mari, deoarece valorile criteriului și predicției sunt derivate din aceeași sursă.
interpretarea coeficienților de corelație a valabilității
multe câmpuri au propria lor convenție despre ceea ce constituie o corelație puternică sau slabă. În științele comportamentale Convenția (stabilită în mare parte de Cohen) este aceea corelații (ca măsură a dimensiunii efectului, care include corelații de validitate) de mai sus .5 sunt „mari”, în jur .3 sunt „mediu,” și .10 și mai jos sunt ” mici.”folosind Convenția lui Cohen, legătura dintre fumat și cancerul pulmonar este slabă într-un studiu și poate medie în celălalt. Dar chiar și în cadrul științelor comportamentale, contextul contează. Chiar și o mică corelație cu un rezultat consecvent (eficacitatea psihoterapiei) poate avea în continuare consecințe asupra vieții și morții.Cuadratura corelației (numită coeficientul de determinare) este o altă practică obișnuită de interpretare a corelației (și a dimensiunii efectului), dar poate, de asemenea, să subestimeze puterea unei relații între variabile, iar utilizarea standardului r este adesea preferată. Vom explora mai multe moduri de interpretare a corelațiilor într-un articol viitor.am colectat corelații de valabilitate în mai multe discipline din mai multe lucrări publicate (multe meta-analize) care includ studii privind efectele medicale și psihologice, performanța la locul de muncă, performanța colegiului și propriile noastre cercetări privind comportamentul clienților și utilizatorilor pentru a oferi context corelațiilor de valabilitate. Multe dintre studiile din tabel provin din lucrarea influentă a lui Meyer și colab. (2001).
Description | Correlation |
---|---|
Aspirin and reduced risk of heart attack | 0.02 |
Ever Smoking and Lung Cancer after 25 years | 0.08 |
College Grades and Job Performance | 0.16 |
Years of Experience & Job Performance | 0.18 |
scoruri SAT și GPA cumulativ la Universitatea din Pennsylvania pentru (alb & studenți asiatici) | 0,20 |
rang de clasă HS și GPA cumulativ la Universitatea din Pennsylvania pentru (alb & studenți asiatici) | 0.26 |
psihoterapia și bunăstarea ulterioară | 0.32 |
scorurile promotorului net brut și creșterea viitoare a veniturilor firmei în 14 industrii | 0.35 |
GRE raționament cantitativ și MBA GPA | 0.37 |
interviuri de locuri de muncă nestructurate și performanța locului de muncă | 0,38 |
Viagra și funcționarea sexuală îmbunătățită | 0,38 |
înălțimea și greutatea de la 639 de studenți din Bangladesh (Media bărbaților și femeilor) | 0,38 |
comportamentul trecut ca predictor al comportamentului viitor | 0,39 |
% din populația adultă care fumează și speranța de viață în țările în curs de dezvoltare | 0,40 |
examen de admitere la facultate și GPA colegiu în Yemen | 0.41 |
scoruri SAT și GPA cumulativ de la studenții Dartmouth | 0,43 |
înălțime și greutate în SUA de la 16.948 de participanți | 0,44 |
Rangurile NPS și creșterea viitoare a veniturilor firmei în 14 industrii | 0,44 |
scorurile Rorschach PRS și rezultatul ulterior al psihoterapiei | 0,44 |
intenția de a utiliza tehnologia și utilizarea reală | 0,50 |
capacitatea mentală generală și performanța la locul de muncă | 0.51 |
intenție de cumpărare și meta analiză de cumpărare (60 de studii) | 0,53 | eșantion de lucru și performanță la locul de muncă | 0,54 |
scoruri PURE de la expert și scoruri SUPR-Q de la utilizatori | 0,55 |
scoruri pure de la expert și scoruri seq de la utilizatori | 0.67 |
probabilitatea de a recomanda și de a recomanda rata (recomandare recentă) | 0.69 |
scoruri sus și creșterea viitoare a veniturilor software (produse selectate) | 0.74 |
intenția de cumpărare și rata de cumpărare pentru produse noi (n=18) | 0,75 |
SUPR-Q quintile și ratele de cumpărare de 90 de zile | 0,78 |
probabilitatea de a recomanda și de a recomanda rata (achiziție recentă) | 0,79 |
scoruri pure de la experți și scoruri de timp de sarcină de la utilizatori | 0,88 |
precizia pulsoximetrului și saturația oxigenului | 0,89 |
probabilitatea de a recomanda și rata de recomandare raportată (mărci) | 0.90 |
rezultate medicale
de exemplu, prima intrare din tabelul 1 arată că corelația dintre administrarea aspirinei și reducerea riscului de atac de cord este r = .02. Aceasta este cea mai mică corelație din tabel și abia peste 0. Cu toate acestea, aspirina a fost o bază de recomandări pentru sănătatea inimii de zeci de ani, deși acum este pusă la îndoială.
medicamentul blockbuster (și TV comercial regulat) Viagra are o corelație de r = .38 cu ” performanță îmbunătățită.”Psihoterapia are o corelație de „numai” r = .32 privind bunăstarea viitoare. Înălțimea și greutatea care sunt considerate în mod tradițional ca fiind puternic corelate au o corelație de r = .44 când este măsurat obiectiv în SUA sau r = .38 dintr-un eșantion din Bangladesh. Aceasta nu este atât de diferită de validitatea petelor de cerneală într-un studiu. Conexiunea dintre senzorii „pulse-ox” pe care i-ați pus pe deget la medic și oxigenul real din sânge este r = .89. Toate acestea pot fi văzute în contextul celor două corelații de fumat discutate anterior, r = .08 și r = .40.
performanța postului
Tabelul 1 prezintă corelații pentru mai mulți indicatori ai performanței postului, inclusiv note de facultate (r = .16), ani de experiență (r = .18), interviuri nestructurate (r=.38), capacitatea mentală generală (r = .51); cel mai bun predictor al performanței la locul de muncă este eșantioanele de lucru, r =.54. Vedeți cum funcționează Google pentru o discuție despre modul în care Google și-a adaptat practicile de angajare pe baza acestor date.
performanța Colegiului
la fel ca fumatul, legătura dintre testele de aptitudini și realizări a fost studiată pe larg. Tabelul 1 conține, de asemenea, câteva exemple de corelații între testarea standardizată și performanța reală a Colegiului: pentru studenții albi și asiatici de la Universitatea Ivy League din Pennsylvania (r = .20), Colegiul GPA pentru studenții din Yemen (r=.41), GRE raționament cantitativ și MBA GPA (r = .37) de la 10 universități de Stat din Florida, și SAT scoruri și AAP cumulativ de la Ivy League Dartmouth College pentru toți studenții (r = .43).
comportamentul clientului și al utilizatorului
am inclus mai multe corelații de valabilitate din munca pe care am făcut-o la MeasuringU, inclusiv corelația dintre intenția de a recomanda și ratele de recomandare de 90 de zile pentru cea mai recentă achiziție (r = .79), scorurile SUS și creșterea industriei software (r = .74), scorul net al promotorului și valorile de creștere în 14 industrii (r=.35), scorurile pure ale evaluatorilor și scorurile ușoare ale utilizatorilor (r = .67). Corelații similare sunt, de asemenea, observate între studiile publicate privind intenția oamenilor de a cumpăra și ratele de cumpărare (r = .53) și intenția de utilizare și utilizarea efectivă (r = .50) așa cum am văzut cu TAM.
lecția de aici este că, deși valoarea unor corelații este mică, consecințele nu pot fi ignorate. Și asta face ca regulile generale ale corelațiilor să fie atât de dificil de aplicat. Speranța mea este tabelul de corelații de validitate aici din domenii disparate va ajuta pe alții să se gândească critic cu privire la efortul de a colecta și impactul fiecărei asociații.
rezumat și preluări
această discuție despre corelație ca măsură de asociere și o analiză a coeficienților de corelație de validitate a relevat:
corelațiile cuantifică relațiile. Corelația Pearson r este cea mai comună (dar nu numai) modalitate de a descrie o relație între variabile și este un limbaj comun pentru a descrie dimensiunea efectelor între discipline.
coeficienții de valabilitate și fiabilitate diferă. Nu toate corelațiile sunt create egale. Corelațiile obținute din același eșantion (monometod) sau corelațiile de fiabilitate (folosind aceeași măsură) sunt adesea mai mari r (r > .7) și poate duce la o bară de corelație nerealist de mare.
corelațiile pot fi slabe, dar cu impact. Chiar și corelațiile numerice „mici” sunt valide și semnificative atunci când sunt contabilizate contextele impactului (de exemplu, consecințele asupra sănătății) și efortul și costul măsurării. Corelațiile de fumat, aspirină și chiar psihoterapie sunt exemple bune de ceea ce poate fi interpretat grosolan ca corelații slabe până la modeste, dar unde rezultatul este destul de consecvent.
nu setați bare nerealist de mari pentru valabilitate. Înțelegerea contextului unei corelații ajută la asigurarea sensului. Dacă ceva poate fi măsurat cu ușurință și pentru costuri reduse, dar are chiar și o capacitate modestă de a prezice un rezultat de impact (cum ar fi performanța companiei, performanța Colegiului, speranța de viață sau performanța la locul de muncă), poate fi valoros. Corelația „scăzută” dintre fumat și cancer (r = .08) este o amintire bună a acestui lucru.