Articles

MeasuringU: mikä on vahva korrelaatio?

tupakointi aiheuttaa syöpää.

varoitukset savukemerkinnöissä ja terveysjärjestöissä tekevät kaikki selväksi, että tupakointi aiheuttaa syöpää.

mutta mistä tiedämme?

Tupakointi edeltää syöpää (lähinnä keuhkosyöpää). Ihmiset, jotka polttavat tupakkaa, sairastuvat keuhko-ja muihin syöpiin enemmän kuin ne, jotka eivät tupakoi. Sanomme, että tupakointi korreloi syövän kanssa. Huolellisesti sulkea pois muita syitä ja sinulla on ainekset tehdä tapauksessa syy.

korrelaatio on välttämätön mutta ei riittävä syy-yhteyden aiheuttaja. Tai kuten olet epäilemättä kuullut: korrelaatio ei ole sama syy. Korrelaatio määrittää kahden asian välisen yhteyden. Korrelaation ei kuitenkaan tarvitse todistaa syy-yhteyttä ollakseen hyödyllinen. Usein jo yhden asian tietäminen edeltää tai ennustaa jotakin muuta on hyvin hyödyllistä. Esimiesten palkkaamista auttaa esimerkiksi tieto siitä, että työnäytteiden perusteella työnhakijoiden suoritukset ennustavat heidän tulevaa työsuoritustaan. Sanoisimme, että työnäytteen suorituskyky korreloi (ennustaa) työsuorituksen kanssa, vaikka työnäytteet eivät aiheuta parempaa työsuoritusta.

yleinen (mutta ei ainoa) tapa laskea korrelaatio on Karl Pearsonin 1880-luvun lopulla tunnetuksi tekemä Pearsonin korrelaatio (merkitään R: llä), joka vaihtelee täydellisestä positiivisesta korrelaatiosta (+1) täydelliseen negatiiviseen korrelaatioon (-1) tai ei korrelaatioon (r = 0). Käytännössä täydellinen korrelaatio 1 on täysin tarpeeton tieto, joten et todennäköisesti kohtaa sitä.

korrelaatiokertoimessa on puutteensa, eikä sitä pidetä ”vankkana” sellaisia asioita vastaan kuin ei-normaalius, epälineaarisuus, erilaiset varianssit, poikkeavien havaintojen vaikutus ja rajoitettu arvoalue. Puutteet eivät kuitenkaan tee siitä hyödytöntä tai kohtalokkaasti puutteellista. Näin ollen, se on laajalti käytetty monilla tieteenaloilla kuvaamaan vahvuus suhteita, koska se on edelleen usein mielekäs. Se on eräänlainen yhteinen kieli assosiaation korrelaatioita voidaan laskea monia toimenpiteitä (esimerkiksi kahden binary toimenpiteitä tai riveissä).

palataan tupakoinnin ja syövän yhteyteen, yksi arvio 25 vuotta kestäneestä tutkimuksesta tupakoinnin ja keuhkosyövän korrelaatiosta Yhdysvalloissa on R = .08-korrelaatio hädin tuskin yli 0. Olet ehkä tuntenut elinikäisen tupakoijan, joka ei saanut syöpää—mikä valaisee sitä (ja korrelaation pienuutta), että kaikki tupakoivat (jopa paljon) eivät saa syöpää.

joidenkin arvioiden mukaan 75-85% elinikäisistä paljon tupakoivista ei sairastu syöpään. Itse asiassa 80% -90% ihmisistä, jotka eivät saa keuhkosyöpää, eivät tupakoi tai eivät koskaan tupakoi!

mutta yksi tutkimus on harvoin lopullinen sana löydökselle eikä missään nimessä korrelaatio. Tupakoinnin syöpäyhteyttä voidaan mitata monella tavalla ja korrelaatio vaihtelee jonkin verran riippuen siitä, ketä mitataan ja miten.

esimerkiksi toisessa kehitysmaiden tutkimuksessa tupakoivien aikuisväestön prosentuaalisen osuuden ja elinajanodotteen välinen korrelaatio on r = .40, joka on varmasti suurempi kuin.08 yhdysvaltalaistutkimuksesta, mutta se on kaukana lähes täydellisestä korrelaatiosta, jota perinteiset viisaus-ja varoitusmerkinnät tarkoittaisivat.

vaikka korrelaatiot eivät välttämättä ole paras tapa kuvata toimintaan liittyvää riskiä, on siitä silti apua suhteen ymmärtämisessä. Mutta tärkeää on ymmärtää yksityiskohtia, joihin korrelaatio on muodostettu ja ymmärtää niiden seuraukset ovat kriittisiä vaiheita, kun korrelaatiot perspektiiviin.

kelpoisuus vs. Luotettavuuskorrelaatiot

vaikka et todennäköisesti Opiskele kansanterveyttä, työ-ja yksityiselämäsi ovat täynnä korrelaatioita, jotka yhdistävät kaksi asiaa (esimerkiksi tupakointi ja syöpä, koetulokset ja koulumenestys tai kahvin juominen ja parantunut terveys). Näitä korrelaatioita kutsutaan validiteettikorrelaatioksi. Pätevyys tarkoittaa sitä, mittaako jokin sen, mitä se aikoo mitata. Sanoisin, että joukko haastattelukysymyksiä, jotka ennustavat työn suorituskykyä, on pätevä. Tai käytettävyyskysely on pätevä, jos se korreloi tuotteen tehtävän loppuun saattamisen kanssa. Korrelaation vahvuus kertoo validiteettiväitteen vahvuudesta.

Measuringussa kirjoitamme laajasti omasta ja muiden tutkimuksesta ja siteeraamme usein korrelaatiokertoimia. Kaikki korrelaatiot eivät kuitenkaan ole tasa-arvoisia eivätkä kaikki ole validiteettikorrelaatioita. Toinen yleinen korrelaatio on luotettavuuskorrelaatio (vasteiden johdonmukaisuus) ja korrelaatiot, jotka tulevat samasta osallistujien otoksesta (kutsutaan monometodikorrelaatioiksi). Monometodikorrelaatioita on helpompi kerätä (tarvitset vain yhden datanäytteen), mutta koska tiedot tulevat samoilta osallistujilta, korrelaatiot yleensä paisuvat. Luotettavuuskorrelaatioita raportoidaan yleensä myös vertaisarvioiduissa papereissa ja ne ovat myös tyypillisesti paljon suurempia, usein R > .7. Näiden korkeampien korrelaatioiden saatavuus voi edistää ajatusta, että korrelaatiot, kuten r =.3 tai jopa r = .1 ovat merkityksettömiä.

esimerkiksi Net Promoter Scoren testiretestin luotettavuus on R=.7. Esimerkkejä monometodikorrelaatiosta ovat SUS: n ja NPS: n välinen korrelaatio (r = .62), yksittäisten SUS-erien ja SUS-kokonaispistemäärän välillä (r = .9), ja suksen ja UMUX-Liten välillä (r = .83), kaikki kerätty samasta otoksesta ja osallistujista. Nämä ovat myös oikeutettuja validiteettikorrelaatioita (joita kutsutaan samanaikaisiksi kelpoisuuksiksi), mutta ovat yleensä korkeampia, koska kriteeri ja ennustearvot ovat peräisin samasta lähteestä.

Tulkitsevien Validiteettikorrelaatiokertoimien

monilla kentillä on oma konventionsa siitä, mikä muodostaa vahvan tai heikon korrelaation. Käyttäytymistieteissä konventio (suurelta osin Cohenin perustama) on, että korrelaatiot (vaikutuksen koon mittana, joka sisältää validiteettikorrelaatiot) edellä .5 ovat ”suuria”, noin .3 ovat ”medium,” ja .10 ja alla on ” pieni.”

käyttäen Cohenin käytäntöä, tupakoinnin ja keuhkosyövän yhteys on kuitenkin heikko yhdessä tutkimuksessa ja ehkä medium toisessa. Mutta käyttäytymistieteissäkin asiayhteydellä on väliä. Pienelläkin korrelaatiolla seurannaisvaikutukseen (psykoterapian tehokkuuteen) voi silti olla elämän ja kuoleman seurauksia.

korrelaation Neliöiminen (jota kutsutaan determinaatiokertoimeksi) on toinen yleinen tapa tulkita korrelaatiota (ja vaikutuksen kokoa), mutta se voi myös aliarvioida muuttujien välisen suhteen vahvuutta, ja standardin r käyttö on usein suositeltavaa. Tutkimme lisää tapoja tulkita korrelaatioita tulevassa artikkelissa.

olen kerännyt validiteettikorrelaatioita eri tieteenaloilla useista julkaistuista artikkeleista (monet meta-analyysit), jotka sisältävät tutkimuksia lääketieteellisistä ja psykologisista vaikutuksista, työsuorituksesta, Collegen suorituskyvystä sekä omia tutkimuksiamme asiakas-ja käyttäjäkäyttäytymisestä, jotta pätevyyskorrelaatioille saadaan konteksti. Monet taulukon tutkimuksista ovat peräisin Meyerin ym. (2001).

/tr>

työnäyte ja työsuoritus

Description Correlation
Aspirin and reduced risk of heart attack 0.02
Ever Smoking and Lung Cancer after 25 years 0.08
College Grades and Job Performance 0.16
Years of Experience & Job Performance 0.18
SAT-pisteet ja kumulatiivinen GPA Pennsylvanian yliopistossa (valkoiset & Aasialaiset opiskelijat) 0.20
HS Class Rank ja kumulatiivinen GPA Pennsylvanian yliopistossa (valkoiset & Aasialaiset opiskelijat) 0, 26
psykoterapia ja myöhempi hyvinvointi 0, 32
raaka nettopromoottoripisteet ja tuleva yritysverotulojen kasvu 14 toimialalla 0, 35
GRE kvantitatiivinen päättely ja MBA GPA 0.37
rakenteettomat työhaastattelut ja työsuoritus 0.38 Viagra ja parantunut seksuaalinen toimintakyky 0.38
pituus ja paino 639 Bangladeshilaiselta opiskelijalta (miesten ja naisten keskiarvo) 0.38
menneisyys tulevan käyttäytymisen ennustajana 0, 39
% tupakoivasta aikuisväestöstä ja elinajanodote kehitysmaissa 0, 40
College Entrance Exam ja college GPA Jemenissä 0.41
SAT-pisteet ja kumulatiivinen GPA Dartmouthin opiskelijoilta 0,43
korkeus ja paino Yhdysvalloissa 16 948 osallistujalta 0,44
NPS: n sijoitus ja tuleva yritys liikevaihdon kasvu 14 toimialalla 0,44
Rorschachin PRS-pisteet ja sitä seurannut psykoterapian tulos 0, 44
aikomus käyttää teknologiaa ja todellinen käyttö 0, 50
yleinen henkinen toimintakyky ja työsuoritus 0.51
ostoaikeet ja hankinnat Meta-analyysi (60 tutkimusta) 0, 53
0, 54
PURE Scores from Expert and SUPR-Q Scores from Users 0, 55
pure scores from expert and SEQ scores from users 0.67
todennäköisyys suositella ja suosittaa rate (recent recommendation) 0.69
sus scores and future software revenue growth (selected products) 0.74
ostoaikeet ja Ostonopeus uusille tuotteille (n=18) 0,75
SUPR-Q kvintiilit ja 90 päivän oston korko 0,78
todennäköisyys suositella ja suositella korko (viimeaikainen osto) 0,79
puhtaat pisteet asiantuntija-ja tehtäväajan pisteistä käyttäjiltä 0, 88
pulssioksimetrin tarkkuus ja happisaturaatio 0, 89
todennäköisyys suositella ja raportoida suositusnopeus (brands) 0.90

lääketieteelliset tulokset

esimerkiksi taulukon 1 ensimmäinen merkintä osoittaa, että aspiriinin ottamisen ja sydänkohtausriskin vähentämisen välinen korrelaatio on R = .02. Tämä on taulukon pienin korrelaatio ja hädin tuskin yli 0. Silti aspiriini on kuulunut sydänterveyden suosituksiin vuosikymmenten ajan, vaikka sitä nyt kyseenalaistetaankin.

blockbuster-lääkkeen (ja TV-kaupallisen tavallisen) Viagran korrelaatio on R = .38 kanssa ” parantunut suorituskyky.”Psykoterapiassa on korrelaatio ”vain” r = .32 tulevaisuuden hyvinvoinnista. Pituudella ja painolla, joiden perinteisesti on ajateltu korreloivan voimakkaasti, on korrelaatio R = .44 Kun mitataan objektiivisesti Yhdysvalloissa tai r = .38 Bangladeshilaisesta näytteestä. Se ei eroa mustetahrojen pätevyydestä yhdessä tutkimuksessa. Yhteys ”pulssihärkäantureiden” välillä, jotka laitat sormeesi lääkärissä, ja veren todellisen hapen välillä on R = .89. Kaikki nämä voidaan nähdä yhteydessä kahden tupakoinnin korrelaatiot edellä, r = .08 ja r = .40.

työsuoritus

taulukossa 1 on korrelaatiot useiden työsuoritusta kuvaavien indikaattorien osalta, mukaan lukien korkeakoulujen arvosanat (r = .16), vuosien kokemus (r = .18), jäsentämättömät haastattelut (r=.38), yleinen henkinen kyky (r = .51); työnäytteiden paras ennustaja on työnäytteet, r =.54. Katso videolta, miten Google käy keskustelua siitä, miten Google on muokannut palkkauskäytäntöjään näiden tietojen perusteella.

Korkeakoulumenestys

tupakoinnin tavoin soveltuvuuskokeiden ja suoritusten yhteyttä on tutkittu paljon. Taulukko 1 sisältää myös useita esimerkkejä korrelaatioista standardoidun testauksen ja varsinaisen college-suorituksen välillä: valkoisille ja aasialaisille opiskelijoille Ivy League University of Pennsylvania (r = .20), College GPA opiskelijoille Jemenissä (r = .41), GRE quantitative reasoning Ja MBA GPA (r = .37) alkaen 10 valtion yliopistot Floridassa, ja SAT tulokset ja kumulatiivinen GPA Ivy League Dartmouth College kaikille opiskelijoille (r = .43).

asiakas-ja Käyttäjäkäyttäytyminen

i ’ve included several validity correlations from the work we’ ve done at MeasuringU, including the correlation between intent to recommend and 90 day recommend rates for the Last purchase (r = .79), sus-pisteet ja ohjelmistoalan kasvu (r = .74), Net Promoter Score ja kasvumittarit 14 toimialalla (r = .35), arvioijien puhtaat pisteet ja käyttäjien tehtävän helppouden pisteet (r = .67). Samanlaisia korrelaatioita nähdään myös julkaistujen tutkimusten välillä ihmisten ostoaikeista ja ostoprosenteista (r = .53) ja käyttötarkoitus ja todellinen käyttö (r = .50)kuten näimme tam.

opetus tässä on, että vaikka joidenkin korrelaatioiden arvo on pieni, seurauksia ei voi sivuuttaa. Siksi yleisiä korrelaatiosääntöjä on niin vaikea soveltaa. Toivon on taulukko voimassaolo korrelaatiot täällä eri aloilla auttaa muita ajattelemaan kriittisesti vaivaa kerätä ja vaikutus kunkin yhdistyksen.

yhteenveto ja Takeaways

tämä keskustelu korrelaatiosta assosiaation mittana ja validiteettikorrelaatiokertoimien analyysi paljasti:

korrelaatiot kvantifioivat suhteita. Pearsonin korrelaatio r on yleisin (mutta ei ainoa) tapa kuvata muuttujien välistä suhdetta, ja se on yleinen kieli kuvaamaan vaikutusten kokoa eri tieteenaloilla.

validiteetti-ja luotettavuuskertoimet eroavat toisistaan. Kaikki korrelaatiot eivät ole tasavertaisia. Samasta näytteestä saadut korrelaatiot (monometodi) tai luotettavuuskorrelaatiot (samaa mittaria käyttäen) ovat usein korkeampia r (r > .7) ja voi johtaa epärealistisen korkeaan korrelaatiopalkkiin.

korrelaatiot voivat olla heikkoja, mutta vaikuttavia. Jopa numeerisesti ”pienet” korrelaatiot ovat sekä päteviä että merkityksellisiä, kun otetaan huomioon vaikutuksen (esim.terveysvaikutukset) ja mittaamisen vaiva ja kustannukset. Tupakointi, aspiriini, ja jopa psykoterapia korrelaatiot ovat hyviä esimerkkejä siitä, mitä voidaan karkeasti tulkita heikko vaatimaton korrelaatioita, mutta jossa tulos on varsin välillinen.

älä aseta epärealistisen korkeita palkkeja kelpoisuudelle. Korrelaation kontekstin ymmärtäminen auttaa antamaan merkitystä. Jos jotain voidaan mitata helposti ja alhaisin kustannuksin, mutta sillä on edes vaatimaton kyky ennustaa vaikuttava tulos (kuten yrityksen suorituskyky, korkeakoulujen suorituskyky, elinajanodote tai työsuoritus), se voi olla arvokas. Tupakoinnin ja syövän välinen” matala ” korrelaatio (r = .08) on hyvä muistutus tästä.