MeasuringU: Hva Er En Sterk Korrelasjon?
Røyking forårsaker kreft.
Advarsler på sigarettetiketter og fra helseorganisasjoner gjør alle det klare utsagnet om at røyking forårsaker kreft.
men hvordan vet vi det ?
Røyking foregår kreft (for det meste lungekreft). Folk som røyker sigaretter har en tendens til å få lunge og andre kreftformer mer enn de som ikke røyker. Vi sier at røyking er korrelert med kreft. Forsiktig utelukke andre årsaker, og du har ingrediensene til å gjøre saken for årsakssammenheng.
Korrelasjon er en nødvendig, men ikke tilstrekkelig ingrediens for årsakssammenheng. Eller som du sikkert har hørt: Korrelasjon er ikke lik årsakssammenheng. En korrelasjon kvantifiserer sammenhengen mellom to ting. Men korrelasjon trenger ikke å bevise årsakssammenheng for å være nyttig. Ofte bare å vite en ting foran eller spår noe annet er svært nyttig. For eksempel, å vite at jobbkandidaters ytelse på arbeidsprøver forutsier deres fremtidige jobbytelse, hjelper ledere med å ansette de riktige kandidatene. Vi vil si at arbeidsprøveytelse korrelerer med (forutsier) arbeidsytelse, selv om arbeidsprøver ikke gir bedre arbeidsytelse.En vanlig (men ikke den eneste) måten å beregne en korrelasjon på er Pearson-korrelasjonen (betegnet med en r), gjort berømt (men ikke avledet) av Karl Pearson på slutten av 1880-tallet. den spenner fra en perfekt positiv korrelasjon (+1) til en perfekt negativ korrelasjon (-1) eller ingen korrelasjon (r = 0). I praksis er en perfekt korrelasjon på 1 helt overflødig informasjon, så du er usannsynlig å møte den.korrelasjonskoeffisienten har sine mangler og anses ikke som «robust» mot ting som ikke-normalitet, ikke-linearitet, forskjellige avvik, påvirkning av uteliggere og et begrenset utvalg av verdier. Mangler gjør det imidlertid ikke ubrukelig eller dårlig feil. Følgelig er det mye brukt på tvers av mange vitenskapelige disipliner for å beskrive styrken av relasjoner fordi det fortsatt ofte er meningsfylt. Det er slags felles språk for forening som korrelasjoner kan beregnes på mange tiltak (for eksempel mellom to binære tiltak eller ranger).Tilbake Til røyking og kreftforbindelse er et estimat fra en 25-årig studie om sammenhengen mellom røyking og lungekreft i USA r = .08-en korrelasjon knapt over 0. Du har kanskje kjent en livslang røyker som ikke fikk kreft-illustrerer poenget (og den lave størrelsen på korrelasjonen) at ikke alle som røyker (enda mye) får kreft.av noen estimater får 75% -85% av livslang tunge røykere ikke kreft. Faktisk er 80% -90% av personer som får lungekreft ikke røykere eller aldri røkt!Men en studie er sjelden det siste ordet på et funn og absolutt ikke en korrelasjon. Det er mange måter å måle røyking kreft link og korrelasjonen varierer noe avhengig av hvem som er målt og hvordan.
for eksempel, i en annen studie av utviklingsland, er korrelasjonen mellom prosent av den voksne befolkningen som røyker og forventet levealder r = .40, som er absolutt storre enn den .08 fra den AMERIKANSKE studien, men det er langt fra den nesten perfekte korrelasjonen konvensjonell visdom og advarselsetiketter ville innebære.mens korrelasjoner ikke nødvendigvis er den beste måten å beskrive risikoen forbundet med aktiviteter, er det fortsatt nyttig å forstå forholdet. Men viktigere, forstå detaljene hvorpå korrelasjonen ble dannet og forstå deres konsekvenser er de kritiske trinnene i å sette sammenhenger i perspektiv.
Gyldighet vs. Mens du sannsynligvis ikke studerer folkehelsen, er ditt faglige og personlige liv fylt med korrelasjoner som knytter to ting (for eksempel røyking og kreft, testresultater og skoleprestasjoner, eller drikker kaffe og forbedret helse). Disse korrelasjonene kalles validitetskorrelasjon. Gyldighet refererer til om noe måler hva det har til hensikt å måle. Vi vil si at et sett med intervjuspørsmål som forutsier jobbprestasjon, er gyldig. Eller et spørreskjema om brukervennlighet er gyldig hvis det korrelerer med oppgavens fullføring på et produkt. Styrken av korrelasjonen taler til styrken av gyldighetskravet.
På MeasuringU skriver vi mye om vår egen og andres forskning og ofte sitere korrelasjonskoeffisienter. Men ikke alle korrelasjoner er skapt like og ikke alle er validitet korrelasjoner. En annen vanlig korrelasjon er pålitelighetskorrelasjonen (konsistensen av svar) og korrelasjoner som kommer fra samme utvalg av deltakere (kalt monometodkorrelasjoner). Monometodkorrelasjoner er enklere å samle inn (du trenger bare ett utvalg av data), men fordi dataene kommer fra de samme deltakerne, har korrelasjonene en tendens til å bli oppblåst. Reliabilitet korrelasjoner pleier også å være både vanlig rapportert i fagfellevurderte papirer og er også vanligvis mye høyere ,ofte r >.7. Tilgjengeligheten av disse høyere korrelasjonene kan bidra til ideen om at korrelasjoner som r =.3 eller r = .1 er meningsløst.
vi fant for eksempel at test-retest-påliteligheten til Net Promoter-Poengsummen er r = .7. Eksempler på en monometodkorrelasjon er korrelasjonen MELLOM SUS og NPS (r = .62), mellom individuelle sus-elementer og den totale sus-poengsummen (r = .9), og mellom SUS OG UMUX-Lite (r = .83), alle samlet fra samme utvalg og deltakere. Dette er også legitim validitet korrelasjoner (kalt samtidig validitet), men har en tendens til å være høyere fordi kriterium og prediksjon verdier er avledet fra samme kilde.
Tolke Validitet Korrelasjonskoeffisienter
Mange felt har sin egen konvensjon om hva som utgjør en sterk eller svak korrelasjon. I atferdsvitenskapene er konvensjonen (i stor grad etablert Av Cohen) at korrelasjoner (som et mål på effektstørrelse, som inkluderer validitetsforstyrrelser) ovenfor .5 er «store» rundt .3 er «medium», og .10 og nedenfor er » små.»Ved Hjelp Av Cohens konvensjon er forbindelsen mellom røyking og lungekreft svak i en studie og kanskje medium i den andre. Men selv innenfor atferdsvitenskapene er konteksten viktig. Selv en liten sammenheng med et konsekvensutfall (effektiviteten av psykoterapi) kan fortsatt ha liv og død konsekvenser.Kvadrering av korrelasjonen (kalt bestemmelseskoeffisienten) Er en annen vanlig praksis for å tolke korrelasjonen (og effektstørrelsen), men kan også undergrave styrken av et forhold mellom variabler, og bruk av standard r er ofte foretrukket. Vi vil utforske flere måter å tolke korrelasjoner i en fremtidig artikkel.jeg har samlet gyldighetskorrelasjoner på tvers av flere disipliner fra flere publiserte artikler (mange meta-analyser) som inkluderer studier om medisinske og psykologiske effekter, jobbprestasjon, høyskoleprestasjon og vår egen forskning på kunde-og brukeradferd for å gi kontekst til gyldighetskorrelasjoner. Mange av studiene i tabellen kommer fra den innflytelsesrike papir Av Meyer et al. (2001).
Description | Correlation |
---|---|
Aspirin and reduced risk of heart attack | 0.02 |
Ever Smoking and Lung Cancer after 25 years | 0.08 |
College Grades and Job Performance | 0.16 |
Years of Experience & Job Performance | 0.18 |
SAT Score Og Kumulativ GPA Ved University Of Pennsylvania for (Hvit& Asiatiske Studenter) | 0.20 |
HS Klasse Rang og Kumulativ GPA Ved University Of Pennsylvania for (Hvit& Asiatiske Studenter) | 0.26 | psykoterapi Og Påfølgende velvære | 0.32 | rå net promoter score og fremtidig fast omsetningsvekst i 14 bransjer | 0.35 | gre kvantitativ resonnement Og mba gpa | 0.37 |
Ustrukturerte Jobbintervjuer og Ytelse | 0,38 | 0,38 | Høyde Og Vekt fra 639 Bangladeshiske Studenter (Gjennomsnitt Av Menn og Kvinner) | 0,38 |
tidligere atferd som prediktor for fremtidig atferd | 0.39 |
% av den voksne befolkningen som røyker og forventet levealder i utviklingsland | 0.40 | College opptaksprøve og college gpa i Jemen | 0.41 |
SAT Score og Kumulative GPA Fra Dartmouth Studenter | 0.43 | Høyde Og Vekt I USA fra 16,948 deltakere | 0.44 | NPS Rangerer Og Fremtidig Fast Omsetningsvekst i 14 Bransjer | 0,44 |
rorschach Prs Score OG PÅFØLGENDE psykoterapi Utfallet | 0.44 | intensjon å bruke Teknologi OG Faktisk bruk | 0.50 | generell mental evne og jobb ytelse | 0.51 |
Kjøp Intensjon Og Innkjøp Meta Analyse (60 Studier) | 0,53 | Arbeid Prøve Og Jobb Ytelse | 0,54 |
RENE Score Fra Ekspert Og SUPR-Q Score Fra Brukere | 0,55 | sannsynlighet for å anbefale og anbefale rate (siste anbefaling) | 0.69 | sus score og fremtidig programvare omsetningsvekst (Utvalgte Produkter) | 0.74 |
Kjøp Hensikt Og Kjøp Rate For Nye Produkter (n=18) | 0,75 | SUPR-Q quintiles og 90 Dagers kjøp priser | 0,78 | Sannsynlighet For Å Anbefale Og Anbefale Rate (Siste Kjøp) | 0,79 en score Fra Ekspert Og oppgave Tid Score Fra Brukere | 0.88 |
nøyaktighet av pulsoksymeter og OKSYGENMETNING | 0.89 | sannsynlighet for å anbefale Og rapportert anbefale rate (merker) | 0.90 |
Medisinske Utfall
for eksempel viser den Første oppføringen i Tabell 1 at korrelasjonen mellom å ta aspirin og redusere risikoen for hjerteinfarkt er r = .02. Dette er den minste korrelasjonen i tabellen og knapt over 0. Likevel har aspirin vært en stift av anbefalinger for hjertes helse i flere tiår, selv om det nå blir utspurt.
blockbuster-stoffet (Og TV-kommersiell vanlig) Viagra har en korrelasjon på r = .38 med » forbedret ytelse.»Psykoterapi har en sammenheng med» bare » r = .32 på fremtidig velvære. Høyde og vekt som tradisjonelt er tenkt som sterkt korrelert har en korrelasjon av r = .44 når objektivt målt I USA eller r = .38 Fra En Bangladeshisk prøve. Det er ikke så annerledes enn gyldigheten av blekkblotter i en studie. Forbindelsen mellom» puls-ox » sensorene du legger på fingeren hos legen og faktisk oksygen i blodet ditt er r = .89. Alle disse kan sees i sammenheng med de to røyking korrelasjoner diskutert tidligere, r = .08 og r = .40.
Jobbytelse
Tabell 1 viser korrelasjoner for flere indikatorer på jobbytelse, inkludert høyskolekarakterer (r = .16), års erfaring (r = .18), ustrukturerte intervjuer (r=.38), generell mental evne (r = .51) ; den beste prediktoren for jobbytelse er arbeidsprøver, r =.54. Se Hvordan Google Jobber for en diskusjon om Hvordan Google tilpasset sin ansettelsespraksis basert på disse dataene.
College Ytelse
som røyking, koblingen mellom evnetester og prestasjon har blitt grundig studert. Tabell 1 inneholder også flere eksempler på sammenhenger mellom standardisert testing og faktisk høyskoleprestasjon: For Hvite og Asiatiske studenter ved Ivy League University Of Pennsylvania (r = .20), College GPA for studenter I Jemen (r = .41), GRE kvantitativ resonnement OG MBA GPAs (r = .37) fra 10 statlige universiteter I Florida, OG SAT score og kumulativ GPA Fra Ivy League Dartmouth College for alle studenter (r = .43).
Kunde-Og Brukeradferd
jeg har tatt med flere gyldighetskorrelasjoner fra arbeidet vi har gjort På MeasuringU, inkludert korrelasjonen mellom intent to recommend og 90 day recommend rates for det siste kjøpet (r = .79), sus score og programvareindustri vekst (r = .74), Net Promoter Score og vekst beregninger i 14 bransjer (r = .35), evaluators ‘ RENE score og brukernes oppgave-lette score (r = .67). Lignende korrelasjoner er også sett mellom publiserte studier på folks hensikt å kjøpe og kjøpsrater (r = .53) og hensikt å bruke og faktisk bruk (r = .50) som vi så MED TAM.leksjonen her er at mens verdien av noen korrelasjoner er liten, kan konsekvensene ikke ignoreres. Og det er det som gjør generelle regler for korrelasjoner så vanskelig å anvende. Mitt håp er tabellen over gyldighet korrelasjoner her fra ulike felt vil hjelpe andre til å tenke kritisk om innsatsen for å samle inn og virkningen av hver forening.
Sammendrag og Takeaways
denne diskusjonen om korrelasjonen som et mål på forening og en analyse av validitet korrelasjonskoeffisienter viste:
Korrelasjoner kvantifiserer relasjoner. Pearson korrelasjon r er den vanligste (men ikke bare) måten å beskrive et forhold mellom variabler og er et felles språk for å beskrive størrelsen på effekter på tvers av disipliner.
Validitet og pålitelighetskoeffisienter varierer. Ikke alle sammenhenger er skapt like. Korrelasjoner oppnådd fra samme prøve (monometod) eller pålitelighetskorrelasjoner (ved bruk av samme mål) er ofte høyere r (r > .7) og kan føre til en urealistisk høy korrelasjonslinje.
Korrelasjoner kan være svake, men effektive. Selv numerisk » små » korrelasjoner er både gyldige og meningsfulle når sammenhenger av påvirkning (f.eks. helsekonsekvenser) og innsats og kostnader for måling regnskapsføres. Røyking, aspirin og til og med psykoterapi korrelasjoner er gode eksempler på hva som kan grovt tolkes som svake til beskjedne korrelasjoner, men hvor utfallet er ganske konsekvens.
ikke sett urealistisk høye stolper for gyldighet. Å forstå sammenhengen mellom en korrelasjon bidrar til å gi mening. Hvis noe kan måles enkelt og for lav pris, men har til og med en beskjeden evne til å forutsi et slagkraftig utfall (for eksempel selskapets ytelse, høyskoleprestasjon, forventet levetid eller jobbprestasjon), kan det være verdifullt. Den» lave » korrelasjonen mellom røyking og kreft (r = .08) er en god påminnelse om dette.