Articles

MeasuringU: Che cosa è una forte correlazione?

Il fumo causa il cancro.

Le avvertenze sulle etichette delle sigarette e dalle organizzazioni sanitarie affermano chiaramente che il fumo causa il cancro.

Ma come lo sappiamo?

Il fumo precede il cancro (principalmente il cancro ai polmoni). Le persone che fumano sigarette tendono ad avere polmoni e altri tumori più di quelli che non fumano. Diciamo che il fumo è correlato al cancro. Attentamente escludere altre cause e si hanno gli ingredienti per rendere il caso di causalità.

La correlazione è un ingrediente necessario ma non sufficiente per la causalità. O come hai sentito senza dubbio: la correlazione non equivale alla causalità. Una correlazione quantifica l’associazione tra due cose. Ma la correlazione non deve dimostrare che la causalità sia utile. Spesso solo sapere una cosa precede o predice qualcos’altro è molto utile. Ad esempio, sapere che le prestazioni dei candidati di lavoro sui campioni di lavoro predice le loro prestazioni lavorative future aiuta i manager ad assumere i candidati giusti. Diremmo che le prestazioni del campione di lavoro sono correlate (predice) le prestazioni del lavoro, anche se i campioni di lavoro non causano prestazioni di lavoro migliori.

Un modo comune (ma non l’unico) per calcolare una correlazione è la correlazione di Pearson (indicata con una r), resa famosa (ma non derivata) da Karl Pearson alla fine degli anni 1880. Va da una perfetta correlazione positiva (+1) a una perfetta correlazione negativa (-1) o nessuna correlazione (r = 0). In pratica, una perfetta correlazione di 1 è un’informazione completamente ridondante, quindi è improbabile che la incontri.

Il coefficiente di correlazione ha i suoi difetti e non è considerato “robusto” contro cose come non normalità, non linearità, diverse varianze, influenza di valori anomali e un intervallo limitato di valori. Le mancanze tuttavia, non lo rendono inutile o fatalmente imperfetto. Di conseguenza, è ampiamente usato in molte discipline scientifiche per descrivere la forza delle relazioni perché è ancora spesso significativo. È una sorta di linguaggio comune di associazione in quanto le correlazioni possono essere calcolate su molte misure (ad esempio, tra due misure o ranghi binari).

Tornando alla connessione fumo e cancro, una stima da uno studio di 25 anni sulla correlazione tra fumo e cancro ai polmoni negli Stati Uniti è r = .08-una correlazione appena sopra 0. Potresti aver conosciuto un fumatore per tutta la vita che non ha avuto il cancro—illustrando il punto (e la bassa entità della correlazione) che non tutti quelli che fumano (anche molto) hanno il cancro.

Secondo alcune stime, il 75% -85% dei forti fumatori per tutta la vita NON si ammalano di cancro. Infatti, l ‘ 80% -90% delle persone che si ammalano di cancro ai polmoni non sono fumatori o non hanno mai fumato!

Ma uno studio è raramente l’ultima parola su una constatazione e certamente non una correlazione. Ci sono molti modi per misurare il collegamento cancro fumo e la correlazione varia alcuni a seconda di chi viene misurato e come.

Ad esempio, in un altro studio sui paesi in via di sviluppo, la correlazione tra la percentuale della popolazione adulta che fuma e l’aspettativa di vita è r = .40, che è certamente più grande del .08 dallo studio statunitense, ma è lontano dalla correlazione quasi perfetta che la saggezza convenzionale e le etichette di avvertimento implicherebbero.

Sebbene le correlazioni non siano necessariamente il modo migliore per descrivere il rischio associato alle attività, è comunque utile per comprendere la relazione. Ma soprattutto, comprendere i dettagli su cui si è formata la correlazione e comprenderne le conseguenze sono i passaggi critici nel mettere le correlazioni in prospettiva.

Validità vs. Correlazioni di affidabilità

Mentre probabilmente non stai studiando la salute pubblica, la tua vita professionale e personale è piena di correlazioni che collegano due cose (ad esempio, fumo e cancro, punteggi dei test e risultati scolastici, o bere caffè e migliorare la salute). Queste correlazioni sono chiamate correlazione di validità. La validità si riferisce al fatto che qualcosa misura ciò che intende misurare. Diremmo che una serie di domande di intervista che predice le prestazioni del lavoro è valida. Oppure un questionario di usabilità è valido se è correlato al completamento dell’attività su un prodotto. La forza della correlazione parla alla forza della rivendicazione di validità.

A MeasuringU scriviamo ampiamente sulla nostra ricerca e sugli altri e spesso citiamo i coefficienti di correlazione. Tuttavia, non tutte le correlazioni sono create uguali e non tutte sono correlazioni di validità. Un’altra correlazione comune è la correlazione di affidabilità (la coerenza delle risposte) e le correlazioni che provengono dallo stesso campione di partecipanti (chiamate correlazioni monometodiche). Le correlazioni monometodiche sono più facili da raccogliere (è necessario solo un campione di dati) ma poiché i dati provengono dagli stessi partecipanti le correlazioni tendono ad essere gonfiate. Anche le correlazioni di affidabilità tendono ad essere comunemente riportate in documenti peer reviewed e sono in genere molto più alte, spesso r >.7. La disponibilità di queste correlazioni superiori può contribuire all’idea che correlazioni come r =.3 o anche r = .1 sono privi di significato.

Ad esempio, abbiamo trovato che l’affidabilità del test-retest del Net Promoter Score è r = .7. Esempi di una correlazione monometodo sono la correlazione tra il SUS e NPS (r = .62), tra le singole voci SUS e il punteggio SUS totale (r = .9), e tra il SUS e il UMUX-Lite (r = .83), tutti raccolti dallo stesso campione e partecipanti. Queste sono anche correlazioni di validità legittime (chiamate validità concorrente) ma tendono ad essere più alte perché i valori di criterio e previsione derivano dalla stessa fonte.

Interpretazione dei coefficienti di correlazione di validità

Molti campi hanno una propria convenzione su ciò che costituisce una correlazione forte o debole. Nelle scienze comportamentali la convenzione (in gran parte stabilita da Cohen) è che le correlazioni (come misura della dimensione dell’effetto, che include le correlazioni di validità) sopra .5 sono” grandi”, in giro .3 sono “medio,” e .10 e sotto sono ” piccoli.”

Utilizzando la convenzione di Cohen, tuttavia, il legame tra fumo e cancro ai polmoni è debole in uno studio e forse medio nell’altro. Ma anche all’interno delle scienze comportamentali, il contesto è importante. Anche una piccola correlazione con un risultato consequenziale (efficacia della psicoterapia) può ancora avere conseguenze sulla vita e sulla morte.

La quadratura della correlazione (chiamata coefficiente di determinazione) è un’altra pratica comune di interpretare la correlazione (e la dimensione dell’effetto), ma può anche sottovalutare la forza di una relazione tra variabili e spesso si preferisce utilizzare lo standard R. Esploreremo altri modi di interpretare le correlazioni in un prossimo articolo.

Ho raccolto correlazioni di validità in più discipline da diversi articoli pubblicati (molte meta-analisi) che includono studi sugli effetti medici e psicologici, prestazioni lavorative, prestazioni universitarie e la nostra ricerca sul comportamento dei clienti e degli utenti per fornire un contesto alle correlazioni di validità. Molti degli studi nella tabella provengono dal documento influente di Meyer et al. (2001).

Description Correlation
Aspirin and reduced risk of heart attack 0.02
Ever Smoking and Lung Cancer after 25 years 0.08
College Grades and Job Performance 0.16
Years of Experience & Job Performance 0.18
Punteggi SAT e GPA Cumulativo presso la University of Pennsylvania per (Bianco & Studenti Asiatici) 0.20
HS Classe di Rango e GPA Cumulativo presso la University of Pennsylvania per (Bianco & Studenti Asiatici) 0.26
Psicoterapia e Successive benessere 0.32
Raw Net Promoter Punteggi e Futuro Ditta Ricavi in Crescita in 14 Settori 0.35
GRE Ragionamento Quantitativo e MBA GPA 0.37
non strutturate Colloqui di Lavoro e le Prestazioni di Lavoro 0.38
Viagra e migliorato il funzionamento sessuale 0.38
Peso e Altezza dal 639 del Bangladesh Studenti (Media di Uomini e Donne) 0.38
Comportamento Passato come Predittore del Comportamento Futuro 0.39
% di Popolazione Adulta che Fuma e l’Aspettativa di Vita nei Paesi in via di Sviluppo 0.40
College Esame di ammissione e College GPA in Yemen 0.41
Punteggi SAT e GPA Cumulativo da Dartmouth Studenti 0.43
Peso e Altezza in NOI da 16,948 partecipanti 0.44
NPS Fila di Futuro e di Impresa Ricavi in Crescita in 14 Settori 0.44
Rorschach PRS punteggi e successive psicoterapia risultato 0.44
Intenzione di utilizzare la tecnologia e l’utilizzo effettivo 0.50
Generale Mentale, la Capacità e le Prestazioni di Lavoro 0.51
Intenzione di Acquisto e di Acquisto di una Meta-Analisi (60 Studi) 0.53
Campione di Lavoro e le Prestazioni di Lavoro 0.54
PURO Punteggi Da Esperti e SUPR-Q Punteggi per gli Utenti 0.55
PURO Punteggi Da Esperti e SEGUENTI Punteggi per gli Utenti 0.67
Probabilità di Raccomandare e Consigliare Tasso (Recente Raccomandazione) 0.69
SUS Punteggi e Software in Futuro la Crescita dei Ricavi (Prodotti Selezionati) 0.74
intenzioni di Acquisto e Tasso di Acquisto per i Nuovi Prodotti (n=18) 0.75
SUPR-Q quintiles e 90 Giorni di acquisto costo 0.78
Probabilità di Raccomandare e Consigliare Tasso (Recente Acquisto) 0.79
PURO Punteggi Da Esperti e l’Ora dell’Attività dei Punteggi di Utenti 0.88
Precisione di Pulsossimetro e la Saturazione di Ossigeno 0.89
Probabilità di Raccomandare e Segnalato Consiglia di Tasso (Marche) 0.90

Risultati medici

Ad esempio, la prima voce nella Tabella 1 mostra che la correlazione tra l’assunzione di aspirina e la riduzione del rischio di infarto è r = .02. Questa è la più piccola correlazione nella tabella e appena sopra 0. Eppure l’aspirina è stato un fiocco di raccomandazioni per la salute del cuore per decenni, anche se ora è in discussione.

Il farmaco di successo (e TV commerciale regolare) Viagra ha una correlazione di r = .38 con “prestazioni migliorate.”La psicoterapia ha una correlazione di” solo” r = .32 sul benessere futuro. Altezza e peso che sono tradizionalmente pensati come fortemente correlati hanno una correlazione di r = .44 quando misurato oggettivamente negli Stati Uniti o r = .38 da un campione del Bangladesh. Non è così diverso dalla validità delle macchie di inchiostro in uno studio. La connessione tra i sensori “pulse-ox” che hai messo al dito contro il medico e l’ossigeno effettivo nel sangue è r = .89. Tutti questi possono essere visti nel contesto delle due correlazioni di fumo discusse in precedenza, r = .08 e r = .40.

Prestazioni lavorative

La tabella 1 mostra le correlazioni per diversi indicatori di prestazioni lavorative, inclusi i gradi universitari (r = .16), anni di esperienza (r = .18), interviste non strutturate (r=.38), capacità mentale generale (r = .51); il miglior predittore delle prestazioni di lavoro è campioni di lavoro, r =.54. Vedi Come funziona Google per una discussione su come Google ha adattato le sue pratiche di assunzione basate su questi dati.

Prestazioni del college

Come il fumo, il legame tra test attitudinali e risultati è stato ampiamente studiato. La tabella 1 contiene anche diversi esempi di correlazioni tra test standardizzati e prestazioni effettive del college: per i bianchi e gli studenti asiatici presso l’Ivy League University of Pennsylvania (r = .20), Collegio GPA per gli studenti in Yemen (r = .41), GRE quantitative reasoning e MBA GPA (r = .37) di 10 università statali in Florida, e punteggi SAT e GPA cumulativo dalla Ivy League Dartmouth College per tutti gli studenti (r = .43).

Comportamento del cliente e dell’utente

Ho incluso diverse correlazioni di validità dal lavoro che abbiamo fatto a MeasuringU, inclusa la correlazione tra intent to recommend e 90 day recommend rate per l’acquisto più recente (r = .79), i punteggi SUS e la crescita del settore del software (r = .74), il Net Promoter Score e le metriche di crescita in 14 settori (r = .35), punteggi PURI valutatori e punteggi task-facilità degli utenti (r = .67). Correlazioni simili si osservano anche tra gli studi pubblicati sull’intenzione delle persone di acquistare e acquistare i tassi (r = .53) e l’intento di utilizzare e l’uso effettivo (r = .50) come abbiamo visto con il TAM.

La lezione qui è che mentre il valore di alcune correlazioni è piccolo, le conseguenze non possono essere ignorate. E questo è ciò che rende le regole generali delle correlazioni così difficili da applicare. La mia speranza è che la tabella delle correlazioni di validità qui da campi disparati aiuti gli altri a pensare criticamente allo sforzo di raccogliere e all’impatto di ogni associazione.

Sommario e take Away

Questa discussione sulla correlazione come misura dell’associazione e un’analisi dei coefficienti di correlazione di validità ha rivelato:

Le correlazioni quantificano le relazioni. La correlazione di Pearson r è il modo più comune (ma non solo) per descrivere una relazione tra variabili ed è un linguaggio comune per descrivere la dimensione degli effetti tra le discipline.

I coefficienti di validità e affidabilità differiscono. Non tutte le correlazioni sono uguali. Le correlazioni ottenute dallo stesso campione (monometodo) o le correlazioni di affidabilità (utilizzando la stessa misura) sono spesso più alte r (r > .7) e può portare a una barra di correlazione irrealisticamente alta.

Le correlazioni possono essere deboli ma di impatto. Anche le correlazioni numericamente “piccole” sono valide e significative quando vengono presi in considerazione i contesti di impatto (ad esempio, le conseguenze sulla salute) e lo sforzo e il costo della misurazione. Le correlazioni di fumo, aspirina e persino psicoterapia sono buoni esempi di ciò che può essere interpretato grossolanamente come correlazioni deboli o modeste, ma in cui il risultato è abbastanza consequenziale.

Non impostare barre irrealisticamente alte per la validità. Comprendere il contesto di una correlazione aiuta a fornire significato. Se qualcosa può essere misurato facilmente e a basso costo, ma ha anche una modesta capacità di prevedere un risultato di impatto (come le prestazioni aziendali, le prestazioni del college, l’aspettativa di vita o le prestazioni lavorative), può essere prezioso. La correlazione “bassa” tra fumo e cancro (r = .08) è un buon promemoria di questo.