Articles

MeasuringU: o que é uma forte correlação?

fumar provoca cancro.todas as advertências nos rótulos dos cigarros e das organizações de saúde fazem uma clara afirmação de que o tabagismo provoca cancro.mas como sabemos?o tabagismo precede o cancro (principalmente o cancro do pulmão). As pessoas que fumam cigarros tendem a ter mais câncer de pulmão e outros do que aqueles que não fumam. Dizemos que fumar está correlacionado com o cancro. Cuidadosamente descartar outras causas e você tem os ingredientes para justificar a causa.a correlação de

é um ingrediente necessário mas não suficiente para causar a causalidade. Ou como sem dúvida ouviu, a correlação não é igual à causa. A correlação quantifica a associação entre duas coisas. Mas a correlação não tem de provar que a causa é útil. Muitas vezes apenas saber uma coisa precede ou prevê outra coisa é muito útil. Por exemplo, saber que o desempenho dos candidatos a emprego em amostras de trabalho prevê o seu desempenho futuro ajuda os gestores a contratar os candidatos certos. Diríamos que o desempenho da amostra de trabalho está correlacionado com o desempenho do trabalho (prevê), mesmo que as amostras de trabalho não causem melhor desempenho do trabalho.

Um comum (mas não a única) maneira para calcular a correlação é a correlação de Pearson (indicados com um r), que se tornou famosa (mas não derivada) por Karl Pearson no final da década de 1880. Ele varia de uma perfeita correlação positiva (+1) para uma perfeita correlação negativa (-1) ou nenhuma correlação (r = 0). Na prática, uma correlação perfeita de 1 é informação completamente redundante, por isso é pouco provável que a encontre.

O coeficiente de correlação tem suas deficiências e não é considerado “robusto” contra coisas como não-normalidade, não-linearidade, variâncias diferentes, influência de valores anómalos, e uma gama restrita de valores. Deficiências no entanto, não torná-lo inútil ou fatalmente falho. Consequentemente, é amplamente utilizado em muitas disciplinas científicas para descrever a força das relações porque ainda é muitas vezes significativo. É uma espécie de linguagem comum de associação como correlações podem ser computadas em muitas medidas (por exemplo, entre duas medidas binárias ou fileiras).= = relação entre o tabagismo e o câncer = = uma estimativa de um estudo de 25 anos sobre a correlação entre o tabagismo e o câncer de pulmão nos Estados Unidos é r=.08-uma correlação pouco acima de 0. Você pode ter conhecido um fumante ao longo da vida que não teve câncer—ilustrando o ponto (e a baixa magnitude da correlação) que nem todo mundo que fuma (mesmo muito) tem câncer.de acordo com algumas estimativas, 75% -85% dos fumadores pesados ao longo da vida não têm cancro. Na verdade, 80% -90% das pessoas que têm cancro do pulmão não são fumadores ou nunca fumaram!

mas um estudo raramente é a palavra final sobre um achado e certamente não uma correlação. Existem muitas formas de medir a relação entre o cancro do tabagismo e a correlação varia de acordo com quem é medido e como.por exemplo, em outro estudo dos países em desenvolvimento, a correlação entre a porcentagem da população adulta que fuma e a expectativa de vida é r = .40, que é certamente maior do que o.08 do estudo dos EUA, mas está longe da correlação quase perfeita que a sabedoria convencional e rótulos de aviso implicaria.embora as correlações não sejam necessariamente a melhor maneira de descrever o risco associado às atividades, ainda é útil na compreensão da relação. Mas importante, compreender os detalhes sobre os quais a correlação foi formada e compreender as suas consequências são os passos críticos para colocar correlações em perspectiva.

validade vs. Correlações de confiabilidade embora você provavelmente não esteja estudando Saúde Pública, sua vida profissional e pessoal estão repletas de correlações que ligam duas coisas (por exemplo, fumar e câncer, resultados de testes e desempenho escolar, ou beber café e melhorar a saúde). Estas correlações são chamadas de correlação de validade. A validade refere-se à questão de saber se algo mede o que pretende medir. Diríamos que um conjunto de perguntas de entrevista que prevê o desempenho do trabalho é válido. Ou um questionário de usabilidade é válido se correlacionar com o preenchimento de tarefas em um produto. A força da correlação fala da força da reivindicação de validade.

no MeasuringU nós escrevemos extensivamente sobre a nossa própria pesquisa e outras pesquisas e muitas vezes citamos coeficientes de correlação. No entanto, nem todas as correlações são criadas iguais e nem todas são correlações de validade. Outra correlação comum é a correlação de confiabilidade (a consistência das respostas) e correlações que vêm da mesma amostra de participantes (chamadas correlações monometod). As correlações monometod são mais fáceis de coletar (você só precisa de uma amostra de dados), mas porque os dados vêm dos mesmos participantes as correlações tendem a ser inflacionadas. Correlações de confiabilidade também tendem a ser comumente relatadas em artigos revisados por pares e também são tipicamente muito mais altas, muitas vezes r > .7. A disponibilidade destas correlações mais elevadas pode contribuir para a ideia de correlações como r =.3 ou mesmo r = .1 são insignificantes.por exemplo, descobrimos que a fiabilidade do teste-reteste da pontuação do Promotor líquido é r = .7. Exemplos de uma correlação monometódica são a correlação entre o SUS e o NPS (r = .62), entre itens individuais do SUS e a pontuação total do SUS (r = .9), e entre o SUS e o UMUX-Lite (r = .83), todos recolhidos da mesma amostra e participantes. Estas são também correlações legítimas de validade (chamadas de validade concorrente), mas tendem a ser mais elevadas porque o critério e os valores de previsão são derivados da mesma fonte.

interpretando coeficientes de correlação de validade

muitos campos têm sua própria convenção sobre o que constitui uma correlação forte ou fraca. Nas ciências comportamentais a Convenção (amplamente estabelecida por Cohen )é que correlações (como uma medida do tamanho do efeito, que inclui correlações de validade) acima.5 são “grandes”, ao redor .3 são “médio”, e .10 e abaixo são ” pequenos.”

Usando a Convenção de Cohen, porém, a ligação entre o tabagismo e o câncer de pulmão é fraca em um estudo e talvez média no outro. Mas mesmo dentro das ciências comportamentais, o contexto importa. Mesmo uma pequena correlação com um resultado consequente (eficácia da psicoterapia) ainda pode ter consequências de vida e morte.

Quadrado da correlação (chamado de coeficiente de determinação) é outra prática comum de interpretação da correlação (e tamanho do efeito), mas também pode subestimar a força de um relacionamento entre as variáveis, e usando o padrão i é muitas vezes preferido. Vamos explorar mais formas de interpretar correlações num artigo futuro.eu coletei correlações de validade em várias disciplinas de vários artigos publicados (muitas meta-análises) que incluem estudos sobre efeitos médicos e psicológicos, desempenho no trabalho, desempenho na faculdade, e nossa própria pesquisa sobre o comportamento do cliente e usuário para fornecer o contexto para correlações de validade. Muitos dos estudos na tabela vêm do influente artigo de Meyer et al. (2001).

Description Correlation
Aspirin and reduced risk of heart attack 0.02
Ever Smoking and Lung Cancer after 25 years 0.08
College Grades and Job Performance 0.16
Years of Experience & Job Performance 0.18
SAT e GPA Cumulativo na Universidade da Pensilvânia para (Branco & Estudantes Asiáticos) 0.20
HS posição de Classe e GPA Cumulativo na Universidade da Pensilvânia para (Branco & Estudantes Asiáticos) 0.26
Psicoterapia e Subsequente Bem-Estar 0.32
Raw Net Promoter Scores e Futuro de Firme Crescimento das Receitas em 14 Indústrias 0.35
GRE Raciocínio Quantitativo e MBA AGP 0.37
não estruturados, Entrevistas de Trabalho e o Desempenho no Trabalho 0.38
Viagra e melhor funcionamento sexual 0.38
Altura e Peso a partir de 639 Bangladeshi Alunos (Média de Homens e Mulheres) 0.38
Comportamento Passado como Preditor do Comportamento Futuro de 0,39
% da População Adulta que Fuma e Expectativa de Vida nos Países em Desenvolvimento 0.40
Exame de Entrada da Faculdade e Colégio AGP no Iêmen 0.41
SAT e GPA Cumulativo de Dartmouth Alunos de 0,43
Altura e Peso em NÓS a partir 16,948 participantes 0.44
NPS Fileiras e Futuro de Firme Crescimento das Receitas em 14 Indústrias 0.44
Rorschach PRS resultados e subsequente psicoterapia resultado 0.44
Intenção de usar a tecnologia e o uso real 0.50
Geral a Capacidade Mental e o Desempenho no Trabalho 0.51
Intenção de Compra e Compra de Meta-Análise (60 Estudos) 0.53
Exemplo de Trabalho e o Desempenho no Trabalho de 0,54
PURO Pontuação Do Perito e SUPER-Q notas de Usuários 0.55
PURO Pontuação Do Perito e SEQ notas de Usuários 0.67
Probabilidade de Recomendar e Recomendar Taxa (Recente Recomendação) de 0,69
SUS Pontuações e Futuros Receitas de Software de Crescimento (Produtos Selecionados) 0.74
Intenção de Compra e Compra Taxa de Novos Produtos (n=18) 0.75
SUPER-Q quintis e 90 Dias de tarifas de compra de 0,78
Probabilidade de Recomendar e Recomendo (Taxa de Compra Recente) 0.79
PURO Pontuações De um Perito e a Hora de Tarefa notas de Usuários de 0,88
Precisão de Oxímetro de Pulso e Saturação de Oxigênio 0.89
Probabilidade de Recomendar e Relatados Recomendo Taxa (Marcas) 0.90

Resultados Médicos

Por exemplo, a primeira entrada na Tabela 1 mostra que a correlação entre a toma de aspirina e reduzir o risco de ataque cardíaco é r = .02. Esta é a menor correlação na tabela e pouco acima de 0. No entanto, a aspirina tem sido uma base de recomendações para a saúde cardíaca durante décadas, embora esteja agora a ser questionada.

A droga blockbuster (e TV comercial regular) Viagra tem uma correlação de r = .38 com ” melhor desempenho.”A psicoterapia tem uma correlação de “somente” r = .32 sobre o bem-estar futuro. Altura e peso que são tradicionalmente considerados como fortemente correlacionados têm uma correlação de r = .44 quando objectivamente medido nos EUA ou r = .38 de uma amostra de Bangladesh. Não é assim tão diferente da validade das manchas de tinta num estudo. A ligação entre os sensores de” oximetria ” que colocaste no dedo ao médico e o oxigénio real no teu sangue é r = .89. Tudo isso pode ser visto em contexto com as duas correlações tabágicas discutidas anteriormente, r = .08 and r = .40.

desempenho no emprego

A Tabela 1 apresenta correlações para vários indicadores de desempenho no emprego, incluindo as notas nas universidades (r = .16), anos de experiência (r = .18), entrevistas não estruturadas (r=.38), capacidade mental geral (r = .51); O melhor preditor do desempenho do Trabalho É amostras de trabalho, r =.54. Veja como o Google trabalha para uma discussão de como o Google adaptou suas práticas de contratação com base nestes dados.como fumar, a ligação entre testes de aptidão e realização tem sido amplamente estudada. A tabela 1 também contém vários exemplos de correlações entre testes padronizados e desempenho escolar real: para brancos e estudantes asiáticos na Ivy League University of Pennsylvania (r = .20), GPA universitária para estudantes no Iêmen (r = .41), GRE quantitative reasoning and MBA GPAs (r = .37) from 10 state universities in Florida, and SAT scores and cumulative GPA from the Ivy League Dartmouth College for all students (r = .43).

cliente e comportamento do Usuário

incluí várias correlações de validade do trabalho que fizemos na Mensuringu, incluindo a correlação entre a intenção de recomendar e 90 dias recomendar taxas para a compra mais recente (r = .79), pontos SUS e crescimento da indústria de software (r = .74), a pontuação do Promotor líquido e as métricas de crescimento em 14 Indústrias (r = .35), pontuações puras dos avaliadores e pontuações fáceis de tarefa dos utilizadores (r = .67). Correlações semelhantes também são vistas entre estudos publicados sobre a intenção das pessoas de comprar e taxas de compra (r = .53) e intenção de uso e uso Real (r = .50) como vimos com o TAM.

a lição aqui é que, embora o valor de algumas correlações seja pequeno, as consequências não podem ser ignoradas. E é isso que torna as regras gerais das correlações tão difíceis de aplicar. Minha esperança é a tabela de validade correlações aqui de campos díspares vai ajudar os outros a pensar criticamente sobre o esforço para coletar e o impacto de cada associação.

resumo e Takeaways

esta discussão sobre a correlação como uma medida de associação e uma análise dos coeficientes de correlação de validade revelou:

correlações quantificam as relações. A correlação de Pearson R é a forma mais comum (mas não apenas) de descrever uma relação entre variáveis e é uma linguagem comum para descrever o tamanho dos efeitos entre disciplinas.os coeficientes de validade e fiabilidade diferem. Nem todas as correlações são criadas iguais. Correlações obtidas da mesma amostra (monometod) ou correlações de confiabilidade (usando a mesma medida) são muitas vezes mais elevadas r (r > .7) e pode levar a uma barra de correlação irrealisticamente alta.as correlações podem ser fracas, mas impactantes. Mesmo correlações numericamente “pequenas” são válidas e significativas quando os contextos de impacto (por exemplo, consequências para a saúde) e esforço e custo de medição são contabilizados. As correlações entre fumar, aspirina e até psicoterapia são bons exemplos do que pode ser cruelmente interpretado como fraco a correlações modestas, mas onde o resultado é bastante consequente.

não defina barras irrealisticamente altas para Validade. Compreender o contexto de uma correlação ajuda a dar significado. Se algo pode ser medido facilmente e por baixo custo ainda tem até mesmo uma modesta capacidade de prever um resultado impactante (como desempenho da empresa, desempenho da Faculdade, expectativa de vida, ou desempenho do trabalho), pode ser valioso. A correlação “baixa” entre o tabagismo e o câncer (r = .08) é um bom lembrete disso.