Articles

MeasuringU:強い相関とは何ですか?

喫煙は癌を引き起こします。

タバコのラベルや保健機関からの警告はすべて、喫煙が癌を引き起こすという明確な声明を出しています。しかし、どのように我々は知っていますか?

喫煙は癌(主に肺癌)に先行する。

喫煙は癌(主に肺癌)に先行する。 タバコを吸う人は、喫煙しない人よりも肺や他の癌を発症する傾向があります。 私たちは、喫煙は癌と相関していると言います。 慎重に他の原因を除外し、あなたは因果関係のためのケースを作るための成分を持っています。相関は因果関係のために必要ではあるが十分ではない成分である。

または、間違いなく聞いたことがないように:相関は因果関係に等しくありません。 相関は、2つのことの間の関連を定量化します。 しかし、相関関係は因果関係が有用であることを証明する必要はありません。 多くの場合、一つのことが他の何かに先行したり予測したりすることを知ることは非常に役立ちます。 例えば、仕事のサンプルの求職者の性能が彼らの未来の仕事の性能を予測することを知ることはマネージャーが右の候補者を雇うのを助ける。 私たちは、作業サンプルのパフォーマンスは、作業サンプルがより良い作業パフォーマンスを引き起こさないにもかかわらず、作業パフォーマ

相関を計算する一般的な(しかし唯一ではない)方法は、1880年代後半にカール-ピアソンによって有名になったピアソン相関(rで示される)であり、完全な正の相関(+1)から完全な負の相関(-1)または相関なし(r=0)の範囲である。 実際には、1の完全な相関は完全に冗長な情報であるため、それに遭遇する可能性は低いです。

相関係数には欠点があり、非正規性、非線形性、異なる分散、外れ値の影響、および値の制限された範囲などに対して”ロバスト”とはみなされません。

相関係数には欠点があり、非正規性、非線形性、異なる分散、外れ値の影響、および値の制限された範囲に対して”ロバスト”とはみなされません。 しかし、欠点は、それが役に立たないか、致命的に欠陥がないようにしないでください。 その結果、それはまだしばしば意味のある関係の強さを記述するために多くの科学分野で広く使用されています。 相関関係は多くの尺度(たとえば、2つのバイナリ尺度またはランク間)で計算できるため、これは関連の共通言語のようなものです。喫煙と癌の関連に戻ると、米国における喫煙と肺癌の相関に関する25年間の研究からの推定値はr=です。08-相関はほとんど0を超えています。 あなたは、がんにならなかった生涯の喫煙者を知っているかもしれません—喫煙している誰もが(たとえ多くても)がんになるわけではないという点(おいくつかの見積もりでは、生涯の重い喫煙者の75%〜85%が癌にならない。 実際は、肺癌を得る人々の80%-90%は喫煙者ではないか、または決して喫煙しなかった!

しかし、一つの研究はめったに発見の最終的な言葉ではなく、確かに相関関係ではありません。

しかし、一つの研究は、 喫煙癌のリンクを測定する多くの方法があり、相関関係は測定され、どのように人によっていくつか異なります。例えば、発展途上国の別の研究では、喫煙した成人人口の割合と平均余命との相関はr=です。

例えば、発展途上国の別の研究では、喫煙した成人人口の割合と平均寿命との相関はr=です。

40,これは確かによりも大きいです.08米国の研究から、それははるかに完璧に近い相関従来の知恵と警告ラベルが意味するからです。相関関係は必ずしも活動に関連するリスクを記述する最良の方法ではありませんが、関係を理解するのにはまだ役立ちます。

しかし重要なのは、相関関係が形成された詳細を理解し、その結果を理解することは、相関関係を視点に置く上で重要なステップです。

妥当性対 信頼性の相関

あなたはおそらく公衆衛生を勉強していませんが、あなたの専門的および個人的な生活は、二つのこと(例えば、喫煙と癌、テストの点数と学校の成績、またはコーヒーを飲むと健康の改善)を結ぶ相関で満たされています。 これらの相関関係は妥当性相関と呼ばれます。 妥当性とは、何かが測定しようとしているものを測定するかどうかを指します。 私たちは、仕事のパフォーマンスを予測するインタビューの質問のセットが有効であると言うだろう。 または、ユーザビリティアンケートは、製品のタスク完了と相関している場合に有効です。 相関の強さは、妥当性の主張の強さに語りかけます。

MeasuringUでは、私たち自身や他の人の研究について広く書いており、しばしば相関係数を引用しています。 ただし、すべての相関が等しく作成されるわけではなく、すべてが妥当性相関であるわけではありません。 もう1つの共通の相関関係は、信頼性相関(応答の一貫性)と、参加者の同じサンプルから得られる相関(モノメトッド相関と呼ばれる)です。 Monomethod相関は収集が簡単です(データのサンプルは1つだけ必要です)が、データは同じ参加者からのものであるため、相関関係が膨張する傾向があります。 信頼性相関はまた、査読された論文で一般的に報告される傾向があり、通常ははるかに高く、しばしばr>。7. これらのより高い相関の利用可能性は、r=のような相関という考えに寄与することができる。3またはr=。1は無意味です。

例えば、我々は、ネットプロモータースコアのテスト-再テスト信頼性がr=であることがわかりました。7. モノメトッド相関の例は、SUSとNPSとの間の相関である(r=。62),個体間SUS項目の合計SUS点(r=.SUSとUMUX−Liteとの間(r=0.83)、すべて同じサンプルと参加者から収集しました。 これらは正当な妥当性相関(同時妥当性と呼ばれる)でもありますが、基準値と予測値が同じソースから導出されるため、より高くなる傾向があります。

妥当性相関係数の解釈

多くのフィールドは、強い相関または弱い相関を構成するものについて独自の規則を持っています。 行動科学では、(主にコーエンによって確立された)慣習は、上記の相関(有効性相関を含む効果サイズの尺度として)である。5は、周りの”大”です。3つは”中”であり、”中”は”中”である。10以下は”小”です。しかし、コーエンの慣習を使用すると、喫煙と肺がんの関連性は1つの研究では弱く、おそらく他の研究では中程度です。 しかし、行動科学の中でさえ、文脈が重要です。 結果的な結果(心理療法の有効性)との小さな相関でさえ、生死の結果をもたらす可能性があります。

相関(決定係数と呼ばれる)を二乗することは、相関(および効果サイズ)を解釈するもう一つの一般的な方法ですが、変数間の関係の強さを過小評価す 今後の記事では、相関関係を解釈する方法をさらに検討します。

私は、医学的および心理的影響、仕事のパフォーマンス、大学のパフォーマンス、および妥当性相関にコンテキストを提供するために、顧客とユーザーの行動 表の研究の多くは、Meyerらの影響力のある論文から来ています。 (2001).

Description Correlation
Aspirin and reduced risk of heart attack 0.02
Ever Smoking and Lung Cancer after 25 years 0.08
College Grades and Job Performance 0.16
Years of Experience & Job Performance 0.18
Satスコアとペンシルベニア大学の累積GPA for(White&アジアの学生) 0.20
HSクラスランクとペンシルベニア大学の累積GPA for(White&アジアの学生) 0.26 0.20
HSクラスランクとペンシルベニア大学の累積GPA for(White&アジアの学生) 0.26 0.26 0.26 0.26 0.26
心理療法とその後の幸福 0.32
生のネットプロモータースコアと14業界における将来の企業収益の伸び 0.35
Gre定量的推論とmba Gpa 0。37
非構造化就職の面接と仕事のパフォーマンス 0.38
バイアグラと性機能の改善 0.38
639バングラデシュの学生(男性と女性の平均) 0.38
予測因子としての過去の行動0.39
発展途上国における喫煙と平均余命の% 0.40
イエメンの大学入学試験と大学gpa 0。41
ダートマスの学生からのSATスコアと累積GPA 0.43
米国の身長と体重16,948参加者から 0.44
NPSランクと14産業における将来の堅調な収益成長 0.44
Npsランクと14産業における将来の堅調な収益成長 0.44
ロールシャッハprsスコアとその後の心理療法の結果 0.44
技術と実際の使用を使用する意図 0.50
一般的な精神能力と仕事のパフォーマ51
購入意思と購買メタ分析(60研究) 0.53
作業サンプルとジョブパフォーマンス 0.54
エキスパートからの純粋なスコアとユーザーからのSUPR-Qスコア 0.55
エキスパートとSEQスコアからの純粋なスコアユーザーから 0.67
推奨する可能性と推奨レート(最近の推奨) 0.69
susスコアと将来のソフトウェア収益の伸び(選択した製品) 0。74
新製品の購入意図と購入率(n=18) 0.75
SUPR-Q quintilesと90日の購入率 0.78
推奨および推奨レート(最近の購入) 0.79
専門家からの純粋なスコアとユーザーからのタスク時間スコア 0.88
パルスオキシメーターと酸素飽和度の精度 0.89
推奨および報告された推奨率(ブランド) 0。90

医療アウトカム

たとえば、表1の最初のエントリは、アスピリンを服用して心臓発作のリスクを軽減する02. これは、テーブル内の最小の相関であり、かろうじて0を上回っています。 それは今疑問視されているが、まだアスピリンは、何十年もの間、心臓の健康のための推奨事項の定番となっています。

大ヒット薬(およびテレビコマーシャルの定期的な)バイアグラは、r=の相関を持っています。38″とパフォーマンスを向上させた。”心理療法は、”唯一の”r=の相関を持っています。将来の幸福について32。 伝統的に強く相関していると考えられている身長と体重は、r=の相関を持っています。44客観的に米国またはr=で測定された場合。バングラデシュのサンプルから38。 これは、ある研究でのインクブロットの妥当性とそれほど変わらない。 あなたが医者に指を置いた”脈拍牛”センサーとあなたの血液中の実際の酸素との間の接続はr=です。89. これらはすべて、先に議論した2つの喫煙相関、r=との文脈で見ることができます。08とr=.40.

ジョブのパフォーマンス

表1は、大学の成績を含むジョブのパフォーマンスのいくつかの指標の相関を示しています(r=。16)、経験の年(r=。18),非構造化インタビュー(r=.38)、一般的な精神能力(r=。51);ジョブのパフォーマンスの最良の予測因子は、作業サンプルr=です。54. Googleがこのデータに基づいて雇用慣行をどのように適応させたかについては、Googleの仕組みを参照してください。

大学のパフォーマンス

喫煙のように、適性検査と成果の間のリンクが広く研究されています。 表1には、標準化されたテストと実際の大学の成績との間の相関のいくつかの例も含まれています:ペンシルベニア州アイビーリーグ大学(r=。20),イエメンの学生のための大学GPA(r=.41),GRE定量的推論とMBA GPAs(r=.37)から10フロリダ州の州立大学,すべての学生のためのアイビーリーグダートマスカレッジからSATスコアと累積GPA(r=.43).

顧客とユーザーの行動

MeasuringUで行った作業から、推奨する意図と最新の購入の90日間の推奨レート(r=。79)、SUSスコアとソフトウェア産業の成長(r=。74)、14産業におけるネットプロモータースコアと成長指標(r=。35)、評価者の純粋なスコアおよびユーザーの仕事容易さのスコア(r=。67). 同様の相関関係は、人々の購入意図に関する公表された研究と購入率(r=。53)および使用する意図および実際の使用法(r=.50)我々はTAMで見たように。ここでの教訓は、いくつかの相関の値は小さいが、結果を無視することはできないということです。

ここでの教訓は、いくつかの相関の値が小さ そして、それが相関の一般的なルールを適用することを非常に困難にするものです。 私の希望は、異種の分野からの妥当性相関の表が、他の人が収集する努力と各協会の影響について批判的に考えるのに役立つことです。

要約と持ち帰り

関連の尺度としての相関についてのこの議論と妥当性相関係数の分析が明らかになった:

相関は関係を定量化する。 Pearson correlation rは、変数間の関係を記述する最も一般的な(しかしそれだけではない)方法であり、分野間の効果の大きさを記述するための共通言語です。

妥当性と信頼性係数が異なります。 すべての相関が等しく作成されるわけではありません。 同じサンプルから得られた相関(モノメトッド)または信頼性相関(同じ尺度を使用)は、多くの場合、より高いr(r>。7)と非現実的に高い相関バーにつながる可能性があります。

相関は弱いが影響を与える可能性があります。 数値的に「小さな」相関関係であっても、影響(例えば、健康への影響)と測定の労力とコストの文脈が考慮されている場合、有効で意味があります。 喫煙、アスピリン、さらには心理療法の相関関係は、控えめな相関に弱いと粗雑に解釈できるものの良い例ですが、結果は非常に結果的なものです。

妥当性のために非現実的に高いバーを設定しないでください。 相関関係の文脈を理解することは、意味を提供するのに役立ちます。 何かを簡単かつ低コストで測定することができますが、インパクトのある結果(会社の業績、大学の業績、平均余命、または仕事の業績など)を予測する 喫煙と癌との間の”低い”相関(r=。08)はこれのよいメモである。