火山プロット(統計)
統計では、火山プロットは散布図の一種であり、複製データで構成される大きなデータセットの変化を迅速に識別するために使 これは、それぞれy軸とx軸の有意性対折畳変化をプロットします。 これらのプロットは、ゲノミクス、プロテオミクス、メタボロミクスなどのomic実験でますます一般的になり、二つの条件の間に何千もの複製データポイントのリストがあり、最も意味のある変化を迅速に特定したいと考えています。 火山プロットは、統計的検定からの統計的有意性の尺度(例えば、ANOVAモデルからのp値)と変化の大きさを組み合わせて、それらのデータポイント(遺伝子など)の迅速な視覚的同定を可能にする。)また、統計的に有意である大きな大きさの変化を表示します。
火山プロットは、y軸上のp値の負の対数(通常は基数10)をプロットすることによって構築されます。 これにより、p値が低い(有意性が高い)データポイントがプロットの上部に表示されます。 X軸は、2つの条件の間の折畳変化の対数です。 折畳の変化の対数は、両方向の変化が中心から等距離に見えるように使用されます。 この方法で点をプロットすると、プロットに関心のある2つの領域が得られます:プロットの上部に向かって見つかった点で、左辺または右辺のいず これらは、大きな大きさの倍の変化(したがって、中央の左または右)と高い統計的有意性(したがって、上に向かっている)を表示する値を表します。追加情報は、データの第三次元(信号強度など)に従って点を着色することによって追加することができるが、これは均一には採用されていない。
火山プロットはまた、グラフィカルにマイクロアレイ(SAM)遺伝子選択基準、正則化の例の有意性分析を表示するために使用されます。
火山プロットの概念は、x軸が統計的信号の強さの尺度に関連し、y軸が信号の統計的有意性の尺度に関連する他のアプリケーションに一般化す例えば、ゲノムワイド関連研究のような遺伝的関連症例対照研究では、火山プロット内の点は一塩基多型を表す。そのx値はオッズ比とすることができ、そのy値はカイ二乗検定統計量からのp値の-log10とすることができる。
火山プロットは、x軸、すなわち基礎となる対数倍の変化は一般的に正規分布であるのに対し、y軸、log-p値は、ゼロからより強く逸脱する倍の変化に正規分布の密度は
y=e−x2{\displaystyle y=e^{-x^{2}}}の形をとる。
だから、l o g{\displaystyle log}は
l o g(y)=−x2{\displaystyle log(y)=-x^{2}}
であり、負のl o g{\displaystyle log}is
−l o g(y)=x2{\displaystyle-log(y)=x^{2}}
これは、腕が左右に上向きに達する放物線である。データの上限は1つの放物線であり、下限は別の放物線です。