Plot (statistics)
nas estatísticas, um plot de vulcão é um tipo de plot de dispersão que é usado para identificar rapidamente alterações em grandes conjuntos de dados compostos por dados replicados. Representa significância versus mudança de dobra nos eixos y e x, respectivamente. Estas parcelas são cada vez mais comuns em experimentos omicos como genômica, proteômica e metabolômica, onde muitas vezes se tem uma lista de muitos milhares de pontos de dados replicados entre duas condições e se deseja identificar rapidamente as mudanças mais significativas. Uma parcela de vulcão combina uma medida de significância estatística de um teste estatístico (por exemplo, um valor p de um modelo ANOVA) com a magnitude da mudança, permitindo uma rápida identificação visual desses pontos de dados (genes, etc.) que mostram grandes mudanças de magnitude que também são estatisticamente significantes.
uma parcela vulcânica é construída traçando o log negativo do valor p no eixo y (geralmente base 10). Isto resulta em pontos de dados com valores p Baixos (altamente significativos) aparecendo em direção ao topo da parcela. O eixo x é o log da mudança de dobra entre as duas condições. O log da mudança de dobra é usado para que as mudanças em ambas as direções apareçam equidistantes do centro. Pontos de plotagem desta forma resultam em duas regiões de interesse na trama: os pontos que são encontrados em direção ao topo da trama que estão longe tanto para os lados esquerdo ou direito. Estes representam valores que exibem grandes mudanças de dobra de magnitude (sendo, portanto, à esquerda ou à direita do centro), bem como grande significância estatística (sendo, portanto, em direção ao topo).
informação adicional pode ser adicionada colorindo os pontos de acordo com uma terceira dimensão dos dados (como a intensidade do sinal), mas isso não é uniformemente empregado. As parcelas vulcânicas também são usadas para exibir graficamente uma análise de significância do critério de seleção de genes microarrays (SAM), um exemplo de regularização.o conceito de parcela vulcânica pode ser generalizado para outras aplicações, onde o eixo x está relacionado a uma medida da resistência de um sinal estatístico, e o eixo y está relacionado a uma medida da significância estatística do sinal.Por exemplo, em um estudo de controle de caso de associação genética,tal como o estudo de associação genoma-amplo, um ponto em uma parcela de vulcão representa um polimorfismo de um único nucleótido.Seu valor x pode ser a razão de Probabilidades e seu valor y pode ser-log10 do valor p de um testador Qui-quadrado uma estatística de teste Chi-quadrado.
Vulcão gráficos mostram uma característica upwardstwo braço de forma becausethe eixo x, i.e. subjacente log-dobre as alterações são, geralmente, distribuição normal, enquanto que o eixo y, a log-valores de p, tendem a um maior significado para dobre-as alterações que podem afastar-se mais fortemente a partir de zero.A densidade da distribuição normal tem a forma
y = e − x 2 {\displaystyle y=e^{-x^{2}}} .
Então, o l ó g {\displaystyle log} é
l o g ( y ) = − x 2 {\displaystyle log(y)=-x^{2}}
e o negativo l o g {\displaystyle log} é
− l o g ( y ) = x 2 {\displaystyle -log(y)=x^{2}}
o que é uma parábola cujo alcance dos braços upwardson os lados esquerdo e direito.O limite superior dos dados é uma parabólica e o limite inferior é outra parábola.