Vulkán telek (statisztika)
ban ben statisztika, a vulkán telek egy típusa szórás-telek hogy használják, hogy gyorsan azonosítani változások nagy adathalmazok tagjai replikált adatok. Az Y, illetve az x tengelyek jelentőségét ábrázolja a hajtásváltozással szemben. Ezek a parcellák egyre gyakoribbak az omic kísérletekben, mint például a genomika, a proteomika és a metabolomika, ahol az ember gyakran több ezer replikált adatpontot tartalmaz két feltétel között, és gyorsan meg akarja határozni a legjelentősebb változásokat. A vulkándiagram egyesíti a statisztikai teszt statisztikai szignifikanciájának mértékét (például egy ANOVA modell p értékét) a változás nagyságával, lehetővé téve ezen adatpontok (gének stb.), amelyek nagy nagyságrendű változásokat mutatnak, amelyek statisztikailag is szignifikánsak.
a vulkándiagram úgy készül, hogy a p érték negatív naplóját ábrázolja az y tengelyen (általában 10.alap). Ennek eredményeként alacsony (rendkívül jelentős) p értékű adatpontok jelennek meg a telek teteje felé. Az x tengely a két feltétel közötti hajtásváltozás naplója. A hajtásváltás naplóját úgy használják, hogy mindkét irányban a változások egyenlő távolságra legyenek a középponttól. A pontok ilyen módon történő ábrázolása két érdekes régiót eredményez a cselekményben: azokat a pontokat, amelyek a telek teteje felé találhatók, amelyek messze vannak a bal vagy a jobb oldalaktól. Ezek olyan értékeket képviselnek, amelyek nagy nagyságrendű hajtásváltozásokat mutatnak (tehát középen balra vagy jobbra vannak), valamint nagy statisztikai szignifikanciát (tehát a teteje felé).
további információk adhatók hozzá a pontok színezésével az adatok harmadik dimenziója (például a jelintenzitás) szerint, de ezt nem egységesen alkalmazzák. A vulkándiagramokat a mikroarray (SAM) génszelekciós kritérium szignifikancia-elemzésének grafikus megjelenítésére is használják, amely példa a szabályozásra.
a vulkándiagram fogalma általánosítható más alkalmazásokra, ahol az x tengely a statisztikai jel erősségének mértékéhez, az y tengely pedig a jel statisztikai szignifikanciájának mértékéhez kapcsolódik.Például egy genetikai asszociációs esetkontroll vizsgálatban, például a genom egészére kiterjedő asszociációs vizsgálatban, a vulkándiagram egy pontja egy nukleotid polimorfizmust képvisel.X értéke lehet az esélyhányados, y értéke pedig-log10 lehet A p értékből egy Chi-négyzet testorból egy Chi-négyzet tesztstatisztikából.
a Vulkándiagramok jellegzetes felfelé mutató két kar alakzatot mutatnak, mivel az x tengely, azaz a mögöttes log-fold változások általában normális eloszlásúak, míg az y tengely, a log-p értékek nagyobb jelentőséggel bírnak a nullától erősebben eltérő hajtásváltozások esetében.A normál eloszlás sűrűsége
y = e − x 2 {\displaystyle y=e^{-x^{2}}} .
tehát a l o g {\displaystyle log} ez
l o g ( y ) = − x 2 {\displaystyle log(y)=-x^{2}}
és a negatív l o g {\displaystyle log} is
− l o g ( y ) = x 2 {\displaystyle-log(y)=x^{2}}
amely egy parabola, amelynek karjai a bal és a jobb oldalon felfelé nyúlnak.Az adatok felső határa egy parabolaés az alsó határ egy másik parabola.