Articles

Vulkán telek (statisztika)

ban ben statisztika, a vulkán telek egy típusa szórás-telek hogy használják, hogy gyorsan azonosítani változások nagy adathalmazok tagjai replikált adatok. Az Y, illetve az x tengelyek jelentőségét ábrázolja a hajtásváltozással szemben. Ezek a parcellák egyre gyakoribbak az omic kísérletekben, mint például a genomika, a proteomika és a metabolomika, ahol az ember gyakran több ezer replikált adatpontot tartalmaz két feltétel között, és gyorsan meg akarja határozni a legjelentősebb változásokat. A vulkándiagram egyesíti a statisztikai teszt statisztikai szignifikanciájának mértékét (például egy ANOVA modell p értékét) a változás nagyságával, lehetővé téve ezen adatpontok (gének stb.), amelyek nagy nagyságrendű változásokat mutatnak, amelyek statisztikailag is szignifikánsak.

Volcano telek mutató metabolomikus adatok. A piros nyilak olyan érdekes pontokat jelölnek, amelyek mind a nagy nagyságrendű hajtásváltozásokat (x tengely), mind a nagy statisztikai szignifikanciát (- log10 of p érték, y tengely) mutatják. A szaggatott piros vonal azt mutatja, ahol p = 0,05, a vonal feletti pontokkal, amelyek p < 0,05, a vonal alatti pontokkal pedig p > 0,05. Ez a rajz olyan színű, hogy azok a pontok, amelyek hajtásváltása kevesebb, mint 2 (log2 = 1), szürke színnel jelennek meg.

a vulkándiagram úgy készül, hogy a p érték negatív naplóját ábrázolja az y tengelyen (általában 10.alap). Ennek eredményeként alacsony (rendkívül jelentős) p értékű adatpontok jelennek meg a telek teteje felé. Az x tengely a két feltétel közötti hajtásváltozás naplója. A hajtásváltás naplóját úgy használják, hogy mindkét irányban a változások egyenlő távolságra legyenek a középponttól. A pontok ilyen módon történő ábrázolása két érdekes régiót eredményez a cselekményben: azokat a pontokat, amelyek a telek teteje felé találhatók, amelyek messze vannak a bal vagy a jobb oldalaktól. Ezek olyan értékeket képviselnek, amelyek nagy nagyságrendű hajtásváltozásokat mutatnak (tehát középen balra vagy jobbra vannak), valamint nagy statisztikai szignifikanciát (tehát a teteje felé).

további információk adhatók hozzá a pontok színezésével az adatok harmadik dimenziója (például a jelintenzitás) szerint, de ezt nem egységesen alkalmazzák. A vulkándiagramokat a mikroarray (SAM) génszelekciós kritérium szignifikancia-elemzésének grafikus megjelenítésére is használják, amely példa a szabályozásra.

a vulkándiagram fogalma általánosítható más alkalmazásokra, ahol az x tengely a statisztikai jel erősségének mértékéhez, az y tengely pedig a jel statisztikai szignifikanciájának mértékéhez kapcsolódik.Például egy genetikai asszociációs esetkontroll vizsgálatban, például a genom egészére kiterjedő asszociációs vizsgálatban, a vulkándiagram egy pontja egy nukleotid polimorfizmust képvisel.X értéke lehet az esélyhányados, y értéke pedig-log10 lehet A p értékből egy Chi-négyzet testorból egy Chi-négyzet tesztstatisztikából.

a Vulkándiagramok jellegzetes felfelé mutató két kar alakzatot mutatnak, mivel az x tengely, azaz a mögöttes log-fold változások általában normális eloszlásúak, míg az y tengely, a log-p értékek nagyobb jelentőséggel bírnak a nullától erősebben eltérő hajtásváltozások esetében.A normál eloszlás sűrűsége

y = e − x 2 {\displaystyle y=e^{-x^{2}}} {\displaystyle y=e^{-x^{2}}}.

tehát a l o g {\displaystyle log} logez

l o g ( y ) = − x 2 {\displaystyle log(y)=-x^{2}} {\displaystyle log(y)=-x^{2}}

és a negatív l o g {\displaystyle log} logis

− l o g ( y ) = x 2 {\displaystyle-log(y)=x^{2}} {\displaystyle-log(y)=x^{2}}

amely egy parabola, amelynek karjai a bal és a jobb oldalon felfelé nyúlnak.Az adatok felső határa egy parabolaés az alsó határ egy másik parabola.