Articles

Complot vulcan (statistici)

în statistici, un complot vulcan este un tip de scatter-complot, care este utilizat pentru a identifica rapid modificările în seturi mari de date compuse din date reproduse. Acesta parcele semnificație față de ori-schimbare pe axele y și x, respectiv. Aceste parcele sunt din ce în ce mai frecvente în experimentele omice, cum ar fi genomica, proteomica și metabolomica, unde unul are adesea o listă cu multe mii de puncte de date reproduse între două condiții și se dorește identificarea rapidă a celor mai semnificative schimbări. Un complot vulcan combină o măsură a semnificației statistice dintr-un test statistic (de exemplu, o valoare p dintr-un model ANOVA) cu magnitudinea schimbării, permițând identificarea vizuală rapidă a acelor puncte de date (gene etc.) care afișează modificări de magnitudine mare, care sunt, de asemenea, semnificative statistic.

complot vulcan care prezintă date metabolomice. Săgețile roșii indică puncte de interes care afișează atât modificări de mărime mare (axa x), cât și semnificație statistică ridicată (- log10 a valorii p, axa y). Linia roșie punctată arată unde p = 0,05 cu puncte deasupra liniei având p < 0,05 și puncte sub linia având p > 0,05. Acest complot este colorat astfel încât acele puncte care au o schimbare de pliere mai mică de 2 (log2 = 1) sunt afișate în gri.

un complot vulcan este construit prin trasarea jurnalului negativ al valorii p pe axa y (de obicei baza 10). Acest lucru are ca rezultat puncte de date cu valori p scăzute (foarte semnificative) care apar spre partea de sus a graficului. Axa x este jurnalul schimbării de pliere între cele două condiții. Jurnalul schimbării pliului este utilizat astfel încât modificările în ambele direcții să apară echidistant față de centru. Trasarea punctelor în acest fel are ca rezultat două regiuni de interes pentru complot: acele puncte care se găsesc spre partea de sus a complotului, care sunt departe fie de partea stângă, fie de partea dreaptă. Acestea reprezintă valori care afișează schimbări mari de magnitudine (prin urmare, fiind la stânga sau la dreapta centrului), precum și o semnificație statistică ridicată (prin urmare, fiind spre partea de sus).

informații suplimentare pot fi adăugate prin colorarea punctelor în funcție de o a treia dimensiune a datelor (cum ar fi intensitatea semnalului), dar aceasta nu este utilizată uniform. Parcelele vulcanice sunt, de asemenea, utilizate pentru a afișa grafic o analiză de semnificație a criteriului de selecție a genei microarrays (SAM), un exemplu de regularizare.

conceptul de complot vulcan poate fi generalizat la alte aplicații, în cazul în care axa x este legată de o măsură deputerea unui semnal statistic, și axa y este legată de o măsură a semnificației statistice a semnalului.De exemplu, într-un studiu de caz-control al asocierii genetice,cum ar fi studiul de Asociere la nivel de genom, un punct dintr-un complot vulcan reprezintă un polimorfism cu un singur nucleotid.Valoarea sa x poate fi raportul de cote și valoarea sa y poate fi-log10 din valoarea p de la un Testor Chi-pătrat O Statistică de testare Chi-pătrat.

parcelele vulcanului prezintă o formă caracteristică în sus a două brațe, deoarece axa x, adică modificările care stau la baza log-fold, sunt în general distribuție normală, în timp ce axa y, valorile log-p, tind spre o semnificație mai mare pentru modificările de pliere care deviază mai puternic de la zero.Densitatea distribuției normale ia forma

y = e − x 2 {\displaystyle y=e^{-x^{2}}}{\displaystyle y=e^{-x^{2}}}.

deci l o g {\displaystyle log}logdin care este

l O G ( y ) = − x 2 {\displaystyle log(y)=-x^{2}}{\displaystyle log(y)=-x^{2}}

și L O G negativ {\displaystyle log}logeste

− L O G ( Y ) = x 2 {\displaystyle-log(y)=x^{2}}{\displaystyle-log(y)=x^{2}}

care este o parabolă ale cărei brațe ajung în suspe părțile stângi și drepte.Limita superioară a datelor este una parabola iar limita inferioară este o altă parabolă.