Articles

Rozmanitost a vývoj rozvíjejících se Pandoraviridae rodiny

životní Prostředí odběr vzorků a izolace pandoravirus kmenů

Jsme použili stejný protokol izolace, která vedla k objevu P. salinus a P. dulcis5. To spočívá ve smíchání vzorku materiálu s kulturami Acanthamoeba přizpůsobit antibiotikum koncentrace dostatečně vysoká, aby inhibovat růst jiných environmentálních mikroorganismů (zejména bakterií a plísní). Vzorky byly odebrány náhodně z vlhkého prostředí citlivého na buňky Acanthamoeba. To vedlo k izolaci tří nových pandoravirus kmeny: P. quercus; P. neocaledonia; a P. macleodensis (Tabulka 1, viz Metody). Vykazují dostatečnou divergenci, aby mohli začít posuzovat zachované rysy a variabilitu vznikající čeledi Pandoraviridae. V případě potřeby naší analýzy také zahrnout data z P. inopinatum, izolovaných v německé laboratoři od pacienta s Acanthamoeba keratitis7.

Tabulka 1 Údaje o pandoravirus izolátů použitých v této práci,

Studium replikace cykly a virion ultrastructures

od přečištěné částice naočkována do A. castellanii kultur, jsme analyzovali infekční cyklus každého izolovat pomocí obou světelné a transmisní elektronové mikroskopie (ultratenkých část). Jak již bylo dříve pozorováno u P. salinus a P. dulcis, replikace cykly těchto nových pandoraviruses bylo zjištěno, že poslední průměru 12 h5 (8 h za nejrychlejší P. neokaledonia). Infekční proces je stejný pro všechny viry, počínaje internalizací jednotlivých částic buňkami Acanthamoeba. Po zahájení jejich apikální pór, částice („pandoravirions“) převodem jejich průsvitné obsah cytoplasmy prostřednictvím fúze virion vnitřní membrána se, že z fagozomu. Počáteční fáze infekce je pozoruhodně podobná u všech izolátů. Zatímco jsme dříve oznámil, že buněčné jádro byl zcela narušen během pozdní fáze infekčních cycle5, důkladné pozorování nové kmeny odhalil neo-sloučené částice v cytoplazmě buňky stále vykazuje jádro-jako prostory, v nichž jadérko již rozpoznatelné (Doplňkový Obr. 1). Osm hodin po infekci se zralé viriony staly viditelnými ve vakuolách a uvolňují se exocytózou (Doplňkový film). U všech izolátů končí replikační cyklus lýzou buněk a uvolněním asi stovky částic (obr. 1).

br. 1

1

nový pandoravirus izolátů. nadprodukce a. castellanii buňkou Pandoravirus macleodensis viriony ze vzorku životního prostředí před lýzou buněk. Environmentální bakterie lze vidět v kultivačním médiu společně s viriony P.macleodensis. (měřítko je 10 µm). b tem obraz ultratenké části buňky a. castellanii během rané fáze infekce P. neocaledonia. Ameba panožky jsou připraveny pohltit okolní virionů. Deset minut pi, viriony byly pohlceny a jsou ve vakuolách (měřítko je 500 nm). c tem obraz ultratenké části buňky a. castellanii během procesu montáže P. salinus virion (měřítko je 500 nm). d tem obraz ultratenké části rodícího se P.quercus virion. (měřítko je 500 nm). Struktury zralé částice z různých kmenů, nevykazují žádné znatelné rozdíly,

sekvenování Genomu a anotace

Genomické DNA z P. neocaledonia, P. macleodensis, a. P. quercus byl připraven z čištěných částic a sekvenován buď pomocí platformy PacBio nebo Illumina (viz metody). Jako pro P. salinus, P. dulcis5, a P. inopinatum7, tři nové genomy sestaven jako jeden lineární dvouřetězcové DNA (dsDNA) molekuly (≈60% G + C) s velikostí v rozmezí od 1.84 do 2 Mb. Kromě jejich průsvitných částic ve tvaru amfory (obr. 1), vyšší než průměrný obsah G + C a genomický gigantismus tak zůstávají charakteristickými rysy sdílenými Pandoraviridae5, 8. Vzhledem k tomu, vysoký podíl virových genů kódujících proteiny bez databáze homolog genu předpovědi založené na čistě ab initio výpočetních přístupů (tj. „ORFing“ a kódování sklon odhady) jsou notoricky nespolehlivé, což vede k nesrovnalostem mezi týmy, které používají různé hodnoty libovolných parametrů (např. minimální otevřený čtecí rámec (ORF) velikost). Například mezi rodinami z velké dsDNA viry napadající eukaryot, průměrný protein-kódující gen hustota údajně pohybuje od jednoho genu každý 335 bp (Phycodnaviridae, NCBI: NC_008724) do jednoho genu každý 2120 bp (Herpesviridae, NCBI: NC_003038), zatímco konsensus je jasně kolem jednoho genu každý kb (například pro bakterie). Výsledkem je, že jeden osciluje mezi situacemi, kdy je mnoho genů předurčeno, a jinými, kde je pravděpodobně přehlíženo mnoho skutečných genů. Taková nejistota ohledně toho, které geny jsou „skutečné“, představuje významný šum ve srovnávacích genomických analýzách a následném testování evolučních hypotéz. Kromě toho jsou výpočetní metody většinou slepé vůči genům exprimovaným jako neproteinové kódující transkripty.

abychom překonali výše uvedená omezení, provedli jsme experimenty specifické pro RNA-seq a analýzy částicových proteomů, jejichž výsledky byly mapovány na genomových sekvencích. Do tohoto přísného reannotačního protokolu byly zachovány pouze geny podporované experimentálními důkazy (nebo podobností proteinů) (viz metody, Doplňkový obr. 2). Na jedné straně tento nový postup vedl ke snížené sadě předpovězených proteinů, na druhé straně umožnil objev neočekávaného velkého počtu nekódujících transkriptů(Tabulka 1).

nová sada validovaných genů kódujících proteiny vykazuje silně snížený podíl ORF kratších než 100 reziduí ,z nichž většina je jedinečná pro každý kmen pandoraviru (Doplňkový obr. 3). Přísný postup anotace také vedl k tomu, že geny vykazovaly dobře soustředěnou unimodální distribuci hodnot indexu adaptace kodonu (CAI) (Doplňkový obr. 3).

konzistence, můžeme extrapolovat naše přísné anotace protokolu k. P. inopinatum a P. macleodensis, snížení počtu predikovaných proteinů zohledněny v další srovnání (viz Metody, Tabulka 1). Jak se dalo očekávat, rozdíly mezi standardní versus přísné gen předpovědi jsou pouze vzhledem k overprediction malých Orf (délka < 300 nukleotidů). Takové svévolné Orf jsou náchylné k nastat náhodně v G +, C-bohaté sekvence, během níž stop kodony (SO, TAG, a TGA) jsou méně pravděpodobné, že dojít náhodou, než v non-kódování regiony + T-bohaté genomů. Nadstandardní a přísné anotační protokoly totiž platily pro A + T-rich (74.8%) Megavirus chilensis genome3 vyústil ve dvě velmi podobné sady predikovaných versus validovaných genů kódujících proteiny (1120 versus 1108). Tato kontrola ukazuje, že naše přísné anotace není jen vyřazení nakonec správný gen předpovědi o svévolné zvyšování práh spolehlivosti, ale zejména oprava chyby vyvolané G + C-bohaté složení. Čistě výpočetní metody anotace genů jsou tedy výrazně méně spolehlivé pro genomy bohaté na G + C, zejména pokud kódují velkou část Orfanů (tj. Nicméně, to stojí za povšimnutí, že i po naší přísné reannotation, zlomek předpokládané proteiny, aniž by významnou sekvenční podobnost vně Pandoraviridae rodina zůstala poměrně vysoká (od 67 do 73%, Doplňkové Obr. 4).

další výzvu pro přesné anotace pandoravirus genomů je přítomnost intronů (prakticky nezjistitelné, pomocí výpočetní metody, až budou rušit ORFans). Mapování sestaven přepis sekvence do genomu P. salinus, P. dulcis, P., quercus, a. P. neokaledonia umožnila detekci spliceozomálních intronů v 7,5-13% validovaných genů kódujících proteiny. Tyto introny byly nalezeny v nepřeložených oblastí (UTRs), stejně jako v kódujících sekvencí, včetně v průměru 14 genů mezi ty, kódování 200 nejhojnější proteiny detekovány v částice (viz níže). Ačkoli spliceozomální introny se nacházejí v jiných virech s jadernou fází, jako jsou chlorovirusy9, pandoraviry jsou jediné, pro které byly spliceozomální introny validovány pro více než 10% jejich genů. Tyto výsledky podporují náš předchozí návrh, že alespoň část transkriptů pandoravirů je syntetizována a zpracována hostitelským jaderným strojem5. Přesto počet intronů na virový Gen zůstává mnohem nižší (v průměru přibližně 1,2) než u hostitelských genů (v průměru 6,210). Pandoravirové geny také vykazují UTR dvakrát delší (doplňková Tabulka 1) než geny Mimiviridae11.

mapování RNA-seq dat vedl k nečekanému objevu velkého počtu (157-268) dlouhé nekódující transkripty (LncRNAs) (Tabulka 1, Doplňková Tabulka 1 podrobné statistiky). Tyto Lncrna vykazují Polya ocas a asi 4% z nich obsahují spliceozomální introny. Lncrna jsou nejčastěji transkribovány z reverzního řetězce validovaných genů kódujících proteiny, zatímco menší frakce jsou exprimovány v mezigenních (tj. 5). Tyto nekódující transkripty mohou hrát roli v regulaci exprese pandoravirových genů.

Celkově 82.7–87% pandoravirus genomů je přepisována (včetně Orf, UTRs, a LncRNAs), ale pouze 62 až 68.2% je přeložen do proteinů. Tyto hodnoty jsou mnohem nižší než u obřích virů z jiných rodin (např. 90% genomu Mimivirus11 je přeloženo), částečně kvůli větším UTRs lemujícím pandoravirové geny.

Srovnávací genomika

šest protein-kódující gen sady získané z výše přísné anotace pak byly použity jako reference pro whole-genome srovnání s cílem určit konkrétní vlastnosti Pandoraviridae rodiny. Po shlukování založeném na sekvenční podobnosti (viz metody) byly vypočteny relativní překrývání genového obsahu různých kmenů (obr. 2a), produkující to, co označujeme jako „proteinové shluky“.

br. 2

obrázek 2

Srovnání pandoravirus genu obsah. a je znázorněno rozdělení všech kombinací sdílených proteinových shluků. Vložka shrnuje počet shluků a genů sdílených 6, 5, 4, 3, 2, a 1 pandoraviry. genom jádra b a pan-genom odhadovaný ze šesti dostupných pandoravirů. Odhadované haldy zákon parametr α (α < 1) je charakteristické otevřené pánvi-genome50 a plynulost hodnota parametru je charakteristická pro velkou část unikátní genes51. Krabicové grafy ukazují medián, 25. a 75. percentil. Vousy odpovídají extrémní datové body,

Jsme pak vypočítán počet sdílených (tj., „jádro“) a celkové genů, jak jsme se postupně začleněna do genomu jednotlivých izolátů do výše uvedené analýzy pro odhad velikosti rodiny core soubor genů a příslušenství/flexibilní soubor genů. Pokud je k dispozici šest izolátů objevil dostačující, aby vymezily základní genomu kódující 455 různé proteinové shluky, „saturační křivky“ vedoucí k celkové soubor genů je daleko od dosažení plató, což naznačuje, že Pandoraviridae pan-genom je otevřené, s každou další izolovat předpověděl přispět více než 50 dalších genů (Obr. 2b). To musí být potvrzeno analýzou dalších izolátů Pandoraviridae.

poté jsme zkoumali globální podobnost šesti pandoravirových izolátů analýzou jejich sdíleného genového obsahu jak z hlediska podobnosti proteinové sekvence, tak genomické polohy. Párové podobnosti mezi různými pandoravirus izolátů se pohybuje od 54 do 88%, vypočtené ze super zarovnání proteinových produktů orthologous geny (Doplňující Tabulka 2). Fylogenetický strom vypočítaný se stejnými datovými klastry pandoraviry do dvou samostatných klad (obr. 3).

br. 3

obrázek 3

Fylogenetická struktura navrhovaného Pandoraviridae rodiny. Hodnoty bootstrapu odhadované převzorkováním jsou všechny rovny 1, a proto nebyly hlášeny. Synonymní k nesynonymním substitučním poměrům (ω)byly vypočteny pro dva samostatné kmeny a jsou významně odlišné (měřítko je 0.07 substituce/webu)

Interpretován v geografickém kontextu, to clustering vzor vyvolává dvě důležité vlastnosti vznikající rodiny. Na jedné straně, nejvíce odlišné kmeny nejsou izolované z nejvíce vzdálených míst (např. Chilské P. salinus versus francouzská P. quercus; Neo-Caledonian P. neocaledonia proti Australské P. macleodensis). Na druhé straně dva izoláty (např. P. dulcis versus P. macleodensis) ze stejných prostředí (dva rybníky umístěné 700 m od sebe a Spojené malým průtokem vody)jsou zcela odlišné. Do většího rozsahu soupisu Pandoraviridae, tyto výsledky už naznačují, že členové této rodiny jsou distribuovány po celém světě s podobnými lokální a globální rozdíly.

naše analýza pozic homologních genů v různých genomech odhalila, že navzdory jejich divergenci sekvence (doplňková Tabulka 2) zůstává 80% ortologních genů kolineární. Jak je znázorněno na obr. 4, dálková Architektura pandoravirových genomů (tj., založené na pozicích ortologních genů) je globálně konzervováno, navzdory rozdílům ve velikostech (1,83-2,47 Mb). Nicméně, jedna polovina chromozomů pandoraviru (oblast zcela vlevo na obr. 4) zvědavě se jeví evolučně stabilnější než druhá polovina, kde se vyskytuje většina nehomologních segmentů. Tyto segmenty obsahují geny specifické pro kmen a jsou obohaceny o tandemové duplikace neortologních proteinů obsahujících ankyrin, MORN a F-box. Naopak stabilní polovina genomu koncentruje většinu genů tvořících genom jádra Pandoraviridae(horní část obr. 4). Zajímavé je, že místní inverze, která rozlišuje chromozom P. neocaledonia od ostatních kmenů se nachází v blízkosti hranice mezi stabilní a nestabilní regiony, a mohou být spojeny s tímto přechodem (i když to může být náhoda). Nakonec jsou všechny genomy také obohaceny o geny specifické pro kmen (a / nebo duplikace) na obou končetinách.

br. 4

figure4

Kolinearity dostupný pandoravirus genomů. Kumulativní frekvence jádrových genů je zobrazena nahoře. Konzervované kolineární bloky jsou ve všech virech zbarveny ve stejné barvě. Bílé bloky odpovídají non-zachovaných segmentů DNA (měřítko je 500 kb)

pak Jsme analyzovali distribuci předpokládané proteiny mezi standardní široké funkční kategorií (Obr. 5). Protože se nyní opakuje pro velké a obří eukaryotické DNA viry, dominantní kategorií je zdaleka Kategorie proteinů, které postrádají rozpoznatelné funkční podpisy. Přes šest kmenů odpovídá průměrně 70% předpokládaných proteinů „neznámým funkcím“. Tak vysoký podíl je o to pozoruhodnější, že se vztahuje na pečlivě validované genové sady, z nichž byly vyloučeny pochybné ORF. Je tedy biologickou realitou, že velká většina těchto virových proteinů nemůže být spojena s dříve charakterizovanými cestami. Pozoruhodné je, že podíl těchto anonymních proteinů zůstává poměrně vysoká (65%) mezi produkty pandoravirus core genomu, který je mezi pravděpodobně esenciální geny sdílí šest dostupných kmenů (a pravděpodobně i všechny další členy rodiny, podle Obr. 2b). Je zajímavé, že tento podíl zůstává také velmi vysoký (≈80%) mezi proteiny detekovanými jako tvořící virové částice. Kromě toho podíl anonymních proteinů zcela dominuje klasifikaci genů jedinečných pro každý kmen, a to více než 95%. Nejvíce generic funkční kategorie, „protein–protein interakce“ je druhý největší (z 11,7 18,9%), což odpovídá zjištění velmi časté a neinformativní motivy (např. ankyrin opakuje). Celkově lze říci, podíl pandoravirus proteinů, které skutečně informativní funkce může být připsána <20%, včetně kompletního strojního zařízení pro replikace DNA a transkripce.

br. 5

figure5

Funkční popisy,

pak Jsme zkoumali dva evoluční procesy, případně na původ extra-large velikost pandoravirus genomy: horizontálních genových transferů (HGTs) a genových duplikací. Akvizice genů HGT byla často vyvolána k vysvětlení velikosti genomu virů infikujících ameba ve srovnání s“ běžnými “ viry12, 13. Předpokládali jsme, že až třetina pandoravirus proteiny vykazují sekvenční podobnosti (mimo Pandoraviridae rodiny) s proteiny ze tří buněčné domény (Eukarya, Archea, Eubacteria) nebo jiné viry (Doplňkový Obr. 4). Takové podobnosti však neznamenají, že tyto geny byly získány horizontálně. Mohly by také označovat společný původ předků nebo přenos z pandoraviru na jiné mikroorganismy. Individuálně jsme analyzovali fylogenetickou pozici každého z těchto případů, abychom odvodili jejich pravděpodobný původ: ancestral – když se nachází mimo shluky buněčných nebo virových homologů; horizontálně získané – když jsou nalezeny hluboce zakořeněné ve výše uvedených shlucích; nebo horizontálně přeneseny do buněčných organismů nebo nesouvisejících virů v konverzní situaci (tj. Doplňkový Obr. 6 shrnuje výsledky této analýzy.

mohli bychom stanovit jednoznačnou diagnózu HGT pro 39% případů, zbytek zůstává nerozhodnutelný nebo kompatibilní s rodovým původem. Mezi pravděpodobným HGT 49% navrhlo horizontální zisk pandoraviry a 51% přenos genu z pandoraviru. Zajímavé je, že získávání hostitelských genů, proces obvykle uplatnit jako důležité ve vývoji viry, představují pouze malou část (13%) diagnostikován HGTs, tedy méně než před viry hostitele (18%). Kombinuje výše uvedené statistiky s podílem genů (jedna třetina) jsme začali od, v celém genomu, naznačuje, že maximálně 15% (a alespoň 6%) pandoravirus genu obsah by mohly být získány z buněčných organismů (včetně 5-2% z jejich současného Acanthamoeba hostitele) nebo jinými viry. Takový rozsah hodnot je srovnatelný s tím, co bylo dříve odhadováno pro Mimivirus14. HGT tedy není rozlišovacím procesem na počátku genomů obřích pandoravirů.

poté jsme zkoumali prevalenci duplikací mezi pandoravirovými geny. Obrázek 6a porovnává proporce jednotlivých versus duplicitní (nebo více) protein-kódujících genů z šesti dostupných pandoraviruses se, že vypočtené pro zástupce další tři známé rodiny obřích DNA viry nakažení Acanthamoeba. To jasně ukazuje, že podíl více-copy genů (v rozmezí od 55 do 44%) je vyšší v pandoraviruses, než pro ostatní viru rodiny, i když to není dokonale koreluje s jejich velikostí genomu. Distribuce velikostí klastrů mezi různými kmeny pandoravirů je podobná. Většina genů s více kopiemi se nachází v clusteru velikosti 2 (duplikace) nebo 3 (triplikace). Počet větších shluků pak klesá s jejich velikostí (Doplňkový obr. 7).

br. 6

figure6

Analýza genové duplikace v různých obří virus rodiny. distribuce jedné kopie versus více kopií genů v obřích virech. b Počet odlišné genové shluky.

Méně velkých klastrů (velikost > 20) odpovídají proteiny sdílení protein–protein interakce motivy, jako Ankyrin, MORN, a F-box opakuje. Překvapivě je absolutní počet jednokopírovacích genů v pandoravirech podobný a někdy menší (např. P.neocaledonia, 2 Mb) než u Mimiviru, s genomem (1,18 Mb) poloviční velikosti. Celkově je počet odlišných genových shluků (obr. 6b) přesahy mezi Pandoraviridae (z 607 775) a Mimivirus (687), což naznačuje, že i přes rozdíly v jejich genomu a velikostí částic, tyto viry sdílet srovnatelné genetické složitosti.

duplikace genů jako takový prominentní rys genomů pandoravirů jsme jej dále zkoumali a hledali více informací o jeho mechanismu. Nejprve jsme vypočítali genomické vzdálenosti mezi páry nejbližších paralogů, pravděpodobně vyplývající z nejnovějších duplikačních událostí. Distribuce těchto vzdáleností, podobně pro každý pandoravirus, naznačují, že nejbližší paralogs jsou většinou umístěny vedle sebe (vzdálenost = 1) nebo oddělené jediného genu (vzdálenost = 2) (Doplňkový Obr. 8).

poté jsme se pokusili korelovat fyzickou vzdálenost oddělující duplikované geny s jejich divergencí sekvence jako (hrubý) odhad jejich evoluční vzdálenosti. Získali jsme významnou korelaci mezi odhadovaným „věkem“ duplikační události a genomickou vzdáleností dvou nejbližších paralogů (Doplňkový obr. 9). Tyto výsledky naznačují evoluční scénář, podle kterého většina duplicit jsou první vyskytující se v tandemu, s následným genomu změny (vložení, inverze, a gen ztráty) postupně stírají tento signál.

Srovnávací proteomic z pandoravirions

Naše předchozí hmotnostní spektrometrie proteomic analysis P. salinus částice identifikovány 210 virových genových produktů, z nichž většina ORFans nebo bez předvídatelný funkce. Kromě toho jsme detekovali 56 hostitelských (Acantamoeba) proteinů. Důležité je, že v částicích nebyla detekována žádná ze složek transkripčního aparátu kódovaného virem. 5. V této práci jsme provedli stejnou analýzu P. salinus, P. dulcis, a dva nové izoláty (quercus P. a P. neocaledonia) určit, do jaké míry výše uvedené funkce byly zachovány pro členy Pandoraviridae rodiny s různé úrovně divergence, a určit jádro versus příslušenství, komponenty obecný pandoravirion.

Vzhledem k neustálému zlepšení citlivosti v hmotnostní spektrometrie, naše nové analýzy přečištěné virionů vedlo ke spolehlivé identifikaci 424 proteiny pro P. salinus, 357 pro P. quercus, 387 pro P. dulcis, a 337 k. P. neocaledonia (viz Metody). Tento zvýšený počet identifikací však odpovídá hodnotám hojnosti (absolutní kvantifikace založená na intenzitě, iBAQ) o více než pěti řádech. Mnoho proteinů identifikovaných v nízké množství ocas by tedy neodpovídá bona fide částic složek, ale náhodně vložen kolemjdoucí, „rychlé“ proteiny, nebo zbytkové kontaminace z infikované buňky. Tato opatrná interpretace je navržena několika pozorováními:

  • nízké množství ocas je postupně obohacený virové proteiny identifikovány v částice jednotného pandoravirus kmen (i když ostatní kmeny mají homologní geny),

  • podíl hostitele-kódované proteiny putatively spojené částic zvyšuje na nejnižší abundances,

  • mnoho z těchto hostitelských proteinů byla dříve zjištěna v částicích virus nesouvisí s pandoraviruses ale infikovat téhož hostitele,

  • tyto proteiny jsou hojné v Acanthamoeba proteomu (např., aktin, peroxidáza, atd) což je více pravděpodobné, že bude zachována jako čištění kontaminantů.

Bohužel, iBAQ hodnota distribuce spojené s pandoravirion proteomes nevykazovaly přerušení, která by mohla sloužit jako objektivní hojnosti práh rozlišovat dobré víře částic součásti z pochybných ty. Počet identifikovaných proteinů Acanthamoeba se však prudce zvyšuje po pořadí ≈200 v celém proteomu (Doplňkový obr. 10). Po stejné konzervativní postoj jako pro genomu reannotation, jsme se rozhodli ignorovat proteiny identifikovány níže této hodnosti stejně pravděpodobné, kolemjdoucí a jen 200 nejhojnější proteiny v naší další analýzy částic proteomes (Doplňující Údaje 1, Doplňková Tabulka 3). Pomocí této přísné proteomu definice pro každou ze čtyř různých pandoravirions, jsme nejprve zkoumali rozmanitost jejich představují proteiny a jejich úroveň ochrany ve srovnání s globální genové obsah odpovídající pandoravirus genomů.

Obrázek 7 ukazuje, že částicové proteomy zahrnují proteiny patřící do 194 odlišných shluků, z nichž 102 jsou sdíleny čtyřmi kmeny. Jádro proteomu je tedy strukturálně a funkčně rozmanité. Odpovídá 52,6% celkových proteinových shluků globálně identifikovaných ve všech pandoravirionech. 467 proteinových shluků kódovaných genomem jádra představuje pouze 41,6% (tj. 467/1122) celkového počtu proteinových shluků kódovaných pandoraviry. Pandoravirový “ box „používaný k šíření genomů různých kmenů je tedy výrazně konzervovanější než jejich genový obsah (P“ 10-3, chí-kvadrát test). Geny kódující proteom jádra také vykazují nejsilnější purifikační výběr ze všech pandoravirových genů (Doplňkový obr. 11a).

br. 7

obrázek7

Vennův diagram pro částice proteomes ze čtyř různých pandoravirus kmenů

vyhodnotit spolehlivost našich proteomu analýzy jsme porovnali množství (iBAQ) hodnoty stanoveny pro každou z 200 nejhojnější proteiny ve dvou technických opakováních a dvou biologických opakování provádí na stejném pandoravirus kmen (Doplňkový Obr. 12a & b). Velmi dobrá korelace (Pearsonova R > 0.97) byl získán v obou případech pro hodnoty hojnosti v rozmezí tří řádů. Poté jsme porovnali hodnoty iBAQ získané pro ortologní proteiny sdílené virionovými proteomy různých izolátů. Zde byla opět pozorována dobrá korelace (R > 0.81), jak se očekávalo menší než u výše uvedených replik (Doplňkový obr. 12c & d). Tyto výsledky naznačují, že i když se částice různých kmenů jeví morfologicky identické (Doplňkový obr. 1), přiznávají hmatatelnou flexibilitu jak z hlediska proteinových sad, z nichž jsou vyrobeny (s průměrem 89% párových ortologů), tak z jejich přesné stechiometrie.

poté jsme zkoumali předpokládané funkce proteinů tvořících částice, od nejvíce po nejméně hojné, a doufali jsme, že získáme nějaké poznatky o časném infekčním procesu. Bohužel pouze 19 proteinových shluků mohlo být spojeno s funkčním / strukturálním motivem ze 102 různých shluků definujících proteom jádrových částic (doplňkové údaje 1, doplňková Tabulka 3). Tento podíl je menší než u celého genomu (obr. 5), potvrzující cizí povahu pandoravirus částic, jak již napovídá jeho unikátní morfologie a montáž process5. Pandoraviriony jsou většinou vyrobeny z proteinů bez homologů mimo rodinu Pandoraviridae. Žádný protein ani vzdáleně podobné obvykle hojné hlavní kapsidový protein (MCP), předpověděl, DNA-binding core bílkoviny, nebo DNA-balení Atpázy, znaky většiny eukaryotických velké DNA viry, je detekován. Zejména P. salinus hypotetický protein (dříve ps_862 nyní reannotated psal_cds_450) nedávno navrhl Sinclair et al.15 být silným kandidátem na MCP nebyl detekován v Virionech P. salinus ani v jeho homologech v jiných proteomech kmene. Tento negativní výsledek zdůrazňuje potřebu experimentální validace počítačových předpovědí provedených z“ zóny soumraku “ podobnosti sekvencí. Není detekována žádná stopa RNA polymerázy kódované pandoravirem, což potvrzuje, že počáteční fáze infekce vyžaduje hostitelský transkripční stroj umístěný v jádře. Spliceozomální introny byly validovány pro 56 pandoravirových genů, jejichž produkty byly detekovány v pandoravirionech (doplňkové údaje 1). To naznačuje zachování funkčního spliceosomu až do konce infekčního cyklu, jak se očekává od pozorování nepřerušených jader (Doplňkový obr. 1).

Mezi 19 neanonymní proteinové shluky, 4 vykazují generic motivy bez specifické funkční klíč: 2 kolagen-like domén a 1 Pánev/APPLE-like doménu, která se účastní protein–protein interakcí, a 1 cupin-jako domény odpovídající generic hlavně složit. Mezi 10 nejhojnější core proteiny, 9 nemají žádné předpokládané funkce, s výjimkou 1 vystavuje C-terminální thioredoxin-like domény (psal_cds_383). Stojí za povšimnutí, že předpokládaný segment 22 aminokyselin (85-107) s membránou je zachován ve všech kmenech pandoravirů. 5 ‚ UTR odpovídajících genů vykazuje 2 introny (v P. salinus, P. dulcis a P. quercus) a 1 V P.neokaledonia. Thioredoxin katalyzuje metabolické reakce dithiol-disulfidu reverzibilní oxidací jeho aktivního centra. Tento protein, s další ze stejné rodiny (psal_cds_411, předpověděl jako rozpustný), by mohly být zapojeny v oprava/předcházení fagozom indukované oxidativní poškození virové proteiny před počáteční fázi infekce. Částice také sdílejí další hojný redox enzym, THIOLOXIDOREDUKTÁZU podobnou ERV, která se může podílet na zrání proteinů Fe/S. Další core protein (psal_cds_1260) s dálkovým podobnost s thioredoxin reduktázy mohou podílet na regeneraci oxidovaného aktivních míst z výše uvedených enzymů. Mezi nejhojnější jádrové proteiny je psal_cds_232 předpovídán jako vazba na DNA a může se podílet na balení genomu. Jeden domnělý NAD-dependentní amine oxidase (psal_cds_628), a jeden VÝSTŘELEK-spolu dehydrogenázy (psal_cds_1132), kompletní panel zachovány domnělé redoxní enzymy. Mezi další predikované jádrové proteiny patří kináza Ser/thr a fosfatáza, které jsou typickými regulačními funkcemi. Jeden serin proteázy, jeden lipázy, jeden patatin-jako fosfolipázy, a jeden dálkový homolog z nucleoporin může být součástí toolbox používají k převozu pandoravirus genomu do cytoplazmy a pak do jádra (Doplňující Tabulka 3). Nakonec dva jádrové proteiny (psal_cds_118 a psal_cds_874) sdílejí motiv endoribonukleázy a mohou fungovat jako transkripční regulátory zaměřené na buněčnou mRNA.

Na rozdíl od definování sady jádrových proteinů sdílených všemi pandoraviriony jsme také zkoumali komponenty specifické pro kmen. Bohužel většina virionových proteinů jedinečných pro daný kmen (v průměru asi 10) je anonymní a v nízké hojnosti. Nebylo možné předpovědět funkční důsledek jejich přítomnosti v částicích.