Fig. 6
análise da duplicação de genes em várias famílias de vírus gigantes. uma distribuição de genes de cópia única versus cópia múltipla em vírus gigantes. b Número de distintas do gene clusters
Menos clusters grandes (tamanho > 20) correspondem a proteínas de compartilhamento de proteína–proteína interação motivos, tais como Ankyrin, pela MANHÃ, e o F-caixa de repetições. Surpreendentemente, o número absoluto de genes de cópia única em pandoravírus é semelhante, e às vezes menor (por exemplo, P. neocaledonia, 2 Mb) do que o do Mimivírus, com um genoma (1,18 Mb) metade do tamanho. No geral, o número de clusters de genes distintos (Fig. 6B) sobrepõe-se entre os Pandoraviridae (de 607 a 775) e Mimivírus (687), sugerindo que, apesar de sua diferença no genoma e tamanho das partículas, estes vírus compartilham complexidades genéticas comparáveis.sendo uma característica tão proeminente dos genomas do pandoravírus, investigámo-la ainda mais à procura de mais informações sobre o seu mecanismo. Primeiro, calculamos as distâncias genômicas entre pares de parálogos mais próximos, provavelmente resultantes dos mais recentes eventos de duplicação. As distribuições destas distâncias, semelhantes para cada pandoravírus, indicam que os parágulos mais próximos são mais frequentemente localizados ao lado um do outro (distância = 1) ou separados por um único gene (distância = 2) (Figura suplementar. 8).em seguida, tentamos correlacionar a distância física separando genes duplicados com sua divergência de sequência como uma estimativa (aproximada) de sua distância evolucionária. Obtivemos uma correlação significativa entre a “idade” estimada do evento de duplicação e a distância genômica dos dois parálogos mais próximos (figura suplementar. 9). Estes resultados sugerem um cenário evolutivo em que a maioria das duplicações ocorrem primeiro em conjunto, com subsequentes alterações do genoma (inserções, inversões e Perdas de genes) progressivamente borrando este sinal.a nossa anterior análise Proteómica de espectrometria de massa das partículas de P. salinus identificou 210 produtos genéticos virais, a maioria dos quais Orfanos ou sem função previsível. Além disso, detectamos 56 proteínas hospedeiras (Acantamoeba). Importante, nenhum dos componentes do aparelho de transcrição codificado pelo vírus foi detectado nos particles5. Neste trabalho foram realizadas as mesmas análises P. salinus, P. dulcis, e dois do novo isolados (P. quercus e P. neocaledonia) para determinar em que medida os recursos acima foram conservados para os membros da Pandoraviridae família com vários níveis de divergência, e identificar o núcleo versus o acessório componentes de um genérico pandoravirion.devido à melhoria constante da sensibilidade na espectrometria de massa, as nossas novas análises de viriões purificados levaram à identificação fiável de 424 proteínas para P. salinus, 357 para P. quercus, 387 para P. dulcis e 337 para P. neocaledonia (ver Métodos). No entanto, este número crescente de identificações corresponde a valores de abundância (quantificação absoluta baseada na intensidade, iBAQ) que abrangem mais de cinco ordens de magnitude. Muitas das proteínas identificadas na cauda de baixa abundância podem, portanto, não corresponder a componentes de partículas de boa fé, mas a espectadores carregados aleatoriamente, proteínas “pegajosas”, ou contaminantes residuais de células infectadas. Esta interpretação prudente é sugerida por várias observações:
a baixa abundância de cauda é progressivamente enriquecido em proteínas virais identificadas nas partículas de um único pandoravirus tensão (mesmo que outras cepas possuem genes homólogos),
a proporção de host codificados em proteínas supostamente associado às partículas aumenta com o menor abundância,
muitos desses host proteínas foram detectados anteriormente em partículas de vírus não relacionado para o pandoraviruses mas infectar o mesmo host,
estas proteínas são abundantes no Acanthamoeba proteoma (e.g., actina, peroxidase, etc), tornando-os mais susceptíveis de serem retidos como contaminantes de purificação.
infelizmente, as distribuições de valor iBAQ associadas aos proteomas de pandoravirion não apresentaram uma descontinuidade que pudesse servir como um limiar de abundância objetiva para distinguir componentes de partícula de boa fé de componentes duvidosos. No entanto, o número de proteínas acantamoeba identificadas aumenta acentuadamente após o rank ≈200 em todo o proteoma (Figo suplementar. 10). Seguindo a mesma atitude conservadora que para a reanotação do genoma, decidimos desconsiderar as proteínas identificadas abaixo desta classificação como provavelmente transeuntes e apenas incluiu as 200 proteínas mais abundantes em nossas análises adicionais dos proteomas de partículas (dados suplementares 1, Tabela suplementar 3). Usando esta rigorosa definição de proteoma para cada um dos quatro pandoravírios diferentes, primeiramente investigamos a diversidade de suas proteínas constitutivas e seu nível de conservação em comparação com o conteúdo genético global dos genomas correspondentes do pandoravírus.a Figura 7 mostra que os proteomas de partículas incluem proteínas pertencentes a 194 aglomerados distintos, 102 dos quais são partilhados pelas quatro estirpes. O núcleo proteoma é, portanto, estrutural e funcionalmente diverso. Corresponde a 52,6% do total de grupos proteicos identificados globalmente em todos os pandoravírios. Em comparação, os 467 aglomerados de proteínas codificados pelo genoma Central representam apenas 41,6% (ou seja, 467/1122) do número total de aglomerados de proteínas codificadas pelo pandoravírus. A “caixa de pandoravírus” usada para propagar os genomas das diferentes estirpes é, portanto, significativamente mais conservada do que o seu conteúdo genético (p ” 10-3, teste Qui-quadrado). Os genes que codificam o proteoma central também exibem a seleção purificadora mais forte entre todos os genes do pandoravírus (Figo suplementar. 11a).
Fig. 7
diagrama de Venn das partículas de arqueas de quatro diferentes pandoravirus cepas
Para avaliar a fiabilidade dos nossos proteoma análises foram comparados os abundância (iBAQ) valores determinados para cada um dos 200 mais abundante de proteínas para as duas técnicas replica e biológicos replica realizadas no mesmo pandoravirus tensão (Complementar Fig. 12a & B). A very good correlation (Pearson’s R > 0.97) foi obtida em ambos os casos para valores de Abundância que variam acima de três ordens de magnitude. Em seguida, comparámos os valores iBAQ obtidos para as proteínas ortológicas partilhadas pelos proteomas do virião de diferentes isolados. Aqui novamente, uma boa correlação foi observada (R > 0,81), como esperado menor do que para as réplicas acima (figura suplementar. 12c & d). Estes resultados sugerem que, embora as partículas das diferentes estirpes pareçam morfologicamente idênticas (Figo suplementar. 1), admitem uma flexibilidade tangível tanto em termos dos grupos proteicos de que são feitos (com 89% de ortólogos emparelhados em média), como em sua estequiometria precisa.em seguida, examinamos as funções previstas das proteínas que compõem as partículas, do mais ao menos abundante, na esperança de obter algumas informações sobre o processo infeccioso inicial. Infelizmente, apenas 19 aglomerados de proteínas poderiam ser associados a um motivo funcional/estrutural dos 102 diferentes aglomerados que definem o proteoma de partícula principal (dados suplementares 1, Tabela suplementar 3). Esta proporção é menor do que para todo o genoma (Fig. 5), confirmando a natureza alienígena da partícula de pandoravírus como já sugerido por sua morfologia única e processo de montagem 5. Os pandoravirions são feitos principalmente de proteínas sem homólogos fora da família Pandoraviridae. Nenhuma proteína, mesmo remotamente semelhante à geralmente abundante principal proteína capsida (MCP), uma predita proteína do núcleo de ligação ao DNA, ou uma ATPase de embalagem de DNA, marcas da maioria dos eucarióticos grandes vírus de DNA, é detectada. Em particular, um P. salinus hypothetical protein (anteriormente ps_862 agora reannotated psal_cds_450) recentemente sugerido por Sinclair et al.15 para ser um forte candidato MCP não foi detectado nos viriões P. salinus, nem nos seus homólogos nos outros proteomas da estirpe. Este resultado negativo enfatiza a necessidade de validação experimental de previsões de computador feitas a partir da “quinta dimensão” de similaridade de seqüências. Nenhum vestígio da ARN polimerase codificada pelo pandoravírus é detectado também, confirmando que o estágio inicial da infecção requer a máquina de transcrição do hospedeiro localizada no núcleo. Os intrões spliceosomais foram validados para 56 genes pandoravírus cujos produtos foram detectados nos pandoraviriões (dados suplementares 1). Isto indica a preservação de um spliceosoma funcional até o final do ciclo infeccioso, como esperado a partir da observação de núcleos não quebrados (Figo suplementar. 1).
entre os 19 grupos de proteínas não anônimos, 4 exibem motivos genéricos sem pista funcional específica: 2 domínios semelhantes ao colagénio e 1 Domínio semelhante ao Pan / maçã que estão envolvidos em interações proteína-proteína, e 1 domínio semelhante ao cupin correspondente a uma dobra de barril genérica. Entre as 10 proteínas do núcleo mais abundantes, 9 não têm função prevista, exceto para 1 exibindo um domínio terminal de tioredoxina c (salal_cds_383). Vale a pena notar que o segmento de membrana previsto de 22 aminoácidos (85-107) é conservado em todas as estirpes de pandoravírus. Os 5 ‘ UTR dos genes correspondentes apresentam 2 intrões (em P. salinus, P. dulcis e P. quercus) e 1 em P. neocaledonia. Tioredoxina catalisa reações de troca ditiol-dissulfeto através da oxidação reversível de seu centro ativo. Esta proteína, com outra da mesma família (salal_cds_411, prevista como solúvel), pode estar envolvida na reparação/prevenção de danos oxidativos induzidos pelo fagossomo às proteínas virais antes da fase inicial da infecção. As partículas também compartilham outra enzima redox abundante, uma tiol oxidoredutase semelhante ao ERV que pode estar envolvida na maturação das proteínas Fe/S. Outra proteína Central (sal_cds_1260) com uma semelhança remota com uma tioredoxina redutase pode participar da regeneração dos locais ativos oxidados das enzimas acima mencionadas. Entre as proteínas do núcleo mais abundantes, o salal_cds_232 é previsto como ligação ao DNA, e pode estar envolvido na embalagem do genoma. Uma putativa amina oxidase NAD-dependente (sal_cds_628), e uma DEFIDROGENASE acoplada em FÁD (sal_cds_1132) completam o painel de enzimas putativas redox conservadas. Outras proteínas principais previstas incluem Uma ser / thr cinase e fosfatase que são funções reguladoras típicas. Uma protease serina, uma lipase, uma fosfolipase tipo Patatina, e um homolog remoto de uma nucleoporina podem ser parte da caixa de ferramentas usada para transportar os genomas do pandoravírus para o citoplasma e, em seguida, para o núcleo (tabela suplementar 3). Finalmente, duas proteínas do núcleo (psal_cds_118 e psal_cds_874) compartilham um motivo de endoribonuclease e poderiam funcionar como reguladores transcritionais visando o ARNm celular.
no oposto de definir o conjunto de proteínas do núcleo compartilhado por todos os pandoravirions, nós também investigamos componentes específicos da estirpe. Infelizmente, a maioria das proteínas do virião únicas a uma determinada estirpe (cerca de 10 em média) são anônimas e em baixa abundância. Nenhuma previsão poderia ser feita sobre a consequência funcional de sua presença nas partículas.