Articles

Identification des Prophages et des Restes de Prophages dans le Génome de la bactérie Avibacterium paragallinarum

Résumé

Le séquençage du génome entier bactérien a fourni une abondance de séquences de prophages en tant que sous-produit et l’analyse de ces séquences a révélé des façons dont les phages ont affecté le génome de leur bactérie hôte chez diverses espèces bactériennes. L’objectif de cette étude était d’identifier les séquences liées aux phages dans le projet d’assemblage du génome d’Avibacterium paragallinarum, l’agent causal du coryza infectieux chez la volaille. L’assemblage du génome entier n’était pas possible en raison de la présence de lacunes et/ou de répétitions aux extrémités des contigs. Cependant, l’annotation du génome a révélé des séquences de prophage et de rémanents de prophage présentes dans ce génome. À partir des résultats obtenus, un bactériophage complet de type Mu a pu être identifié, appelé AvpmuC-2M. Une séquence complète de bactériophage de type HP2, nommée AvpC-2M-HP2, a également été identifiée.

1. Introduction

Les bactériophages ont été découverts pour la première fois en Angleterre, en 1915, par Frederick W. Twort et indépendamment de celui-ci en 1917 par Félix d’Hérelle à l’Institut Pasteur de Paris. Les bactériophages sont des virus qui infectent les bactéries et peuvent être divisés en deux groupes selon leurs moyens d’interaction avec la cellule bactérienne, à savoir les phages lytiques (virulents) et tempérés (lysogènes). Les phages lytiques procèdent généralement à la réplication au moment suivant l’infection de la cellule hôte, où un grand nombre de nouveaux virus sont libérés par la lyse de la cellule hôte. Les phages tempérés ne commencent pas nécessairement la réplication immédiatement après l’infection, et selon un certain nombre de conditions, ces phages peuvent intégrer leur chromosome dans le génome de la cellule hôte, restant ainsi silencieux jusqu’à induite. Une fois qu’un génome de bactériophage est intégré dans le génome de la cellule hôte, il est appelé prophage. Les prophages sont les principaux suspects en cas d’adaptation d’agents pathogènes existants à de nouveaux hôtes ou d’émergence de nouveaux agents pathogènes ou de clones épidémiques. Les bactéries n’ont pas de cycle de vie sexuelle et l’échange d’allèles au sein d’une population se réalise par transfert horizontal de gènes, et la source de cet ADN peut être des phages, entre autres. À moins d’être limité par la barrière des espèces, des unités fonctionnelles entières peuvent être importées de ces sources et l’ADN transféré peut avoir une taille allant de 1 kb à plus de 100 kb et peut coder des structures de surface complexes ou même des voies métaboliques entières. Il est établi depuis longtemps que les bactériophages contribuent à la pathogénicité de leurs hôtes bactériens, car de nombreux gènes ont été transférés entre bactéries par le biais de phages. Ces gènes peuvent coder pour un sous-ensemble diversifié de facteurs de virulence tels que la toxine, les facteurs régulateurs (qui régulent à la hausse l’expression des gènes de virulence de l’hôte) et les enzymes, qui peuvent modifier les composants de la virulence bactérienne.

Le séquençage bactérien du génome entier a fourni une abondance de séquences prophagiques. Les prophages peuvent constituer jusqu’à 10 à 20% du génome d’une bactérie, bien que beaucoup de ces prophages soient cryptiques et en état de décomposition mutationnelle. L’analyse de ces séquences a révélé de nombreuses façons dont les prophages façonnent le génome de leurs bactéries hôtes. Les prophages ont la capacité d’affecter l’architecture de leur génome hôte en modifiant le contenu du génome, en modifiant l’organisation du génome ou en modifiant l’emplacement et l’ordre des gènes. Les bactériophages tempérés jouent un rôle complexe dans la génération de la diversité microbienne et dans l’évolution des génomes bactériens par la médiation du réarrangement au sein du chromosome bactérien et, par conséquent, ils contribuent de manière significative aux différences interstrain au sein d’une même espèce bactérienne. En comparaison, deux souches de Streptococcus pyogenes appartiennent à des sérotypes M différents et elles sont associées sans lien avec différentes maladies — mais lorsque ces souches ont été comparées au niveau de l’ADN, les principales différences étaient corrélées aux séquences de prophage. Un autre exemple peut être observé au sein de Campylobacter jejuni, où des différences interstrain peuvent être attribuées à des inversions intra-génomiques de séquences d’ADN prophage de type Mu. Des comparaisons entre génomes colinéaires ont montré que les écarts entre les génomes pertinents étaient attribués à la présence de séquences prophagiques ou à la suite de génomes bactériens réarrangés. Dans de nombreux cas, les prophages avec une identité de séquence d’ADN limitée ou des prophages dupliqués servent de points d’ancrage pour la recombinaison homologue. De plus, les prophages peuvent se recombiner avec d’autres prophages contribuant à leur structure en mosaïque.

Avibacterium paragallinarum est un agent pathogène ciblant les poulets et est à l’origine de la maladie infectieuse coryza. Phylogénétiquement, cette bactérie appartient à la famille des Pasteurellacées et était autrefois connue sous le nom de Haemophilus paragallinarum renommé en 2005. La famille des Pasteurellaceae est composée de bactéries étroitement apparentées et au sein de cette famille, divers bactériophages ont été rapportés chez Haemophilus influenzae, Actinobacillus actinomycetemcomitans, Pasteurella multocida et Mannheimia haemolytica. Des séquences ressemblant à des bactériophages ont été rapportées chez Histophilus somni. Dans cet article, nous décrivons le prophage et les restes de prophage détectés dans Av. paragallinarum.

2. Matériaux et méthodes

2.1. Souches bactériennes et Conditions de croissance

Av. la souche C-2 de paragallinarum (Modesto) a été obtenue à partir d’Onderstepoort Biological Products, à Onderstepoort, en Afrique du Sud. La souche Modesto est dépendante du NAD+ et a été cultivée en TM/ SN additionnée de sérum de poulet à 1% (v / v), de NAD + à 1% (v / v) et d’une solution de thiamine à 0,0005% (m / v) et cultivée dans des conditions limitantes en oxygène dans un bocal à bougies à 37 ° C pendant 16 h.

2.2. Extraction de l’ADN

L’extraction de l’ADN génomique a été réalisée à l’aide d’un Mini kit d’ADN QIAamp de Qiagen. Les recommandations du fabricant ont été méticuleusement suivies, sauf pour la procédure d’élution où l’ADN génomique a été élué dans 2 × 80 µL de Tris-HCl de 10 mM, pH 8.

2.3. Identification de l’Av. paragallinarum

Av. paragallinarum a été identifié en utilisant un protocole de PCR développé spécifiquement pour cette bactérie. De plus, la région de l’ADN ribosomique 16S (ADNr) a été amplifiée afin d’identifier Av. paragallinarum. Le produit de PCR obtenu a été excisé du gel d’agarose, purifié et directement séquencé pour éviter toute contamination possible de l’ADN génomique étranger.

2.4. Assemblage et annotation du génome

Échantillons d’ADN génomique d’Av. la souche C-2 de paragallinarum (Modesto) a été envoyée à Agowa Genomics (maintenant connue sous le nom de LGC Genomics), en Allemagne, pour le pyroséquençage du titane GS-FLX. Les séquences /lectures obtenues à partir du pyroséquençage ont été assemblées en utilisant Newbler 2.0.01.14 de 454 Life Sciences Corporation avec une identité de correspondance minimale de chevauchement de 90% et une longueur de correspondance minimale de chevauchement de 40 bases. Les séquences de contigs obtenus ont été soumises à l’Institut J. Craig Venter (JCVI) en tant que pseudomolécule pour annotation. Le pipeline comprend la recherche de gènes avec Glimmer, les recherches BLAST-Extend-Repraze (BER), les recherches de Modèles de Markov cachés (HMM), les recherches de Modèles de Markov cachés par membrane Trans (TMHMM), les prédictions de SignalP et les annotations automatiques d’AutoAnnotate. Toutes ces informations sont stockées dans une base de données MySQL et les fichiers associés qui ont été téléchargés sur notre site. L’outil d’annotation manuelle Manatee a été téléchargé à partir de SourceForge (http://manatee.sourceforge.net/) et utilisé pour examiner manuellement la sortie du pipeline. pDraw32 du logiciel ACACLONE a été utilisé pour dessiner des cartes génétiques pour la région de prophage.

2.5. Numéros d’adhésion

AvpmuC-2M (numéro d’adhésion.: JN627905); Les prophages de type HP-2 contig A (JN627906), B (JN627907) et C (JN627908); fragments de prophage lamboïdes (nos d’adhésion: JN627909-JN627919); gènes d’intégrase de prophage (nos d’adhésion: JN627920-JN627928).

3. Résultats et discussion

L’ensemble du projet de séquençage du génome de l’Av. paragallinarum a donné un nombre total de 160 743 lectures/séquences par pyroséquençage chimique. Le nombre total de contigs assemblés à partir de ces séquences était de 300, le plus grand contig comprenant 78 465 pb et la taille moyenne des contigs supérieure à 500 pb était de 10 727 pb. Un génome fermé n’a pas pu être assemblé pour Av. paragallinarum à partir des résultats de séquençage obtenus en raison de séquences répétées qui existaient aux extrémités des contigs ou à la suite d’écarts de séquence entre les contigs. Une molécule de pseudogénome a été assemblée à partir des 300 contigs obtenus et envoyée au JCVI pour annotation du génome. Les résultats d’annotation ont indiqué qu’un total de 7% ou 141 cadres de lecture ouverts ont été affectés aux fonctions des protéines phagiques. Les 141 cadres de lecture ouverts ont été identifiés sur 60 des 300 contigs où un ou une série de gènes de prophage ont été cartographiés. Neuf gènes de l’intégrase prophage ont été identifiés et cartographiés sur sept des 60 contigs. Les recherches sur des cadres de lecture ouverts adjacents aux intégrases identifiées n’ont révélé aucun gène supplémentaire lié au prophage, mais plutôt des gènes codant pour des protéines membranaires; des protéines métaboliques; des protéines ribosomiques; protéines de fonction membranaire cellulaire, ou protéines d’exportation membranaire. Aucune homologie significative n’a été observée entre les intégrases.

Des gènes de prophage de type Mu ont été identifiés et cartographiés à 11 contigs différents. Les 11 contigs ont été comparés à la carte génomique des phages de type Mu rapportés par. Ici, nous suggérons un prophage putatif de type Mu pour Av. paragallinarum, AvpmuC-2M (Figure 1). Une grande partie du gène Mu (25) a été identifiée sur un seul contig comprenant 27, 107 pb. Deux contigs supplémentaires ont été identifiés complétant la carte d’un prophage de type Mu pour Av. paragallinarum.

Figure 1

Représentation génomique putative de l’AvpmuC-2M. Les trois contigs qui ont été utilisés dans la construction de l’AvpmuC-2M sont séparés par //. Les tailles de contig sont indiquées sous chaque contig par paires de bases.

Quarante et un gènes lamboïdes ont été cartographiés à 11 contigs différents (Figure 2). Avec les données disponibles du projet de séquençage du génome entier, il n’a pas été possible de conclure si le prophage lamboïde est complet ou s’il a subi une perte massive d’ADN fonctionnel entraînant une fragmentation du génome des bactériophages et conduisant finalement à sa disparition.

Figure 2

Représentation génétique lamboïde. Divers gènes lambda ont été cartographiés aux contigs à partir desquels ils ont été identifiés et regroupés selon des fonctions associées. Les débuts et les extrémités des contigs sont indiqués par //.

Un lysogène complet d’un phage tempéré a été identifié sur un seul contig dans le génome. La succession des gènes identifiés est similaire à celle de H. influenzae HP2 prophage. Une comparaison nucléotidique-nucléotidique a révélé une faible similitude entre le prophage HP2 de H. influenzae et le prophage identifié. Le prophage identifié est donc unique à Av. paragallinarum. Nous vous suggérons de l’appeler AvpC-2M-HP2.

Deux contigs supplémentaires contenaient également des gènes de type HP2 (Figure 3). D’autres études de similitude entre les contigs identifiés (A, B et C d’AcpC-2M-HP2) ont indiqué que les trois contigs partagent la même organisation génomique, mais qu’ils ne sont pas identiques.

(a)
(a)
(b)
(b)
(c)
(c)
(a)
(a) (b)
(b)(c)
(c)
Figure 3

Représentation génétique du prophage de type HP2. Les différents contigs (a), (b) et (c) portant des trames de lecture ouvertes de type HP2 sont illustrés dans ce diagramme. Un prophage complet de type HP2 AvpC-2M-HP2 a été identifié dans le génome d’Av. paragallinarum Modesto représenté par (c) dans ce diagramme.

Une abondance d’autres gènes de prophage ont également été identifiés mais n’ont pu être attribués à aucun phage ou famille de phages spécifique.

Ainsi, la cartographie de tous les gènes de prophage découverts nous a permis de suggérer deux prophages en Av. paragallinarum. Un prophage, AvpmyC-2M, ressemble à un prophage de type Mu, tandis que l’autre prophage, AvpC-2M-HP2, ressemble au prophage HP2 de H. influenzae.

Conflit d’intérêts

Les auteurs déclarent qu’il n’existe aucun conflit d’intérêts avec l’une des identités commerciales mentionnées dans l’article.

Remerciements

Les auteurs tiennent à remercier JCVI d’avoir fourni le service d’annotation JCVI qui leur a fourni des données d’annotation automatiques et l’outil d’annotation manuelle Manatee.