Articles

Frontiers in Microbiology

Introduction

La salmonelle provoque la salmonellose humaine et des infections d’animaux à sang chaud (Kingsley et Bäumler, 2000). Le genre Salmonella est divisé en deux espèces, S. enterica et S. bongori. le sérotypage classe en outre les Salmonelles en plus de 2 600 sérotypes (sérovars) grâce à la réaction d’agglutination d’antisérums sur trois antigènes de surface O, H1 et H2 (Le Minor et Bockemühl, 1984; Le Minor et al., 1990). Il y a 46 antigènes O, qui identifient le sérogroupe. Avec 119 antigènes de flagelline H1 et H2, les combinaisons O, H1 et H2 identifient les sérovars. Seule une faible proportion des sérovars sont responsables de la majorité des infections à salmonelles humaines (Popoff et al., 2004).

Le sérotypage par agglutination antigénique est remplacé par le sérotypage moléculaire (Cai et al., 2005; Wattiau et coll., 2011). Ceci peut être réalisé par l’examen de la séquence du groupe de gènes de l’antigène O, du gène codant pour l’antigène H1 fliC et du gène codant pour l’antigène H2 fljB (Fitzgerald et al., 2007). O les groupes de gènes d’antigènes peuvent être différenciés par la présence ou l’absence de gènes, tandis que les antigènes H1 et H2 sont différenciés par la variation de séquence (McQuiston et al., 2004; Guo et coll., 2013; Zhang et coll., 2015). Les sérotypes de salmonelles peuvent également être déduits par MLST (Wattiau et al., 2011; Achtman et coll., 2012) en tant que sérotype peut être déduit par ses types de séquences. Cependant, une condition préalable à cette approche est qu’une connaissance préalable de la relation correspondante de serovar au type de séquence est requise.

Récemment, avec le développement de la comparaison basée sur la séquence du génome entier, plusieurs études ont identifié des marqueurs génomiques comme une méthode moléculaire alternative pour le sérotypage. Zou et coll. (2016) ont identifié sept gènes qui fournissent une résolution suffisante pour différencier 309 souches de Salmonella représentant 26 sérovars et ont trouvé des gènes spécifiques aux sérovars chez 13 sérovars sur 26. Laing et coll. (2017) ont identifié des fragments génomiques spécifiques aux espèces et sous-espèces de Salmonella grâce à une analyse pan-génomique. Ces gènes ou fragments d’ADN spécifiques ont été utilisés comme cibles moléculaires pour développer de multiples dosages moléculaires pour l’identification et la détection rapides des Salmonelles au niveau des espèces et des sérovars. Cependant, ces gènes ou fragments d’ADN spécifiques sont limités dans leur capacité discriminante en raison de leur capacité à distinguer seulement un plus petit nombre de sérovars.

Dans cette étude, nous avons cherché à utiliser la vaste collection de génomes de Salmonella accessible au public pour identifier les marqueurs génétiques spécifiques aux sérovars pour les sérovars de Salmonella les plus fréquents. Nous montrons le potentiel de ces marqueurs génétiques spécifiques au sérovar comme marqueurs pour le sérotypage moléculaire, soit en typage in silico des données génomiques, soit pour le développement de méthodes de diagnostic en laboratoire.

Matériaux et méthodes

Sélection d’Isolats à base de MLST ST Ribosomique

La base de données sur les Salmonelles dans l’Entérobase (Alikhan et al., 2018) en mars 2018 a été interrogé et 118997 isolats ont été examinés. Des isolats représentatifs pour chaque RST ont été sélectionnés et extraits par un script python interne. Seuls les sérovars avec plus de quatre RST ont été inclus dans cette étude. Pour les 20 plus gros sérovars, les isolats représentatifs n’ont été choisis au hasard que parmi les RST avec deux isolats ou plus. Pour les sérovars restants, un isolat représentatif pour chaque TSR a été sélectionné au hasard. Les lectures brutes de ces isolats ont été extraites de l’ENA (European Nucleotide Archive1) et ont été assemblées de novo à l’aide de l’assembleur SPAdes v3.10.1 avec paramètres par défaut2 (Bankevich et al., 2012). Le sérovar des génomes assemblés a été prédit par SISTR (Yoshida et al., 2016) après avoir satisfait aux critères suivants qui ont été définis par Robertson et al. (2018) en utilisant QUAST3 (Gurevich et al., 2013): taille de l’assemblage entre 4 et 6 Mo avec un nombre de contigs inférieur à 500, le plus grand contig supérieur à 100 kb, teneur en GC comprise entre 50 et 54%, gène prédit par glimmer dans un QUART supérieur à 3000. La concordance entre les prédictions de sérovar SISTR résultantes et les sérovars rapportés sur l’enregistrement des métadonnées des entérobases a été examinée et un petit nombre de génomes ont été retirés de l’analyse en raison de prédictions sérovar incohérentes. L’ensemble de données final comprenait 2258 génomes de haute qualité avec une prédiction sérovar cohérente représentant 107 sérovars (Tableau supplémentaire S1).

Identification de Marqueurs génétiques Candidats Spécifiques au sérovar de Salmonella

Pour déterminer les marqueurs génétiques potentiels spécifiques au sérovar pour 107 sérovars, les 2258 génomes ont été annotés à l’aide de PROKKA (Seemann, 2014). Pan-génome et core-génome ont été analysés par roary (Page et al., 2015) en utilisant un seuil d’identité de séquence de 80 %. Les gènes spécifiques à chaque sérovar ont été identifiés à partir des gènes accessoires du pan-génome avec un script python interne. Dans cette étude, le nombre de génomes d’un sérovar donné contenant un gène spécifique pour ce sérovar a été appelé vrai positif (TP), le nombre de génomes d’un même sérovar dépourvu du même gène a été appelé faux négatif (FN). Le nombre de génomes d’autres sérovars contenant le même gène spécifique au sérovar a été appelé faux positve (FP). Des seuils détendus (20% FN, 10% FP) ont été utilisés initialement afin de s’assurer que tous les sérovars avaient des gènes spécifiques candidats qui pouvaient être étudiés plus avant. Les gènes paralogues ont été retirés des analyses.

Évaluation des marqueurs génétiques potentiels spécifiques au Sérovar

Le score F1 a été utilisé pour la sélection initiale des marqueurs génétiques potentiels spécifiques au sérovar. Le score F1 a été évalué en fonction de la formule: 2 × (Sensibilité PPV ×) / (Sensibilité PPV +), où le PPV a été défini comme TP / (TP + FP) et la sensibilité a été définie comme TP / (TP + FN). Le F1 varie de 0 à 1, où 1 signifie le gène spécifique du sérovar qui était présent dans tous les génomes d’un sérovar donné et absent dans tous les génomes d’autres sérovars. Les marqueurs génétiques spécifiques au sérovar ont été sélectionnés en utilisant le gène le plus performant pour chaque sérovar sur la base du score F1. La spécificité définie comme TN/ (TN+ FP) a été utilisée pour évaluer le taux réel négatif (TN) de marqueurs génétiques spécifiques au sérovar. Le taux de faux positifs (FPR) a été défini par le 1–TNR.

Analyses phylogénétiques

Afin de déterminer les causes des faux négatifs et des FPRs observés dans les marqueurs géniques spécifiques des sérovars candidats, les relations phylogénétiques des sérovars impliqués ont été étudiées. Les assemblages préliminaires de 1258 isolats ont été utilisés pour générer des arbres phylogénétiques en utilisant le panais v1.24 (Treangen et al., 2014) avec des paramètres par défaut pour déterminer la phylogénie entre et au sein des sérovars. L’arbre a été visualisé par FigTree v1.4.3 (Schneider et al., 2000).

Emplacement et fonctions des Marqueurs géniques spécifiques au sérovar

Des génomes complets représentatifs de chaque caractéristique génique contenant un sérovar ont été téléchargés à partir de NCBI5 et ont été utilisés pour déterminer l’emplacement de chacun des gènes spécifiques au sérovar candidats par BLASTN avec les paramètres par défaut (version 2.2.6, Tableau supplémentaire S2). Chez les sérovars sans génome complet représentatif, un génome représentatif a été sélectionné parmi les isolats assemblés dans cette étude. Des séquences de marqueurs génétiques spécifiques au sérovar sont incluses dans les données supplémentaires S1. Le regroupement de gènes à travers le génome a été utilisé pour déterminer si les marqueurs génétiques spécifiques au sérovar faisaient potentiellement partie d’un seul élément obtenu par un sérovar en un seul événement. Les marqueurs géniques sérovar-spécifiques candidats ont été considérés comme un cluster s’ils étaient situés à moins de 5 kb l’un de l’autre.

Les catégories fonctionnelles des marqueurs génétiques ont été identifiées à partir de l’annotation RAST6 (Aziz et al., 2008). Les séquences de prophages dans les génomes de référence des sérovars ont été identifiées en utilisant PHASTER pour indiquer si les marqueurs génétiques spécifiques des sérovars peuvent avoir été acquis avec des prophages (PHAge Search Tool Enhanced Release) (Arndt et al., 2016).

Prédiction du sérotype In silico À l’aide de Marqueurs Génétiques spécifiques au Sérovar

1089 isolats supplémentaires ont été sélectionnés dans l’Entérobase à l’aide d’un script python interne, à l’exclusion de 2258 isolats utilisés pour le dépistage initial de la même base de données en mars 2018 (Tableau supplémentaire S3). BLASTN a été utilisé pour rechercher dans les 1089 génomes appartenant à 106 sérovars de Salmonella la présence de l’un des marqueurs génétiques spécifiques aux sérovars. Des scripts python personnalisés ont ensuite été utilisés pour prédire les sérovars à partir de ces affectations de sérovars en fonction du modèle de présence de gènes connu pour chaque sérovar. Le TP a été classé comme le nombre total de sérovars correctement attribués et les cas où le sérovar correct a été appelé ainsi qu’un ou plusieurs FP. L’affectation échouée a été définie lorsqu’aucun sérovar ou sérovar incorrect n’a été appelé. Les prédictions sérologiques ont été comparées à celles de SeqSero (Zhang et al., 2015) et les prédictions SISTR.

Calcul de la Spécificité des Marqueurs Géniques Spécifiques des Sérovars Candidats pour les Sérovars communs

La spécificité du taux de typage pour les sérovars communs (Hendriksen et al., 2011) était égal à (1 – taux d’erreur potentiel). Le taux d’erreur potentiel des marqueurs géniques spécifiques au sérovar définis par la formule : (Nombre de FPs) ∗ (La fréquence de ce sérovar dans une région donnée) / (Total des génomes de ce sérovar).

Résultats

Identification de Marqueurs géniques spécifiques des sérovars candidats

Les gènes accessoires de 2258 génomes représentant 107 sérovars ont été sélectionnés pour identifier des marqueurs géniques spécifiques des sérovars potentiels. Ce dépistage initial a permis d’identifier 354 marqueurs géniques potentiels spécifiques au sérovar dans 101 sérovars. Six sérovars, à savoir Bareilly, Bovismorbificans, Thompson, Reading, Typhi et Saintpaul, n’avaient aucun marqueur génétique candidat spécifique au sérovar présent dans toutes les lignées d’un sérovar donné. La spécificité (TNR) et la sensibilité (TPR) des 354 marqueurs génétiques candidats spécifiques au sérovar ont également été examinées et résumées à la figure 1. Quarante sérovars contenaient 194 marqueurs génétiques spécifiques aux sérovars avec une spécificité et une sensibilité de 100% (pas de FN ni de FP), tandis que 31 sérovars contenaient 80 marqueurs génétiques spécifiques aux sérovars candidats avec une sensibilité de 100% mais avec une spécificité inférieure à 100% (FP variée). Neuf sérovars contenaient 27 marqueurs génétiques spécifiques des sérovars candidats avec une spécificité de 100% mais avec une sensibilité inférieure à 100% (FN variable). Les 21 sérovars restants contenaient 53 marqueurs génétiques spécifiques des sérovars candidats avec une spécificité et une sensibilité inférieures à 100 % (FN et FP variés).

FIGURE 1
www.frontiersin.org

Figure 1. La distribution de la sensibilité et de la spécificité de 354 marqueurs génétiques potentiels spécifiques au sérovar. TPR, taux vrai positif; FPR, taux faux positif. Où un dégradé allant du bleu clair (faible pourcentage) au bleu foncé (pourcentage élevé) est affiché.

Nous avons construit un arbre phylogénétique en utilisant 1258 isolats représentatifs de 107 sérovars en utilisant du PanAIS (Figure supplémentaire S1). Les 1258 isolats ont été sélectionnés en fonction des relations phylogénétiques des 2258 isolats initiaux parmi lesquels nous avons sélectionné des isolats pour représenter chaque lignée indépendante. Nous avons constaté que les membres de chacun des 82 sérovars formaient une lignée monophylétique tandis que 24 sérovars étaient polyphylétiques, chacun étant composé de 2 à 4 lignées. Plusieurs de ces sérovars sont connus pour être polyphylétiques et il est peu probable qu’ils contiennent des marqueurs génétiques spécifiques aux sérovars (Falush et al., 2006; den Bakker et coll., 2011; Achtman et coll., 2012; Timme et coll., 2013). Serovar Enteritidis est paraphylétique avec trois autres sérovars (Dublin, Berta et Gallinarium) issus du plus grand clade d’Enteritidis qui est lui-même composé de trois lignées connues sous le nom de clade A, B et C (Graham et al., 2018). Les cinq marqueurs génétiques candidats spécifiques à Enteritidis étaient négatifs pour les isolats d’Enteritidis qui se regroupaient séparément sur l’arbre.

Il est intéressant de noter que pour quatre sérovars polyphylétiques, Bredeney, Kottbus, Livingstone et Virchow, chacun avait un gène spécifique du sérovar candidat présent dans tous les isolats de ce sérovar. Pour les 20 sérovars polyphylétiques restants et les entéritides sérovar paraphylétiques, nous avons cherché des marqueurs génétiques spécifiques à la lignée car chaque sérovar contenait plus d’une lignée. Si toutes les lignées contenaient au moins un gène spécifique à la lignée, nous considérons que le sérovar contient des marqueurs génétiques spécifiques au sérovar. Un total de 111 marqueurs génétiques potentiels spécifiques à la lignée ont été identifiés pour 19 sérovars polyphylétiques et entérovar paraphylétiques, parmi lesquels 27 marqueurs génétiques spécifiques à la lignée ont été identifiés pour 5 sérovars présentant une spécificité et une sensibilité à 100 % (pas de FN et de FP), 76 marqueurs génétiques spécifiques à la lignée candidats pour 14 sérovars présentant une sensibilité à 100 % et une spécificité inférieure à 100 % (FP variée), et des Entéritides contenant 6 marqueurs génétiques spécifiques à la lignée candidats présentant une FN variée et FP (tableau 1).

TABLEAU 1
www.frontiersin.org

Tableau 1. Marqueurs génétiques candidats spécifiques à la lignée pour les sérovars polyphylétiques et les sérovars paraphylétiques.

Pour les 11 des 82 sérovars monophylétiques dépourvus de marqueurs génétiques candidats spécifiques aux sérovars en raison de la FN, nous avons constaté que la FN était souvent due à des isolats regroupés sur une branche et divergeant plus tôt des autres isolats. Pour de tels groupes, nous avons cherché des marqueurs génétiques spécifiques à la lignée. Par conséquent, deux marqueurs génétiques ou plus peuvent être utilisés pour identifier un sérovar et de tels sérovars ont également été considérés comme contenant des marqueurs génétiques spécifiques au sérovar, similaires aux sérovars polyphylétiques. Trois sérovars, Paratyphi A, Heidelberg et Muenchen ont pu être identifiés par les marqueurs génétiques combinés spécifiques à la lignée.

Un total de 414 marqueurs génétiques sérovar-spécifiques candidats, dont 295 marqueurs génétiques sérovar-spécifiques et 119 marqueurs génétiques spécifiques à la lignée, sont résumés dans le tableau supplémentaire S2. Au total, 106 des 107 sérovars contenaient un ou plusieurs marqueurs génétiques, 33 sérovars contenaient un gène spécifique tandis que 73 contenaient deux marqueurs génétiques ou plus. Aucun marqueur génique candidat spécifique au sérovar n’a été trouvé pour le Typhi monophylétique et aucun marqueur génique potentiel spécifique à la lignée pour la lignée III de Stanleyville qui ne contenait qu’un seul isolat.

Catégories fonctionnelles de Marqueurs génétiques spécifiques aux sérovars

La caractérisation fonctionnelle des 414 marqueurs génétiques identifiés pour les 106 sérovars utilisant RAST a révélé que 197 avaient des fonctions connues et que 217 protéines hypothétiques codées avec des fonctions inconnues. Seuls 46 gènes avec annotations peuvent être regroupés en catégories fonctionnelles alors que 151 gènes avec fonctions n’étaient pas dans les catégories fonctionnelles RAST (tableau 2). Utilisation de PHASTER. 45 marqueurs génétiques candidats spécifiques au sérovar ont été localisés dans les prophages prédits.

TABLEAU 2
www.frontiersin.org

Tableau 2. Catégories fonctionnelles des gènes spécifiques au Sérovar.

Un ensemble minimal de Marqueurs génétiques spécifiques aux sérovars pour le sérotypage moléculaire in silico

Pour de nombreux sérovars, plusieurs marqueurs génétiques spécifiques aux sérovars candidats ou des marqueurs génétiques spécifiques à la lignée ont été identifiés. Dans ces cas, un seul gène a été sélectionné qui présente les taux de FN et de FP les plus faibles. Un minimum de 131 marqueurs génétiques permet d’identifier les sérovars avec des taux d’erreur de 0 à 8,33%. La distribution des marqueurs génétiques dans les 106 sérovars montre un degré élevé de spécificité, comme le montre la figure 2, dans laquelle la diagonale affiche la relation un à un du sérovar ou de la lignée avec des marqueurs génétiques spécifiques au sérovar, tandis que l’espace hors diagonale montre une présence éparse et dispersée de ces gènes dans d’autres sérovars de pourcentages variés indiquant une faible FPR. Les détails de ces marqueurs génétiques ont été énumérés dans le tableau supplémentaire S4. Dans l’ensemble, 45 sérovars peuvent être distingués par leur gène spécifique au sérovar respectif et 61 sérovars peuvent être différenciés par une combinaison de marqueurs génétiques.

FIGURE 2
www.frontiersin.org

Figure 2. La distribution d’un ensemble minimal de 131 gènes spécifiques aux sérovars dans 106 sérovars. L’axe des ordonnées montre des marqueurs génétiques sérovaires ou spécifiques à une lignée et l’axe des abscisses montre des sérovars ou des lignées. Les détails ont été énumérés dans le tableau supplémentaire S4. Gray a indiqué zéro génomes contenant un gène (TN). Les paires gène/génome le long de la diagonale représentent des génomes contenant les marqueurs génétiques spécifiques au sérovar qui correspondent à leur sérovar (TP). Le rouge représente les gènes présents dans 100% des génomes pour un sérovar ou une lignée donnée. Lorsqu’un gène est présent dans moins de 100 % d’un sérovar, un gradient allant du bleu clair (faible pourcentage) au bleu foncé (pourcentage élevé) est affiché. Les paires bleues le long de la diagonale représentent la présence de FN. Les paires bleues ou rouges à l’extérieur de la diagonale représentent des paires contenant des gènes qui ne correspondent pas au sérovar prédit du génome (PF).

Nous avons testé 1089 génomes supplémentaires appartenant à 106 sérovars de Salmonella non typhoïdaux afin d’évaluer la capacité des 131 marqueurs génétiques spécifiques à attribuer correctement des sérovars à des isolats. En utilisant les marqueurs génétiques spécifiques au sérovar, 1038 des 1089 isolats (95,3 %) ont été attribués avec succès et 51 ont échoué (4,7 %). Pour SISTR et SeqSero, le nombre d’affectations de sérovars concordantes était respectivement de 1 037 (95 %) et de 905 (82,8 %) (Tableau supplémentaire S3).

Marqueurs génétiques spécifiques aux sérovars pour le sérotypage des Sérovars communs

Les 20 premiers sérovars responsables de l’infection humaine trouvés dans chaque continent (Hendriksen et al., 2011) ont été regroupés dans une liste combinée de 46 sérovars (Tableau supplémentaire S5). Étant donné que ces sérovars contenaient la grande majorité des isolats causant des infections humaines à l’échelle mondiale, nous les considérons séparément pour évaluer l’utilité de marqueurs génétiques spécifiques aux sérovars candidats pour le sérotypage des sérovars les plus répandus dans un contexte local. Lorsque seuls ces sérovars ont été pris en compte, 18 sur 46 ont pu être identifiés de manière unique par l’un des marqueurs génétiques spécifiques aux sérovars. Pour augmenter la précision du typage dans les 28 sérovars communs restants où les marqueurs génétiques spécifiques aux sérovars ont des RPF variés, nous avons examiné en utilisant des sous-ensembles des 131 marqueurs génétiques (allant de 2 à 9 gènes par sérovar) pour éliminer la PF potentielle. Par exemple, la combinaison du gène spécifique de Choleraesuis et du gène spécifique de la lignée Cerro-I peut éliminer l’isolat faussement positif de Cerro de Choleraesuis, si les deux gènes sont positifs, l’isolat pourrait se voir attribuer Cerro tandis que si le gène spécifique de la lignée Cerro-I est négatif, l’isolat est Choleraesuis.

Pour estimer les erreurs potentielles de frappe, nous avons pris en compte la fréquence des 46 sérovars communs qui présentaient de grandes différences entre les régions (Hendriksen et al., 2011). Par conséquent, différentes combinaisons de gènes peuvent être utilisées pour limiter spécifiquement les résultats faussement positifs des sérovars présents dans cette région. Dans une région donnée, la spécificité des marqueurs géniques spécifiques des sérovars candidats communs a été calculée en utilisant le taux de PF et la fréquence des sérovars faussement positifs dans cette région. La spécificité des marqueurs génétiques sérovar candidats a également été calculée à l’aide du taux de PF (Tableau supplémentaire S4). Par exemple, un panel de 15 gènes pourrait être utilisé pour taper les 10 sérovars les plus fréquents en Australie (NEPSS 2010) (tableau 3). Lorsque les fréquences régionales australiennes ont été prises en compte, les gènes énumérés dans le tableau 3 peuvent être utilisés comme marqueurs pour le typage en laboratoire et le taux d’erreur sera inférieur à 2,4%.

TABLEAU 3
www.frontiersin.org

Tableau 3. Un panel de gènes spécifiques aux sérovars pour le typage des dix sérovars les plus fréquents en Australie.

Discussion

Le sérotypage des salmonelles a été vital pour le diagnostic et la surveillance. La prédiction sérologique par sérotypage traditionnel peut être limitée par l’absence d’expression d’antigène de surface ou de propriétés d’autoagglutination (Wattiau et al., 2008). Récemment, avec le développement de la technologie de séquençage du génome entier, les régions génomiques pertinentes du cluster de gènes rfb pour l’antigène O, le gène fliC et le gène fljB pour les antigènes H, et les gènes ciblés par le MLST peuvent être extraits et utilisés pour l’identification sérovare. Plusieurs études ont identifié des gènes ou des fragments d’ADN spécifiques au sérovar pour le sérotypage par comparaison génomique basée sur le séquençage du génome entier (Zou et al., 2013, 2016; Laing et coll., 2017). Cependant, ces gènes ou fragments d’ADN spécifiques aux sérovars ne distinguaient qu’un petit nombre de sérovars. Dans cette étude, nous avons identifié 414 marqueurs génétiques candidats spécifiques au sérovar ou spécifiques à la lignée pour 106 sérovars, dont 24 sérovars polyphylétiques et l’Entéritide sérovar paraphylétique. Un sous-ensemble de ces marqueurs génétiques a été validé par des génomes indépendants et a pu attribuer correctement des sérovars dans 95,3% des cas.

L’analyse ci-dessus a été compliquée par la présence de sérovars polyphylétiques, qui naissent indépendamment d’ancêtres distincts pour former des lignées distinctes. Par conséquent, une combinaison de marqueurs génétiques spécifiques à la lignée était nécessaire pour identifier clairement la majorité des sérovars polyphylétiques. Il est intéressant de noter que quatre sérovars polyphylétiques, Bredeney, Kottbus, Livingstone et Virchow, avaient chacun un marqueur génétique spécifique du sérovar candidat présent dans tous les isolats de ce sérovar. Le gène spécifique du sérovar de Bredeney codait une translocase impliquée dans la conversion de l’antigène O et aurait pu être acquis en parallèle. Les gènes spécifiques des sérovars des trois autres sérovars polyphylétiques codent pour des protéines hypothétiques dont la fonction est inconnue et qui n’expliquent apparemment pas leur présence dans différentes lignées du même sérovar.

Contrairement aux sérovars polyphylétiques, les trois lignées (clade A, B et C) des Enteritidis sérovars paraphylétiques partagent un ancêtre commun récent. Les clades A et C sont des ancêtres du Clade B. Des études antérieures ont décrit qu’Enteritidis était regroupé avec des sérovars de Dublin, Berta et Gallinarium, appelés « Section Enteritidis » (Vernikos et al., 2007; Achtman et coll., 2012; Allard et coll., 2013; Timme et coll., 2013). Une autre étude a montré que serovar Nitra était intégré dans les lignées d’Enteritidis en utilisant la phylogénie du génome entier (Deng et al., 2014). Il y avait également une réactivité croisée entre Enteritidis et Nitra selon l’étude d’Ogunremi (Ogunremi et al., 2017). Dans notre étude, nous avons sélectionné les isolats en fonction des TSR, Nitra n’était pas présent dans la base de données rMLST d’Entérobase au début de cette étude et n’a donc pas été inclus dans cette étude. Le Gallinarium se distingue des Entéritides par la présence d’une délétion de 4 pb dans le gène speC (Kang et al., 2011). Nous avons observé que les ancêtres communs des sérovars Dublin, Berta et Gallinarium provenaient d’un ancêtre entre les Clades B et A / C. Bien que Dublin puisse être identifié séparément, nous ne pouvons pas distinguer Berta ou Gallinarium du clade Enteritidis A / C. Ces résultats mettent en évidence une limitation de l’approche car les sérovars doivent être suffisamment divergents pour qu’ils diffèrent par au moins un gène unique. De même, il y avait 8 autres sérovars qui n’étaient pas distinguables probablement en raison d’une ascendance partagée très récente avec peu d’acquisition de gènes.

Des marqueurs génétiques candidats spécifiques au sérovar ou des marqueurs génétiques candidats spécifiques à la lignée chez 69 sérovars sur 106 étaient contigus dans le génome avec des fonctions similaires regroupées (données non présentées). Cela suggère que ces marqueurs génétiques peuvent avoir été incorporés ensemble dans des génomes sérovaires par transfert horizontal de gènes. En effet, les sept marqueurs génétiques candidats spécifiques du Typhimurium identifiés dans cette étude (STM4492, STM4493, STM4494, STM4495, STM4496, STM4497 et STM4498) ont été localisés dans la région de Typhimurium tRNAleuX intégrant des éléments conjugués incluant des gènes de STM4488 à STM4498, qui est un point chaud de transfert horizontal de gènes connu (Bishop et al., 2005). De même, cinq marqueurs génétiques candidats spécifiques à Enteritidis identifiés (SEN1379, SEN1380, SEN1382, SEN1383 et SEN1383) ont été localisés dans la région Sdr I (Agron et al., 2001) et la région GEI/φSE14 de type prophage (Santiviago et al., 2010). Ces deux régions sont liées à des prophages, ce qui suggère que ces régions se sont intégrées au génome d’un ancêtre commun du clade global Enteritidis et ont été dérivées d’un transfert horizontal de gènes.

D’autres méthodes de prédiction sérologique in silico sont mises en œuvre dans SeqSero (Zhang et al., 2015) et SISTR (Yoshida et al., 2016). Ces deux méthodes examinent les régions génomiques responsables des antigènes de surface tandis que SISTR met également en œuvre un schéma cgMLST pour examiner la parenté génétique globale. De plus, les groupes MLST et eBURST traditionnels à 7 gènes dérivés de celui-ci peuvent également être utilisés pour la détermination in silico serovar (Achtman et al., 2012; Ashton et coll., 2016; Robertson et coll., 2018). SISTR et SeqSero offrent tous deux un pouvoir discriminatoire plus élevé que l’identification sérovare traditionnelle (Yachison et al., 2017). Cependant, ils présentent un certain nombre d’inconvénients tels que des sérovars indiscernables ayant la même formule antigénique ou l’absence d’expression des déterminants antigéniques (Robertson et al., 2018). Dans la présente étude, nous avons examiné la prédiction des sérovars in silico en comparant les génomes à un ensemble de 131 marqueurs génétiques spécifiques aux sérovars. L’approche a fourni une prédiction sérovar en produisant la « présence ou l’absence » d’un marqueur génétique spécifique au sérovar individuel ou d’une combinaison de marqueurs génétiques dans un isolat d’interrogation. Nous montrons que les marqueurs géniques spécifiques au sérovar ont une précision comparable à d’autres méthodes de sérotypage in silico avec 91,5% d’isolats de l’ensemble de données d’identification initiale et 84,8% d’isolats d’un ensemble de données de validation attribué au sérovar correct (sans FN et FP). 10.5% des isolats de l’ensemble de données de validation peuvent être affectés à un petit sous-ensemble de sérovars contenant le sérovar correct (avec une PF variée). La spécificité de l’approche de prédiction in silico serovar par les marqueurs génétiques spécifiques au sérovar était de 95,3%, légèrement supérieure à SISTR (95%) et SeqSero (82,8%) dans le même ensemble de données que nous avons testé. Ce résultat était similaire aux spécificités de SISTR et SeqSero rapportées par Yachison et al. (2017) qui étaient respectivement de 94,8 et 88,2 %.

Notre méthode basée sur un marqueur génétique spécifique au sérovar ne nécessite pas l’examen précis des groupes de gènes de l’antigène O ou de la variation de séquence des gènes de l’antigène H, ce qui peut être problématique. Notre méthode réduit également la nécessité d’assembler l’ensemble du gène ou de la séquence du génome, ce qui est nécessaire dans les méthodes basées sur le MLST ou le cgMLST. Par conséquent, cette approche peut être utile dans les cas où très peu de séquences sont disponibles, comme en métagénomique ou en typage sans culture, tout en fournissant une troisième alternative pour confirmer d’autres analyses.

L’identification d’un ensemble de marqueurs génétiques capables d’identifier de manière unique tous les sérovars prévalents dans une région peut également être utile dans les essais moléculaires de développement. Ces dosages seraient utiles pour le sérotypage d’isolats où les cultures ne sont plus obtenues et où le sérotypage traditionnel est donc impossible. Par exemple, un ensemble de tests de PCR pourrait être conçu pour permettre la détection sensible de marqueurs génétiques spécifiques, et donc permettre la prédiction du sérovar, à partir d’un échantillon clinique. De plus, en éliminant la nécessité de détecter des sérovars très rarement observés dans une région, le nombre de ces marqueurs génétiques nécessaires pour détecter tous les sérovars majeurs dans une région peut être considérablement réduit, ce qui permet un dosage plus rentable.

Conclusion

Dans cette étude, nous avons identifié des marqueurs génétiques spécifiques aux sérovars candidats et des marqueurs génétiques spécifiques aux lignées candidates pour 106 sérovars en caractérisant les génomes accessoires d’une sélection représentative de 2258 souches comme marqueurs potentiels pour le sérotypage in silico. Nous prenons en compte les sérovars polyphylétiques et paraphylétiques pour fournir une nouvelle méthode, utilisant la présence ou l’absence de ces marqueurs génétiques, pour prédire le sérovar d’un isolat à partir de données génomiques. Les marqueurs génétiques identifiés ici peuvent également être utilisés pour développer des tests de sérotypage en l’absence d’une souche isolée qui seront utiles au fur et à mesure que le diagnostic passe à des méthodes indépendantes de la culture et métagénomiques.

Contributions de l’auteur

MP et RL ont conçu l’étude et fourni une révision critique du manuscrit. XZ et MP ont effectué l’analyse bioinformatique. XZ, MP et RL ont analysé les résultats. XZ a rédigé le manuscrit.

Financement

Ce travail a bénéficié d’une subvention de projet du Conseil national de recherches médicales et de la Santé.

Déclaration sur les conflits d’intérêts

Les auteurs déclarent que la recherche a été menée en l’absence de relations commerciales ou financières pouvant être interprétées comme un conflit d’intérêts potentiel.

Matériel supplémentaire

Le matériel supplémentaire pour cet article peut être trouvé en ligne à l’adresse suivante:: https://www.frontiersin.org/articles/10.3389/fmicb.2019.00835/full#supplementary-material

FIGURE S1|L’arbre phylogénétique basé sur le SNP construit par le PanAIS montrant les relations évolutives au sein et entre les sérovars en utilisant 1344 isolats représentatifs, dont 1258 isolats de 107 sérovars examinés dans l’étude et 86 isolats de sérovars avec moins de 5 RSD qui étaient autrement exclus de l’étude.

TABLEAU S1 / L’ensemble de données final de 2258 génomes de prédiction sérovar de haute qualité et cohérents représentant 107 sérovars.

TABLEAU S2 / Un total de 414 gènes candidats spécifiques au sérovar, dont 295 gènes spécifiques au sérovar et 119 gènes spécifiques à la lignée.

TABLEAU S3 / 1089 isolats de validation supplémentaires avec des résultats de prédiction sérovar par SISTR, SeqSero et des marqueurs génétiques spécifiques au sérovar.

TABLEAU S4 |Un minimum de 131 gènes pour l’identification de 106 sérovars.

TABLEAU S5 / Un ensemble de 65 gènes pour l’identification de 46 sérovars communs.

DONNÉES S1/ Séquences de 131 marqueurs génétiques spécifiques au sérovar.

Abréviation

FN, faux négatifs; FP, faux positifs; FPR, taux de faux positifs; MLST, typage de séquences multi-locus; NEPSS, Système national de surveillance des agents pathogènes entériques; PPV, valeur prédictive positive; RST, STML ribosomique; SISTR, ressource de typage Salmonella in silico; TN, vrais négatifs; TNR, taux négatif vrai; TP, vrais positifs; TPR, taux positif vrai.

Footnotes

  1. ^ https://www.ebi.ac.uk/ena
  2. ^ http://bioinf.spbau.ru/spades
  3. ^ http://bioinf.spbau.ru/quast
  4. ^ http://github.com/marbl/harvest
  5. ^ https://www.ncbi.nlm.nih.gov/
  6. ^ http://rast.theseed.org/FIG/rast.cgi

Achtman, M., Wain, J., Weill, F.-X., Nair, S., Zhou, Z., Sangal, V., et al. (2012). Multilocus sequence typing as a replacement for serotyping in Salmonella enterica. PLoS Pathog. 8:e1002776. doi: 10.1371/journal.ppat.1002776

PubMed Abstract | CrossRef Full Text | Google Scholar

Agron, P. G., Walker, R. L., Kinde, H., Sawyer, S. J., Hayes, D. C., Wollard, J., et al. (2001). Identification by subtractive hybridization of sequences specific for Salmonella enterica serovar Enteritidis. Appl. Environ. Microbiol. 67, 4984–4991. doi: 10.1128/AEM.67.11.4984-4991.2001

PubMed Abstract | CrossRef Full Text | Google Scholar

Alikhan, N.-F., Zhou, Z., Sergeant, M. J., and Achtman, M. (2018). A genomic overview of the population structure of Salmonella. PLoS Genet. 14: e1007261. doi: 10.1371 / journal.pgen.1007261

Résumé publié / Texte intégral croisé /Google Scholar

Allard, M. W., Luo, Y., Souche, E., Pettengill, J., Timme, R., Wang, C., et al. (2013). On the evolutionary history, population genetics and diversity among isolates of Salmonella Enteritidis PFGE pattern JEGX01. 0004. PLoS Un 8: e55254. doi: 10.1371 / journal.pone.0055254

Résumé publié/ Texte intégral croisé /Google Scholar

Arndt, D., Grant, J. R., Marcu, A., Sajed, T., Pon, A., Liang, Y., et al. (2016). PHASTER : une version améliorée et plus rapide de l’outil de recherche de phages PHAST. Acides nucléiques Res. 44, W16-W21. doi: 10.1093/nar/gkw387

Résumé publié|Texte intégral croisé|Google Scholar

Ashton, P. M., Nair, S., Peters, T. M., Bale, J. A., Powell, D. G., Painset, A., et al. (2016). Identification des Salmonelles pour la surveillance de la santé publique à l’aide du séquençage du génome entier. PeerJ 4: e1752. doi: 10.7717 / peerj.1752

Résumé publié / Texte intégral croisé /Google Scholar

Aziz, R. K., Bartels, D., Best, A.A., DeJongh, M., Disz, T., Edwards, R. A., et al. (2008). Le serveur RAST : annotations rapides utilisant la technologie des sous-systèmes. BMC Génomique 9:75. doi: 10.1186|1471-2164-9-75

Résumé publié/Texte intégral croisé/Google Scholar

Bankevich, A., Nurk, S., Antipov, D., Gurevich, A. A., Dvorkin, M., Kulikov, A. S., et al. (2012). Pique : un nouvel algorithme d’assemblage du génome et ses applications au séquençage unicellulaire. J. Computat. Biol. 19, 455–477. doi: 10.1089/cmb.2012.0021

Résumé PubMed | CrossRef Texte intégral /Google Scholar

Bishop, A. L., Baker, S., Jenks, S., Fookes, M., Gaora, P. Ó, Pickard, D., et al. (2005). Analyse de la région hypervariable du génome de Salmonella enterica associée à tRNAleuX. J. Bacteriol. 187, 2469–2482. doi: 10.1128/JB.187.7.2469-2482.2005

PubMed Abstract | CrossRef Full Text | Google Scholar

Cai, H., Lu, L., Muckle, C., Prescott, J., and Chen, S. (2005). Development of a novel protein microarray method for serotyping Salmonella enterica strains. J. Clin. Microbiol. 43, 3427–3430. doi: 10.1128/JCM.43.7.3427-3430.2005

PubMed Abstract | CrossRef Full Text | Google Scholar

den Bakker, H. C., Switt, A. I. M., Govoni, G., Cummings, C. A., Ranieri, M. L., Degoricija, L., et al. (2011). Le séquençage du génome révèle une diversification de la teneur en facteurs de virulence et une adaptation possible de l’hôte dans des sous-populations distinctes de Salmonella enterica. BMC Génomique 12:425. doi: 10.1186|1471-2164-12-425

Résumé publié/Texte intégral croisé/Google Scholar

Deng, X., Desai, P. T., den Bakker, H. C., Mikoleit, M., Tolar, B., Trees, E., et al. (2014). Épidémiologie génomique du sérotype Enteritide de Salmonella enterica basée sur la structure de la population des lignées prévalentes. Emerg. Infecter. Dis. 20, 1481–1489. doi: 10.3201/eid2009.131095

PubMed Abstract | CrossRef Full Text | Google Scholar

Falush, D., Torpdahl, M., Didelot, X., Conrad, D. F., Wilson, D. J., and Achtman, M. (2006). Mismatch induced speciation in Salmonella: model and data. Philos. Trans. R. Soc. Lond. B Biol. Sci. 361, 2045–2053. doi: 10.1098/rstb.2006.1925

PubMed Abstract | CrossRef Full Text | Google Scholar

Fitzgerald, C., Collins, M., van Duyne, S., Mikoleit, M., Brown, T., and Fields, P. (2007). Multiplex, bead-based suspension array for molecular determination of common Salmonella serogroups. J. Clin. Microbiol. 45, 3323–3334. doi: 10.1128/ JCM.00025-07

Résumé PubMed / Texte intégral CrossRef /Google Scholar

Graham, R. M., Hiley, L., Rathnayake, I.U., et Jennison, A. V. (2018). La génomique comparative identifie des lignées distinctes de S. Enteritidis du Queensland, en Australie. PLoS One 13: e0191042. doi: 10.1371 / journal.pone.0191042

Résumé publié / Texte intégral croisé / Google Scholar

Guo, D., Liu, B., Liu, F., Cao, B., Chen, M., Hao, X., et al. (2013). Développement d’une puce à ADN pour l’identification moléculaire des 46 sérogroupes de Salmonella O. AEM 79, 3392-3399. doi: 10.1128/AEM.00225-13

Résumé PubMed / Texte intégral CrossRef/Google Scholar

Gurevich, A., Saveliev, V., Vyahhi, N., et Tesler, G. (2013). QUAST : outil d’évaluation de la qualité des assemblages génomiques. Bioinformatique 29, 1072-1075. doi: 10.1093/ bioinformatique/btt086

Résumé PubMed |CrossRef Texte intégral/Google Scholar

Hendriksen, R. S., Vieira, A. R., Karlsmose, S., Lo, Fo Wong, D. M., Jensen, A. B., et al. (2011). Surveillance mondiale de la distribution de Salmonella serovar par le réseau mondial de l’Organisation mondiale de la santé sur les infections d’origine alimentaire banque de données par pays : résultats des laboratoires de qualité assurée de 2001 à 2007. Pathogénie d’origine alimentaire. Dis. 8, 887–900. doi: 10.1089/ fpd.2010.0787

Résumé publié / Texte intégral croisé / Google Scholar

Kang, M.-S., Kwon, Y.-K., Jung, B.-Y., Kim, A., Lee, K.-M., An, B.-K., et al. (2011). Identification différentielle de Salmonella enterica subsp. enterica serovar Gallinarum biovars Gallinarum et Pullorum basés sur des régions polymorphes des gènes glgC et speC. Vétérinaire. Microbiol. 147, 181–185. doi: 10.1016/j. vetmic.2010.05.039

Résumé PubMed |Texte intégral CrossRef/Google Scholar

Kingsley, R. A., et Bäumler, A. J. (2000). Adaptation de l’hôte et émergence de maladies infectieuses: le paradigme de la salmonelle. Mol. Microbiol. 36, 1006–1014. doi: 10.1046 /j.1365-2958.2000.01907.x

Résumé PubMed | Texte intégral CrossRef |Google Scholar

Laing, C. R., Whiteside, MD et Gannon, V.P. (2017). Analyses pan-génomiques de l’espèce Salmonella enterica et identification de marqueurs génomiques prédictifs pour les espèces, les sous-espèces et les sérovars. Devant. Microbiol. 8:1345. doi: 10.3389/fmicb.2017.01345

PubMed Abstract | CrossRef Full Text/Google Scholar

Le Minor, L., and Bockemühl, J. (1984). Supplément no XXVII au schéma de Kauffmann-White. Ann. Institut Pasteur Microbiol. 135, 45-51.doi: 10.1016/S0769-2609(84)80042-3

CrossRef Full Text | Google Scholar

Le Minor, L., Popoff, M., and Bockemühl, J. (1990). Supplément 1989 (n° 33) to the Kauffmann-White scheme. Rés. Microbiol. 141, 1173-1177. doi: 10.1016/0923-2508 (90) 90090-D

CrossRef Texte intégral|Google Scholar

McQuiston, J., Parrenas, R., Ortiz-Rivera, M., Gheesling, L., Brenner, F., et Fields, P. I. (2004 ). Séquençage et analyse comparative des gènes de flagelline fliC, fljB et flpA de Salmonella. J. Clin. Microbiol. 42, 1923–1932. doi: 10.1128/ JCM.42.5.1923-1932.2004

Résumé PubMed | CrossRef Texte intégral /Google Scholar

Ogunremi, D., Nadin-Davis, S., Dupras, A. A., Márquez, I. G., Omidi, K., Pope, L., et al. (2017). Évaluation d’un test de PCR multiplex pour l’identification de Salmonella serovars enteritidis et typhimurium à l’aide d’échantillons de vente au détail et d’abattoirs. J. Prot. Alimentaire 80, 295–301. doi:10.4315/0362-028X.JFP-16-167

Résumé publié|Texte intégral croisé|Google Scholar

Page, A. J., Cummins, C.A., Hunt, M., Wong, V. K., Reuter, S., Holden, M. T., et al. (2015). Roary : analyse rapide du génome pan des procaryotes à grande échelle. Bioinformatique 31, 3691-3693. doi: 10.1093/bioinformatics/btv421

PubMed Abstract | CrossRef Full Text | Google Scholar

Popoff, M. Y., Bockemühl, J., and Gheesling, L. L. (2004). Supplement 2002 (no. 46) to the Kauffmann–White scheme. Res. Microbiol. 155, 568–570. doi: 10.1016/j.resmic.2004.04.005

PubMed Abstract | CrossRef Full Text | Google Scholar

Robertson, J., Yoshida, C., Kruczkiewicz, P., Nadon, C., Nichani, A., Taboada, E. N., et al. (2018). Évaluation complète de la qualité des données de séquence du génome entier de Salmonella disponibles dans les bases de données de séquences publiques à l’aide de la ressource de typage in silico de Salmonella (SISTR). Microb. Génomique doi: 10.1099 / mgen.0.000151 .

Résumé publié par PubMed | CrossRef Texte intégral /Google Scholar

Santiviago, C.A., Blondel, C. J., Quezada, C. P., Silva, C.A., Tobar, P. M., Porwollik, S., et al. (2010). Excision spontanée de l’élément de type prophage défectueux spécifique à Salmonella enterica serovar Enteritidis φSE14. J. Bacteriol. 192, 2246–2254. doi: 10.1128/JB.00270-09

PubMed Abstract | CrossRef Full Text | Google Scholar

Schneider, S., Roessli, D., and Excoffier, L. J. U. (2000). Arlequin: A Software for Population Genetics Data Analysis, Vol. 2. Geneva: Genetic and Biomedical Laboratory, 2496–2497.

Google Scholar

Seemann, T. (2014). Prokka: rapid prokaryotic genome annotation. Bioinformatics 30, 2068–2069. doi: 10.1093/ bioinformatique/btu153

Résumé PubMed |CrossRef Texte intégral/Google Scholar

Timme, R. E., Pettengill, J. B., Allard, M. W., Souche, E., Barrangou, R., Wehnes, C., et al. (2013). Diversité phylogénétique de l’agent pathogène entérique Salmonella enterica subsp. enterica a déduit des caractères SNP sans référence à l’échelle du génome. Biol génomique. Evol. 5, 2109–2123. doi:10.1093/gbe/evt159

Résumé publié/Texte intégral croisé/Google Scholar

Treangen, T. J., Ondov, B. D., Koren, S. et Phillippy, A. M. (2014). La suite Harvest pour l’alignement rapide du génome du noyau et la visualisation de milliers de génomes microbiens intraspécifiques. Biol génomique. 15:524. doi: 10.1186/s13059-014-0524- x

Résumé PubMed | Texte intégral CrossRef /Google Scholar

Vernikos, G. S., Thomson, N.R., et Parkhill, J. (2007). Flux génétique au fil du temps dans la lignée des Salmonelles. Biol génomique. 8: R100. doi: 10.1186 / gb-2007-8-6- r100

Résumé PubMed / CrossRef Texte intégral /Google Scholar

Wattiau, P., Boland, C. et Bertrand, S. (2011). Methodologies for Salmonella enterica ssp enterica subtyping: gold standards and alternatives. Appl. Environ. Microbiol. 77, 7877–7885. doi: 10.1128/AEM.05527-11

Résumé publié / Texte intégral croisé /Google Scholar

Wattiau, P., Van Hessche, M., Schlicker, C., Vander Veken, H. et Imberechts, H. J. (2008). Comparaison du sérotypage classique et du test PrémiTest pour l’identification de routine des sérovars communs de Salmonella enterica. J. Clin. Microbiol. 46, 4037–4040. doi: 10.1128/ JCM.01405-08

Résumé PubMed / CrossRef Texte intégral /Google Scholar

Yachison, C. A., Yoshida, C., Robertson, J., Nash, J. H., Kruczkiewicz, P., Taboada, E. N., et al. (2017). La validation et les implications de l’utilisation du séquençage du génome entier en remplacement du sérotypage traditionnel pour un laboratoire national de référence des Salmonelles. Devant. Microbiol. 8:1044. doi: 10.3389/fmicb.2017.01044

Résumé PubMed |CrossRef Texte intégral/Google Scholar

Yoshida, C.E., Kruczkiewicz, P., Laing, C. R., Lingohr, E. J., Gannon, V. P., Nash, J. H., et coll. (2016). La ressource de typage in silico de Salmonella (SISTR) : un outil ouvert accessible sur le Web pour taper et sous-typer rapidement des assemblages de génome de Salmonella. PLoS One 11: e0147101. doi: 10.1371 / journal.pone.0147101

Résumé PubMed / Texte intégral CrossRef /Google Scholar

Zhang, S., Yin, Y., Jones, M. B., Zhang, Z., Kaiser, B. L. D., Dinsmore, B. A., et al. (2015). Détermination du sérotype de Salmonella à l’aide de données de séquençage génomique à haut débit. J. Clin. Microbiol. 53, 1685–1692. doi: 10.1128/ JCM.00323-15

Résumé publié par PubMed | Texte intégral croisé / Google Scholar

Zou, Q.-H., Li, R.-Q., Liu, G.-R. et Liu, S.-L. (2016). Génotypage des Salmonelles avec des gènes spécifiques à la lignée: corrélation avec le sérotypage. Int. J. Infecter. Dis. 49, 134–140. doi: 10.1016/ j. ijid.2016.05.029

Résumé PubMed / CrossRef Texte intégral /Google Scholar

Zou, Q.-H., Li, R.-Q., Wang, Y.-J. et Liu, S.-L. (2013). Identification de gènes permettant de différencier des lignées de Salmonelles étroitement apparentées. PLoS Un 8: e55988. doi: 10.1371/journal.pone.0055988

PubMed Abstract | CrossRef Full Text | Google Scholar