Frontiers in Microbiology
- Einführung
- Materialien und Methoden
- Ribosomale MLST ST-basierte Isolatauswahl
- Identifizierung von Serovar-spezifischen Kandidaten-Genmarkern für Salmonellen
- Bewertung potenzieller Serovar-spezifischer Genmarker
- Phylogenetische Analysen
- Lage und Funktionen von Serovar-spezifischen Genmarkern
- In-Silico-Serotyp-Vorhersage unter Verwendung Serovar-spezifischer Genmarker
- Berechnung der Spezifität von Serovar-spezifischen Genmarkern für häufige Serovare
- Ergebnisse
- Identifizierung von Kandidaten für Serovar-spezifische Genmarker
- Funktionelle Kategorien von Serovar-spezifischen Genmarkern
- Ein minimaler Satz Serovar-spezifischer Genmarker für die molekulare In Silico-Serotypisierung
- Serovar-Spezifische Genmarker für die Serotypisierung häufiger Serovare
- Diskussion
- Schlussfolgerung
- Autorenbeiträge
- Finanzierung
- Erklärung zum Interessenkonflikt
- Ergänzendes Material
- Abkürzung
- Footnotes
Einführung
Salmonellen verursachen menschliche Salmonellose und Infektionen von Warmblütern (Kingsley und Bäumler, 2000). Die Gattung der Salmonellen ist in zwei Arten unterteilt, S. enterica und S. bongori. die Serotypisierung klassifiziert Salmonellen weiter in über 2.600 Serotypen (Serovare) durch die Agglutinationsreaktion von Antiseren auf drei Oberflächenantigene O, H1 und H2 (Le Minor und Bockemühl, 1984; Le Minor et al., 1990). Es gibt 46 O-Antigene, die die Serogruppe identifizieren. Zusammen mit 119 H1- und H2-Flagellinantigenen identifizieren die O-, H1- und H2-Kombinationen die Serovare. Nur ein kleiner Teil der Serovare ist für den Großteil der humanen Salmonelleninfektionen verantwortlich (Popoff et al., 2004).
Die Serotypisierung durch antigene Agglutination wird durch molekulare Serotypisierung ersetzt (Cai et al., 2005; Wattiau et al., 2011). Dies kann durch Untersuchung der Sequenz des O-Antigen-Genclusters, des H1-Antigen-kodierenden Gens fliC und des H2-Antigen-kodierenden Gens fljB erreicht werden (Fitzgerald et al., 2007). O Antigen-Gencluster können durch Vorhandensein oder Fehlen von Genen unterschieden werden, während H1- und H2-Antigene durch Sequenzvariation unterschieden werden (McQuiston et al., 2004; Guo et al., 2013; Zhang et al., 2015). Salmonella-Serotypen können auch durch MLST abgeleitet werden (Wattiau et al., 2011; Achtman et al., 2012) als Serotyp kann durch seine Sequenztypen abgeleitet werden. Voraussetzung für diesen Ansatz ist jedoch, dass Vorkenntnisse über die entsprechende Beziehung von Serovar zum Sequenztyp erforderlich sind.In jüngster Zeit haben mehrere Studien mit der Entwicklung des sequenzbasierten Vergleichs des gesamten Genoms genomische Marker als alternative molekulare Methode zur Serotypisierung identifiziert. Zou et al. (2016) identifizierten sieben Gene, die eine ausreichende Auflösung bieten, um 309 Salmonellenstämme zu differenzieren, die 26 Serovare repräsentieren, und fanden serovarspezifische Gene in 13 von 26 Serovaren. In: Laing et al. (2017) identifizierte genomische Fragmente, die für Salmonellenarten und Unterarten spezifisch sind, durch Pangenomanalyse. Diese spezifischen Gene oder DNA-Fragmente wurden als molekulare Ziele verwendet, um mehrere molekulare Assays zur schnellen Identifizierung und zum Nachweis von Salmonellen auf Spezies- und Serovarebene zu entwickeln. Diese spezifischen Gene oder DNA-Fragmente sind jedoch aufgrund ihrer Fähigkeit, nur eine geringere Anzahl von Serovaren zu unterscheiden, in ihrer Unterscheidungsfähigkeit eingeschränkt.
In dieser Studie wollten wir die umfangreiche, öffentlich zugängliche Sammlung von Salmonellen-Genomen nutzen, um Serovar-spezifische Genmarker für die häufigsten Salmonellen-Serovare zu identifizieren. Wir zeigen das Potenzial dieser serovar-spezifischen Genmarker als Marker für die molekulare Serotypisierung entweder in silico Typisierung von genomischen Daten oder für die Entwicklung von labordiagnostischen Methoden.
Materialien und Methoden
Ribosomale MLST ST-basierte Isolatauswahl
Die Salmonellendatenbank in der Enterobase (Alikhan et al., 2018) ab März 2018 abgefragt und 118997 Objekte untersucht. Repräsentative Isolate für jeden rSTs wurden ausgewählt und durch ein hauseigenes Python-Skript extrahiert. Nur Serovare mit mehr als vier rSTs wurden in diese Studie einbezogen. Für die 20 größten Serovare wurden repräsentative Isolate nur zufällig aus rSTs mit zwei oder mehr Isolaten ausgewählt. Für die verbleibenden Serovare wurde ein repräsentatives Isolat für jedes rST zufällig ausgewählt. Rohdaten für diese Isolate wurden aus dem ENA (European Nucleotide Archive1) abgerufen und de novo mit dem SPAdes v3.10.1 Assembler mit Standardeinstellungen2 (Bankevich et al., 2012). Der Serovar der assemblierten Genome wurde von SISTR (Yoshida et al., 2016), nachdem sie die folgenden Kriterien erfüllt haben, die von Robertson et al. (2018) unter Verwendung von QUAST3 (Gurevich et al., 2013): Assemblygröße zwischen 4 und 6 MB mit der Anzahl der Contigs weniger als 500, dem größten Contig größer als 100 kb, GC-Gehalt zwischen 50 und 54%, Gen, das von Glimmer innerhalb von QUAST mehr als 3000 vorhergesagt wurde. Die Übereinstimmung zwischen den resultierenden SISTR-Serovar-Vorhersagen und dem gemeldeten Serovar im Enterobase-Metadatensatz wurde untersucht und eine kleine Anzahl von Genomen wurde aufgrund inkonsistenter Serovar-Vorhersagen aus der Analyse entfernt. Der endgültige Datensatz bestand aus 2258 hochwertigen Genomen mit konsistenter Serovarvorhersage, die 107 Serovare repräsentierten (ergänzende Tabelle S1).
Identifizierung von Serovar-spezifischen Kandidaten-Genmarkern für Salmonellen
Um die potenziellen serovar-spezifischen Genmarker für 107 Serovare zu bestimmen, wurden die 2258 Genome mit PROKKA annotiert (Seemann, 2014). Pan-Genom und Core-Genom wurden von roary (Page et al., 2015) unter Verwendung einer 80% Sequenzidentitätsschwelle. Die für jeden Serovar spezifischen Gene wurden aus den akzessorischen Genen des Pangenoms mit einem hauseigenen Python-Skript identifiziert. In dieser Studie wurde die Anzahl der Genome eines bestimmten Serovars, die ein spezifisches Gen für dieses Serovar enthielten, als wahr positiv (TP) bezeichnet, die Anzahl der Genome desselben Serovars ohne dasselbe Gen wurde als falsch negativ (FN) bezeichnet. Die Anzahl der Genome von anderen Serovaren, die das gleiche Serovar-spezifische Gen enthalten, wurde als falsch positiv (FP) bezeichnet. Zunächst wurden entspannte Cutoffs (20% FN, 10% FP) verwendet, um sicherzustellen, dass alle Serovare kandidatenspezifische Gene aufwiesen, die weiter untersucht werden konnten. Paralogous Gene wurden aus den Analysen entfernt.
Bewertung potenzieller Serovar-spezifischer Genmarker
Der F1-Score wurde für die erste Auswahl der potenziellen serovar-spezifischen Genmarker verwendet. Der F1-Score wurde basierend auf der Formel bewertet: 2 × (PPV × Empfindlichkeit) / (PPV + Empfindlichkeit), wobei PPV als TP / (TP + FP) und Empfindlichkeit als TP / (TP + FN) definiert wurde. Das F1 reicht von 0 bis 1, wobei 1 das Serovar-spezifische Gen bedeutet, das in allen Genomen eines gegebenen Serovars vorhanden war und in allen Genomen anderer Serovare fehlt. Die Serovar-spezifischen Genmarker wurden unter Verwendung des leistungsstärksten Gens für jedes Serovar basierend auf dem F1-Score ausgewählt. Die als TN / (TN + FP) definierte Spezifität wurde verwendet, um die wahre negative (TN) Rate von Serovar-spezifischen Genmarkern zu bewerten. Die falsch positive Rate (FPR) wurde durch 1 – TNR definiert.
Phylogenetische Analysen
Um die Ursachen für die beobachteten falsch-negativen und FPRs in den Kandidaten-Serovar-spezifischen Genmarkern zu bestimmen, wurden die phylogenetischen Beziehungen der beteiligten Serovare untersucht. Die Entwurfsanordnungen von 1258 Isolaten wurden verwendet, um phylogenetische Bäume unter Verwendung von parsnp v1.24 (Treangen et al., 2014) mit Standardparametern zur Bestimmung der Phylogenie zwischen und innerhalb von Serovaren. Der Baum wurde von FigTree v1.4.3 (Schneider et al., 2000).
Lage und Funktionen von Serovar-spezifischen Genmarkern
Repräsentative vollständige Genome für jedes Serovar, das Genmerkmale enthält, wurden von NCBI5 heruntergeladen und verwendet, um die Position jedes serovar-spezifischen Gens durch BLASTN mit Standardeinstellungen zu bestimmen (Version 2.2.6, Ergänzende Tabelle S2). In Serovaren ohne repräsentatives vollständiges Genom wurde ein repräsentatives Genom aus Isolaten ausgewählt, die in dieser Studie zusammengestellt wurden. Sequenzen von serovar-spezifischen Genmarkern sind in ergänzenden Daten S1 enthalten. Das Clustering von Genen über das Genom wurde verwendet, um zu untersuchen, ob die Serovar-spezifischen Genmarker möglicherweise Teil eines einzelnen Elements waren, das von einem Serovar in einem Ereignis gewonnen wurde. Die serovar-spezifischen Genmarker wurden als Cluster betrachtet, wenn sie weniger als 5 kb voneinander entfernt waren.
Die funktionellen Kategorien von Genmarkern wurden aus der RAST-Annotation6 (Aziz et al., 2008). Die Prophagensequenzen innerhalb von Serovar-Referenzgenomen wurden unter Verwendung von PHASTER identifiziert, um anzuzeigen, ob die serovar-spezifischen Genmarker möglicherweise zusammen mit Prophagen erworben wurden (PHAge Search Tool Enhanced Release) (Arndt et al., 2016).
In-Silico-Serotyp-Vorhersage unter Verwendung Serovar-spezifischer Genmarker
Weitere 1089 Isolate wurden aus der Enterobase unter Verwendung eines hauseigenen Python-Skripts ausgewählt, mit Ausnahme von 2258 Isolaten, die für das Erstscreening aus derselben Datenbank ab März 2018 verwendet wurden (ergänzende Tabelle S3). BLASTN wurde verwendet, um gegen die 1089 Genome von 106 Salmonella-Serovaren nach dem Vorhandensein eines der Serovar-spezifischen Genmarker zu suchen. Benutzerdefinierte Python-Skripte wurden dann verwendet, um Serovar aus diesen Serovar-Zuweisungen basierend auf dem bekannten Genpräsenzmuster für jedes Serovar vorherzusagen. Die TP wurde klassifiziert als die Gesamtzahl der korrekt zugewiesenen Serovare und Fälle, in denen der richtige Serovar aufgerufen wurde, sowie ein oder mehrere FP. Fehlgeschlagene Zuordnung wurde definiert, wenn kein Serovar oder falsche Serovare aufgerufen wurden. Serovar-Vorhersagen wurden mit SeqSero verglichen (Zhang et al., 2015) und SISTR-Vorhersagen.
Berechnung der Spezifität von Serovar-spezifischen Genmarkern für häufige Serovare
Die Spezifität der Typisierungsrate für häufige Serovare (Hendriksen et al., 2011) war gleich (1 – potenzielle Fehlerrate). Die potenzielle Fehlerrate von Serovar-spezifischen Genmarkern, definiert durch die Formel: (Anzahl der FPs)∗ (Die Häufigkeit dieses Serovars in einer bestimmten Region) /(Summe der Genome dieses Serovars).
Ergebnisse
Identifizierung von Kandidaten für Serovar-spezifische Genmarker
Die akzessorischen Gene aus 2258 Genomen, die 107 Serovare repräsentieren, wurden gescreent, um potenzielle serovar-spezifische Genmarker zu identifizieren. Dieses erste Screening identifizierte 354 potenzielle Serovar-spezifische Genmarker innerhalb von 101 Serovaren. Sechs Serovare, nämlich Bareilly, Bovismorbificans, Thompson, Reading, Typhi und Saintpaul, hatten keine Serovar-spezifischen Genmarker, die in allen Linien eines bestimmten Serovars vorhanden waren. Die Spezifität (TNR) und Sensitivität (TPR) der 354 serovar-spezifischen Genmarkerkandidaten wurden ebenfalls untersucht und in Abbildung 1 zusammengefasst. Vierzig Serovare enthielten 194 Serovar-spezifische Genmarker mit 100% Spezifität und Sensitivität (kein FN oder FP), während 31 Serovare 80 Kandidaten-Serovar-spezifische Genmarker mit 100% Sensitivität, aber mit weniger als 100% Spezifität (variiertes FP) enthielten. Neun Serovare enthielten 27 Kandidaten Serovar-spezifische Genmarker mit 100% Spezifität, aber mit weniger als 100% Empfindlichkeit (variierte FN). Die verbleibenden 21 Serovare enthielten 53 Serovar-spezifische Genmarker mit einer Spezifität und Sensitivität von weniger als 100% (variiertes FN und FP).
Abbildung 1. Die Verteilung der Sensitivität und Spezifität von 354 potenziellen Serovar-spezifischen Genmarkern. TPR, wahre positive rate; FPR, falsch positive rate. Hier wird ein Farbverlauf von Hellblau (niedriger Prozentsatz) zu Dunkelblau (hoher Prozentsatz) angezeigt.
Wir konstruierten einen phylogenetischen Baum mit 1258 repräsentativen Isolaten aus 107 Serovaren unter Verwendung von Pastinaken (Ergänzende Abbildung S1). Die 1258 Isolate wurden basierend auf phylogenetischen Beziehungen der ersten 2258 Isolate ausgewählt, aus denen wir Isolate ausgewählt haben, um jede unabhängige Linie darzustellen. Wir fanden heraus, dass Mitglieder jedes der 82 Serovare eine monophyletische Linie bildeten, während 24 Serovare polyphyletisch waren und jeweils aus 2 bis 4 Linien bestanden. Es ist bekannt, dass mehrere dieser Serovare polyphyletisch sind und wahrscheinlich keine serovarspezifischen Genmarker enthalten (Falush et al., 2006; in: den Bakker et al., 2011; Achtman et al., 2012; Timme et al., 2013). Serovar Enteritidis ist paraphyletisch mit drei anderen Serovaren (Dublin, Berta und Gallinarium), die aus der größeren Enteritidis-Klasse stammen, die selbst aus drei Linien besteht, die als Clade A, B und C bekannt sind (Graham et al., 2018). Die fünf Enteritidis-spezifischen Kandidatengenmarker waren negativ gegenüber den Enteritidis-Isolaten, die sich getrennt auf dem Baum gruppierten.Interessanterweise hatte für vier polyphyletische Serovare, Bredeney, Kottbus, Livingstone und Virchow, jeder ein Serovar-spezifisches Kandidatengen, das in allen Isolaten dieses Serovars vorhanden war. Für die verbleibenden 20 polyphyletischen Serovare und paraphyletischen Serovar Enteritidis suchten wir nach abstammungsspezifischen Genmarkern, da jedes Serovar mehr als eine Abstammung enthielt. Wenn alle Abstammungslinien mindestens ein abstammungsspezifisches Gen enthielten, betrachten wir diesen Serovar als serovar-spezifische Genmarker enthaltend. Insgesamt wurden 111 potenzielle abstammungsspezifische Genmarker für 19 polyphyletische Serovare und paraphyletische Serovar-Enteritidis identifiziert, darunter 27 abstammungsspezifische Genmarker für 5 Serovare mit 100% Spezifität und Sensitivität (kein FN und FP), 76 Kandidaten-abstammungsspezifische Genmarker für 14 Serovare mit 100% Sensitivität und weniger als 100% Spezifität (kein FP) und Enteritidis, die 6 Kandidaten-abstammungsspezifische Genmarker mit weniger als variierte FN und FP (Tabelle 1).
Tabelle 1. Abstammungsspezifische Kandidatengenmarker für polyphyletische Serovare und paraphyletische Serovare.
Für die 11 der 82 monophyletischen Serovare, denen Serovar-spezifische Kandidaten-Genmarker aufgrund von FN fehlten, fanden wir heraus, dass die FN oft auf Isolate zurückzuführen war, die auf einem Zweig gruppiert waren und früher von den anderen Isolaten abwichen. Für solche Gruppen suchten wir nach abstammungsspezifischen Genmarkern. Daher können zwei oder mehr Genmarker verwendet werden, um einen Serovar zu identifizieren, und es wurde auch angenommen, dass solche Serovare serovarspezifische Genmarker enthalten, ähnlich wie polyphyletische Serovare. Drei Serovare, Paratyphi A, Heidelberg und München konnten durch die kombinierten abstammungsspezifischen Genmarker identifiziert werden.Insgesamt 414 serovar-spezifische Genmarker, darunter 295 serovar-spezifische Genmarker und 119 abstammungsspezifische Genmarker, sind in der ergänzenden Tabelle S2 zusammengefasst. Insgesamt enthielten 106 von 107 Serovaren einen oder mehrere Genmarker, 33 Serovare enthielten ein spezifisches Gen, während 73 zwei oder mehr Genmarker enthielten. Es wurden keine serovar-spezifischen Genmarker für monophyletische Typhi und keine potenziellen abstammungsspezifischen Genmarker für Abstammung III von Stanleyville gefunden, die nur ein Isolat enthielten.
Funktionelle Kategorien von Serovar-spezifischen Genmarkern
Die funktionelle Charakterisierung aller 414 Genmarker, die für die 106 Serovare mit RAST identifiziert wurden, ergab, dass 197 bekannte Funktionen hatten und 217 hypothetische Proteine mit unbekannten Funktionen kodierten. Nur 46 Gene mit Annotationen können in funktionelle Kategorien eingeteilt werden, während 151 Gene mit Funktionen nicht in RAST-Funktionskategorien waren (Tabelle 2). Mit PHASTER. 45 serovar-spezifische Genmarker wurden in vorhergesagten Prophagen lokalisiert.
Tabelle 2. Serovar-spezifische Gene funktionelle Kategorien.
Ein minimaler Satz Serovar-spezifischer Genmarker für die molekulare In Silico-Serotypisierung
Für viele Serovare wurden mehrere serovar-spezifische Genmarker oder abstammungsspezifische Genmarker identifiziert. In diesen Fällen wurde ein einzelnes Gen ausgewählt, das die niedrigsten FN- und FP-Raten aufweist. Ein Minimum von 131 Genmarkern ermöglicht die Identifizierung der Serovare mit Fehlerraten von 0 bis 8,33%. Die Verteilung der Genmarker über alle 106 Serovare zeigt einen hohen Grad an Spezifität, wie in Abbildung 2 gezeigt, in der die Diagonale die Eins-zu-Eins-Beziehung des Serovars oder der Linie mit Serovar-spezifischen Genmarkern anzeigt, während der off-diagonale Raum zeigte spärlich verstreute Anwesenheit dieser Gene in anderen Serovaren mit unterschiedlichen Prozentsätzen, was auf eine niedrige FPR hinweist. Die Einzelheiten dieser Genmarker sind in der ergänzenden Tabelle S4 aufgeführt. Insgesamt können 45 Serovare durch ihr jeweiliges Serovar-spezifisches Gen und 61 Serovare durch eine Kombination von Genmarkern unterschieden werden.
Abbildung 2. Die Verteilung eines minimalen Satzes von 131 Serovar-spezifischen Genen in 106 Serovaren. Die Y-Achse zeigt Serovar- oder abstammungsspezifische Genmarker und die X-Achse zeigt Serovare oder Abstammungslinien. Die Einzelheiten sind in der ergänzenden Tabelle S4 aufgeführt. Grau zeigte null Genome an, die ein Gen (TN) enthielten. Gen / Genom-Paare entlang der Diagonale stellen Genome dar, die die Serovar-spezifischen Genmarker enthalten, die zu ihrem Serovar (TP) passen. Rot steht für Gene, die in 100% der Genome eines bestimmten Serovars oder einer bestimmten Linie vorhanden sind. Wenn ein Gen in weniger als 100% eines Serovars vorhanden ist, wird ein Gradient von hellblau (niedriger Prozentsatz) zu dunkelblau (hoher Prozentsatz) angezeigt. Blaue Paare entlang der Diagonale repräsentieren das Vorhandensein von FN. Paare, die außerhalb der Diagonale blau oder rot sind, stellen Paare dar, die Gene enthalten, die nicht mit dem vorhergesagten Serovar des Genoms (FP) übereinstimmen.
Wir testeten weitere 1089 Genome von 106 Nicht-Typhus-Salmonella-Serovaren, um die Fähigkeit der 131 spezifischen Genmarker zu bewerten, Serovare korrekt Isolaten zuzuordnen. Unter Verwendung der serovar-spezifischen Genmarker wurden 1038 der 1089 Isolate (95,3%) erfolgreich zugeordnet und 51 versagten (4,7%). Für SISTR und SeqSero betrug die Anzahl der übereinstimmenden Serovarzuordnungen 1037 (95%) bzw. 905 (82,8%) (ergänzende Tabelle S3).
Serovar-Spezifische Genmarker für die Serotypisierung häufiger Serovare
Die 20 häufigsten Serovare, die Infektionen beim Menschen verursachen, wurden auf jedem Kontinent gefunden (Hendriksen et al., 2011) wurden zu einer kombinierten Liste von 46 Serovaren zusammengefasst (ergänzende Tabelle S5). Da diese Serovare die überwiegende Mehrheit der Isolate enthielten, die weltweit Infektionen beim Menschen verursachen, betrachten wir sie separat, um die Nützlichkeit serovar-spezifischer Genmarker für die Serotypisierung der am häufigsten vorkommenden Serovare in einem lokalen Umfeld zu bewerten. Wenn nur diese Serovare betrachtet wurden, konnten 18 von 46 durch einen der Serovar-spezifischen Genmarker eindeutig identifiziert werden. Um die Genauigkeit der Typisierung in den verbleibenden 28 gemeinsamen Serovaren zu erhöhen, in denen Serovar-spezifische Genmarker FPRs variiert haben, untersuchten wir unter Verwendung von Teilmengen der 131 Genmarker (im Bereich von 2 bis 9 Genen pro Serovar), um potenzielle FP zu eliminieren. Zum Beispiel kann die Kombination von Choleraesuis spezifischem Gen und Cerro-I abstammungsspezifischem Gen falsch positives Isolat von Cerro von Choleraesuis eliminieren, wenn beide Gene positiv sind, könnte dem Isolat Cerro zugeordnet werden, während, wenn Cerro-I abstammungsspezifisches Gen negativ ist, das Isolat Choleraesuis ist.
Um mögliche Tippfehler abzuschätzen, berücksichtigten wir die Häufigkeit der 46 häufigsten Serovare, die große Unterschiede zwischen den Regionen aufwiesen (Hendriksen et al., 2011). Daher können verschiedene Kombinationen von Genen verwendet werden, um falsch positive Ergebnisse von Serovaren, die in dieser Region vorhanden sind, spezifisch zu begrenzen. In einer gegebenen Region wurde die Spezifität gemeinsamer Serovar-spezifischer Genmarker unter Verwendung der FP-Rate und der Häufigkeit des falsch positiven Serovars in dieser Region berechnet. Die Spezifität von serovar-spezifischen Genmarkern wurde ebenfalls unter Verwendung der FP-Rate berechnet (ergänzende Tabelle S4). Zum Beispiel könnte ein Panel von 15 Genen für die Typisierung der 10 häufigsten Serovare in Australien (NEPSS 2010) verwendet werden (Tabelle 3). Wenn australische regionale Häufigkeiten berücksichtigt wurden, können die in Tabelle 3 aufgeführten Gene als Marker für die laborbasierte Typisierung verwendet werden, und die Fehlerrate beträgt weniger als 2,4%.
Tabelle 3. Ein Panel von Serovar-spezifischen Genen für die Typisierung der zehn häufigsten Serovare in Australien.
Diskussion
Die Serotypisierung von Salmonellen war für die Diagnose und Überwachung von entscheidender Bedeutung. Die Serovar-Vorhersage durch traditionelle Serotypisierung kann durch den Mangel an Oberflächenantigenexpression oder Autoagglutinationseigenschaften eingeschränkt sein (Wattiau et al., 2008). In jüngster Zeit können mit der Entwicklung der Ganzgenomsequenzierungstechnologie die relevanten genomischen Regionen des RFB-Genclusters für O-Antigen, Gen fliC und Gen fljB für H-Antigene sowie Gene, auf die MLST abzielt, extrahiert und zur Serovaridentifikation verwendet werden. Mehrere Studien haben serovar-spezifische Gene oder DNA-Fragmente für die Serotypisierung durch genomsequenzierungsbasierten genomischen Vergleich identifiziert (Zou et al., 2013, 2016; Laing et al., 2017). Diese serovar-spezifischen Gene oder DNA-Fragmente unterschieden jedoch nur eine geringe Anzahl von Serovaren. In dieser Studie identifizierten wir 414 serovar-spezifische oder abstammungsspezifische Genmarker für 106 Serovare, darunter 24 polyphyletische Serovare und der paraphyletische Serovar Enteritidis. Eine Untergruppe dieser Genmarker wurde durch unabhängige Genome validiert und konnte Serovare in 95,3% der Fälle korrekt zuordnen.
Die obige Analyse wurde durch die Anwesenheit von polyphyletischen Serovaren erschwert, die unabhängig von getrennten Vorfahren entstehen, um getrennte Linien zu bilden. Daher war eine Kombination von abstammungsspezifischen Genmarkern für die eindeutige Identifizierung der Mehrheit der polyphyletischen Serovare erforderlich. Interessanterweise hatten vier polyphyletische Serovare, Bredeney, Kottbus, Livingstone und Virchow, jeweils einen Kandidaten-Serovar-spezifischen Genmarker, der in allen Isolaten dieses Serovars vorhanden war. Es wurde vorhergesagt, dass das Serovar-spezifische Bredeney-Gen für eine Translocase kodiert, die an der O-Antigenumwandlung beteiligt ist, und hätte parallel gewonnen werden können. Die serovar-spezifischen Gene der anderen drei polyphyletischen Serovare kodieren hypothetische Proteine mit unbekannter Funktion und ohne offensichtliche Erklärung für ihre Anwesenheit in verschiedenen Linien desselben Serovars.
Im Gegensatz zu polyphyletischen Serovaren haben die drei Linien (Clade A, B und C) des paraphyletischen Serovars Enteritidis einen jüngeren gemeinsamen Vorfahren. Frühere Studien beschrieben, dass Enteritidis mit den Serovaren Dublin, Berta und Gallinarium gruppiert war, die als „Abschnitt Enteritidis“ bezeichnet wurden (Vernikos et al., 2007; Achtman et al., 2012; Allard et al., 2013; Timme et al., 2013). Eine weitere Studie zeigte, dass Serovar Nitra in Enteritidis-Linien eingebettet wurde, indem die gesamte Genomphylogenie verwendet wurde (Deng et al., 2014). Es gab auch eine Kreuzreaktivität zwischen Enteritidis und Nitra gemäß Ogunremis Studie (Ogunremi et al., 2017). Nitra war zu Beginn dieser Studie nicht in der Enterobase rMLST-Datenbank vorhanden und wurde daher nicht in diese Studie aufgenommen. Gallinarium unterscheidet sich von Enteritidis durch das Vorhandensein einer 4-bp-Deletion im speC-Gen (Kang et al., 2011). Wir beobachteten, dass die gemeinsamen Vorfahren der Serovare Dublin, Berta, und Gallinarium, entstand aus einem Vorfahren zwischen Clades B und A / C. Während Dublin kann separat identifiziert werden, wir können nicht unterscheiden Berta oder Gallinarium von Enteritidis clade A / C. Diese Ergebnisse unterstreichen eine Einschränkung des Ansatzes als Serovare müssen ausreichend divergent sein, dass sie sich durch mindestens ein einzigartiges Gen unterscheiden. In ähnlicher Weise gab es 8 andere Serovare, die wahrscheinlich aufgrund der jüngsten gemeinsamen Abstammung mit geringem Generwerb nicht unterscheidbar waren.
Serovarspezifische Kandidatengenmarker oder abstammungsspezifische Kandidatengenmarker in 69 von 106 Serovaren waren im Genom zusammenhängend mit ähnlichen Funktionen gruppiert (Daten nicht gezeigt). Dies deutet darauf hin, dass diese Genmarker möglicherweise durch horizontalen Gentransfer zusammen in Serovar-Genome eingebaut wurden. Tatsächlich befanden sich die sieben in dieser Studie identifizierten Typhimur-spezifischen Kandidatengenmarker (STM4492, STM4493, STM4494, STM4495, STM4496, STM4497 und STM4498) in der konjugativen elementbezogenen Region von Typhimurium tRNAleuX, einschließlich Genen von STM4488 bis STM4498, einem bekannten horizontalen Gentransfer-Hotspot (Bischof et al., 2005). In ähnlicher Weise wurden fünf identifizierte Enteritidis-spezifische Kandidatengenmarker (SEN1379, SEN1380, SEN1382, SEN1383 und SEN1383) in der Sdr I-Region lokalisiert (Agron et al., 2001) und die prophagenartige GEI/φSE14-Region (Santiviago et al., 2010). Beide Regionen sind mit Prophagen verbunden, was darauf hindeutet, dass diese Regionen in das Genom eines gemeinsamen Vorfahren der globalen Enteritidis-Klade integriert sind und aus dem horizontalen Gentransfer stammen.
Weitere Methoden zur In silico Serovar Vorhersage sind in SeqSero implementiert (Zhang et al., 2015) und SISTR (Yoshida et al., 2016). Beide Methoden untersuchen genomische Regionen, die für Oberflächenantigene verantwortlich sind, während SISTR auch ein cgMLST-Schema implementiert, um die gesamte genetische Verwandtschaft zu untersuchen. Darüber hinaus können traditionelle 7-Gen-MLST- und eBURST-Gruppen, die davon abgeleitet sind, auch für die In-Silico-Serovarbestimmung verwendet werden (Achtman et al., 2012; Ashton et al., 2016; Köhler et al., 2018). Sowohl SISTR als auch SeqSero bieten eine höhere Diskriminierungsleistung als die herkömmliche Serovaridentifikation (Yachison et al., 2017). Sie weisen jedoch eine Reihe von Nachteilen auf, wie nicht unterscheidbare Serovare mit derselben Antigenformel oder nicht exprimierte antigene Determinanten (Robertson et al., 2018). In der aktuellen Studie untersuchten wir die In-Silico-Serovar-Vorhersage durch Screening von Genomen gegen einen Satz von 131 Serovar-spezifischen Genmarkern. Der Ansatz lieferte eine Serovar-Vorhersage, indem er das „Vorhandensein oder Fehlen“ einzelner Serovar-spezifischer Genmarker oder eine Kombination von Genmarkern in einem einzelnen Isolat ergab. Wir zeigen, dass Serovar-spezifische Genmarker eine vergleichbare Genauigkeit aufweisen wie andere In-Silico-Serotypisierungsmethoden mit 91,5% Isolaten aus dem anfänglichen Identifikationsdatensatz und 84,8% Isolaten aus einem Validierungsdatensatz, die dem richtigen Serovar zugeordnet sind (ohne FN und FP). 10.5% der Isolate aus dem Validierungsdatensatz können einer kleinen Teilmenge von Serovaren zugeordnet werden, die das richtige Serovar (mit unterschiedlichem FP) enthalten. Die Spezifität für den In silico Serovar-Vorhersageansatz durch Serovar-spezifische Genmarker betrug 95,3%, etwas höher als SISTR (95%) und SeqSero (82,8%) im selben Datensatz, den wir getestet haben. Dieses Ergebnis ähnelte den Spezifitäten von SISTR und SeqSero, die von Yachison et al. (2017), die 94,8 und 88,2% waren.
Unsere auf Serovar-spezifischen Genmarkern basierende Methode erfordert keine genaue Untersuchung von O-Antigen-Genclustern oder Sequenzvariationen der H-Antigen-Gene, was problematisch sein kann. Unsere Methode erleichtert auch die Notwendigkeit, das gesamte Gen oder die Genomsequenz zusammenzusetzen, was bei MLST- oder cgMLST-basierten Methoden erforderlich ist. Daher kann dieser Ansatz für Fälle nützlich sein, in denen nur sehr wenig Sequenz verfügbar ist, z. B. in der Metagenomik oder kulturfreien Typisierung, und eine dritte Alternative zur Bestätigung anderer Analysen bieten.
Die Identifizierung eines Satzes von Genmarkern, die in der Lage sind, alle vorherrschenden Serovare in einer Region eindeutig zu identifizieren, kann auch bei der Entwicklung von molekularen Assays nützlich sein. Diese Assays wären nützlich bei der Serotypisierung von Isolaten, bei denen keine Kulturen mehr erhalten werden und eine traditionelle Serotypisierung daher unmöglich ist. Beispielsweise könnte ein Satz von PCR-Assays entwickelt werden, die den sensitiven Nachweis spezifischer Genmarker und damit die Vorhersage des Serovars aus einer klinischen Probe ermöglichen. Darüber hinaus kann durch den Wegfall der Notwendigkeit, Serovare nachzuweisen, die in einer Region sehr selten beobachtet werden, die Anzahl dieser Genmarker, die zum Nachweis aller wichtigen Serovare in einer Region erforderlich sind, signifikant reduziert werden, was einen kostengünstigeren Assay ermöglicht.
Schlussfolgerung
In dieser Studie identifizierten wir serovar-spezifische Genmarker und abstammungsspezifische Genmarker für 106 Serovare, indem wir die akzessorischen Genome einer repräsentativen Auswahl von 2258 Stämmen als potenzielle Marker für die In-Silico-Serotypisierung charakterisierten. Wir berücksichtigen polyphyletische und paraphyletische Serovare, um eine neue Methode bereitzustellen, die das Vorhandensein oder Fehlen dieser Genmarker verwendet, um den Serovar eines Isolats aus genomischen Daten vorherzusagen. Die hier identifizierten Genmarker können auch verwendet werden, um Serotypisierungstests in Abwesenheit eines isolierten Stammes zu entwickeln, was nützlich sein wird, wenn die Diagnose auf kulturunabhängige und metagenomische Methoden umgestellt wird.
Autorenbeiträge
MP und RL gestalteten die Studie und sorgten für eine kritische Überarbeitung des Manuskripts. XZ und MP führten die bioinformatische Analyse durch. XZ, MP und RL analysierten die Ergebnisse. XZ entwarf das Manuskript.
Finanzierung
Diese Arbeit wurde mit einem Projektstipendium des National Health and Medical Research Council unterstützt.
Erklärung zum Interessenkonflikt
Die Autoren erklären, dass die Forschung in Abwesenheit von kommerziellen oder finanziellen Beziehungen durchgeführt wurde, die als potenzieller Interessenkonflikt ausgelegt werden könnten.
Ergänzendes Material
Das ergänzende Material zu diesem Artikel finden Sie online unter: https://www.frontiersin.org/articles/10.3389/fmicb.2019.00835/full#supplementary-material
ABBILDUNG S1 | Der SNP-basierte phylogenetische Baum, der von ParSNP erstellt wurde und die evolutionären Beziehungen innerhalb und zwischen Serovaren anhand von 1344 repräsentativen Isolaten zeigt, darunter 1258 Isolate von 107 in der Studie untersuchten Serovaren und 86 Isolate von Serovaren mit weniger als 5 rSTs, die ansonsten von der Studie ausgeschlossen wurden.TABELLE S1 / Der endgültige Datensatz von 2258 qualitativ hochwertigen und konsistenten Serovar-Prädiktionsgenomen, die 107 Serovare repräsentieren.TABELLE S2 / Insgesamt 414 serovar-spezifische Kandidatengene, darunter 295 serovar-spezifische Gene und 119 abstammungsspezifische Gene.TABELLE S3 / Weitere 1089 Validierungsisolate mit Serovar-Prädiktionsergebnissen von SISTR, SeqSero und serovar-spezifischen Genmarkern.TABELLE S4 / Mindestens 131 Gene zur Identifizierung von 106 Serovaren.
TABELLE S5 / Ein Satz von 65 Genen zur Identifizierung von 46 gemeinsamen Serovaren.
DATEN S1 / Sequenzen von 131 Serovar-spezifischen Genmarkern.
Abkürzung
FN, falsch negative Ergebnisse; FP, falsch positive Ergebnisse; FPR, falsch positive Rate; MLST, Multi-Locus-Sequenz-Typisierung; NEPSS, National Enteric Pathogens Surveillance Scheme; PPV, positiver Vorhersagewert; rSTs, ribosomale MLST STs; SISTR, Salmonella in Silico Typisierungsressource; TN, wahre Negative; TNR, wahre negative Rate; TP, wahre Positive; TPR, wahre positive Rate.
Footnotes
- ^ https://www.ebi.ac.uk/ena
- ^ http://bioinf.spbau.ru/spades
- ^ http://bioinf.spbau.ru/quast
- ^ http://github.com/marbl/harvest
- ^ https://www.ncbi.nlm.nih.gov/
- ^ http://rast.theseed.org/FIG/rast.cgi
Achtman, M., Wain, J., Weill, F.-X., Nair, S., Zhou, Z., Sangal, V., et al. (2012). Multilocus sequence typing as a replacement for serotyping in Salmonella enterica. PLoS Pathog. 8:e1002776. doi: 10.1371/journal.ppat.1002776
PubMed Abstract | CrossRef Full Text | Google Scholar
Agron, P. G., Walker, R. L., Kinde, H., Sawyer, S. J., Hayes, D. C., Wollard, J., et al. (2001). Identification by subtractive hybridization of sequences specific for Salmonella enterica serovar Enteritidis. Appl. Environ. Microbiol. 67, 4984–4991. doi: 10.1128/AEM.67.11.4984-4991.2001
PubMed Abstract | CrossRef Full Text | Google Scholar
Alikhan, N.-F., Zhou, Z., Sergeant, M. J., and Achtman, M. (2018). Ein genomischer Überblick über die Populationsstruktur von Salmonellen. PLoS Genet. 14:e1007261. doi: 10.1371/Zeitschrift.in: pgen.1007261
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Allard, MW, Luo, Y., Stamm, E., Pettengill, J., Timme, R., Wang, C., et al. (2013). Zur Evolutionsgeschichte, Populationsgenetik und Diversität unter Isolaten von Salmonella Enteritidis PFGE-Muster JEGX01. 0004. Plus Eins 8:e55254. doi: 10.1371/Zeitschrift.pone.0055254
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Arndt, D., Grant, J. R., Marcu, A., Sajed, T., Pon, A., Liang, Y., et al. (2016). PHASTER: Eine bessere, schnellere Version des PHAST-Phagen-Suchwerkzeugs. Nukleinsäuren Res. 44, W16-W21. doi: 10.1093/nar/gkw387
PubMed Zusammenfassung | CrossRef Volltext / Google Scholar
Ashton, P. M., Nair, S., Peters, T. M., Bale, J. A., Powell, D. G., Painset, A., et al. (2016). Identifizierung von Salmonellen für die Überwachung der öffentlichen Gesundheit mithilfe der Sequenzierung des gesamten Genoms. PeerJ 4:e1752. doi: 10.7717/peerj.1752
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Aziz, R. K., Bartels, D., Best, A. A., DeJongh, M., Disz, T., Edwards, R. A., et al. (2008). Der RAST-Server: Schnelle Annotationen mittels Subsystemtechnik. In: BMC Genomics 9:75. doi: 10.1186/1471-2164-9-75
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Bankevich, A., Nurk, S., Antipov, D., Gurevich, A. A., Dvorkin, M., Kulikov, AS, et al. (2012). SPAdes: ein neuer Genomassemblierungsalgorithmus und seine Anwendungen auf die Einzelzellsequenzierung. In: J. Computat. Biol. 19, 455–477. doi: 10,1089/cmb.2012.0021
PubMed Zusammenfassung | CrossRef Volltext / Google Scholar
Bischof, A. L., Bäcker, S., Jenks, S., Fookes, M., Gaora, P. Ó, Pickard, D., et al. (2005). Analyse der hypervariablen Region des mit tRNAleuX assoziierten Salmonella enterica-Genoms. In: J. Bacteriol. 187, 2469–2482. Ursprungsbezeichnung: 10.1128/JB.187.7.2469-2482.2005
PubMed Abstract | CrossRef Full Text | Google Scholar
Cai, H., Lu, L., Muckle, C., Prescott, J., and Chen, S. (2005). Development of a novel protein microarray method for serotyping Salmonella enterica strains. J. Clin. Microbiol. 43, 3427–3430. doi: 10.1128/JCM.43.7.3427-3430.2005
PubMed Abstract | CrossRef Full Text | Google Scholar
den Bakker, H. C., Switt, A. I. M., Govoni, G., Cummings, C. A., Ranieri, M. L., Degoricija, L., et al. (2011). Die Genomsequenzierung zeigt eine Diversifizierung des Virulenzfaktorgehalts und eine mögliche Wirtsanpassung in verschiedenen Subpopulationen von Salmonella enterica. BMC Genomik 12:425. doi: 10.1186/1471-2164-12-425
PubMed Zusammenfassung | CrossRef Volltext / Google Scholar
Deng, X., Desai, P. T., den Bakker, H. C., Mikoleit, M., Tolar, B., Bäume, E., et al. (2014). Genomische Epidemiologie von Salmonella enterica Serotyp Enteritidis basierend auf der Populationsstruktur vorherrschender Linien. Emerg. Infizieren. Dis. 20, 1481–1489. doi: 10.3201/eid2009.131095
PubMed Abstract | CrossRef Full Text | Google Scholar
Falush, D., Torpdahl, M., Didelot, X., Conrad, D. F., Wilson, D. J., and Achtman, M. (2006). Mismatch induced speciation in Salmonella: model and data. Philos. Trans. R. Soc. Lond. B Biol. Sci. 361, 2045–2053. doi: 10.1098/rstb.2006.1925
PubMed Abstract | CrossRef Full Text | Google Scholar
Fitzgerald, C., Collins, M., van Duyne, S., Mikoleit, M., Brown, T., and Fields, P. (2007). Multiplex-Suspensionsarray auf Perlbasis zur molekularen Bestimmung gängiger Salmonellenserogruppen. J. Clin. Microbiol. 45, 3323–3334. doi: 10.1128/JCM.00025-07
PubMed Abstract / CrossRef Full Text / Google Scholar
Graham, R. M., Hiley, L., Rathnayake, I. U. und Jennison, A. V. (2018). Vergleichende Genomik identifiziert verschiedene Linien von S. Enteritidis aus Queensland, Australien. Plus Eins 13:e0191042. doi: 10.1371/Zeitschrift.pone.0191042
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Guo, D., Liu, B., Liu, F., Cao, B., Chen, M., Hao, X., et al. (2013). Entwicklung eines DNA-Microarrays zur molekularen Identifizierung aller 46 Salmonellen-O-Serogruppen. AEM 79, 3392-3399. modell: 10.1128/AEM.00225-13
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Gurevich, A., Saveliev, V., Vyahhi, N. und Tesler, G. (2013). QUAST: Qualitätsbewertungstool für Genombaugruppen. Bioinformatik 29, 1072-1075. doi: 10.1093/bioinformatik/btt086
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Hendriksen, R. S., Vieira, A. R., Karlsmose, S., Lo, Fo Wong, D. M., Jensen, A. B., et al. (2011). Global monitoring of Salmonella serovar distribution from the world health organization global foodborne infections network country data bank: Ergebnisse von qualitätsgesicherten Labors von 2001 bis 2007. In: Foodborne Pathog. Dis. 8, 887–900. ursprungsbezeichnung: 10.1089/fpd.2010.0787
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Kang, M.-S., Kwon, Y.-K., Jung, B.-Y., Kim, A., Lee, K.-M., Ein, B.-K., et al. (2011). Differentielle Identifizierung von Salmonella enterica subsp. enterica serovar Gallinarum Biovare Gallinarum und Pullorum basierend auf polymorphen Regionen von glgC- und speC-Genen. Tierarzt. Microbiol. 147, 181–185. doi: 10.1016/j.vetmic.2010.05.039
PubMed Abstract / CrossRef Full Text / Google Scholar
Kingsley, R. A. und Bäumler, A. J. (2000). Wirtsanpassung und die Entstehung von Infektionskrankheiten: das Salmonellen-Paradigma. Mol. Microbiol. 36, 1006–1014. doi: 10.1046/j.1365-2958.2000.01907.x
PubMed Abstract / CrossRef Full Text / Google Scholar
Laing, CR, Whiteside, MD und Gannon, VP (2017). Pangenomanalysen der Art Salmonella enterica und Identifizierung genomischer Marker, die für Arten, Unterarten und Serovare prädiktiv sind. Front. Microbiol. 8:1345. doi: 10.3389/fmicb.2017.01345
PubMed Abstract | CrossRef Full Text | Google Scholar
Le Minor, L., and Bockemühl, J. (1984). Supplément no XXVII au schéma de Kauffmann-White. Ann. Institut Pasteur Microbiol. 135, 45–51. doi: 10.1016/S0769-2609(84)80042-3
CrossRef Full Text | Google Scholar
Le Minor, L., Popoff, M., and Bockemühl, J. (1990). Supplement 1989 (n° 33) to the Kauffmann-White scheme. Res. Microbiol. 141, 1173–1177. doi: 10.1016/0923-2508(90)90090-D
CrossRef Volltext | Google Scholar
McQuiston, J., Parrenas, R., Ortiz-Rivera, M., Gheesling, L., Brenner, F. und Felder, PI (2004). Sequenzierung und vergleichende Analyse von Flagellingenen fliC, fljB und flpA aus Salmonellen. J. Clin. Microbiol. 42, 1923–1932. doi: 10.1128/JCM.42.5.1923-1932.2004
PubMed Zusammenfassung | CrossRef Volltext / Google Scholar
Ogunremi, D., Nadin-Davis, S., Dupras, A. A., Márquez, I. G., Omidi, K., Pope, L., et al. (2017). Auswertung eines Multiplex-PCR-Assays zur Identifizierung von Salmonella serovars enteritidis und typhimurium anhand von Einzelhandels- und Schlachthofproben. J. Lebensmittel Prot. 80, 295–301. doi: 10.4315/0362-028X.JFP-16-167
PubMed Zusammenfassung | CrossRef Volltext | Google Scholar
Page, A. J., Cummins, C. A., Hunt, M., Wong, V. K., Reuter, S., Holden, M. T., et al. (2015). Roary: Schnelle groß angelegte Pan-Genomanalyse von Prokaryoten. Bioinformatik 31, 3691-3693. doi: 10.1093/bioinformatics/btv421
PubMed Abstract | CrossRef Full Text | Google Scholar
Popoff, M. Y., Bockemühl, J., and Gheesling, L. L. (2004). Supplement 2002 (no. 46) to the Kauffmann–White scheme. Res. Microbiol. 155, 568–570. doi: 10.1016/j.resmic.2004.04.005
PubMed Abstract | CrossRef Full Text | Google Scholar
Robertson, J., Yoshida, C., Kruczkiewicz, P., Nadon, C., Nichani, A., Taboada, E. N., et al. (2018). Umfassende Bewertung der Qualität von Salmonella-Gesamtgenomsequenzdaten, die in öffentlichen Sequenzdatenbanken unter Verwendung der Salmonella in silico Typing Resource (SISTR) verfügbar sind. Mikrob. Genomik doi: 10.1099/mgen.0.000151 .
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Santiviago, C. A., Blondel, C. J., Quezada, C. P., Silva, C. A., Tobar, P. M., Porwollik, S., et al. (2010). Spontane Exzision des Salmonella enterica serovar Enteritidis-spezifischen defekten prophagenartigen Elements φSE14. In: J. Bacteriol. 192, 2246–2254. Ursprungsbezeichnung: 10.1128/JB.00270-09
PubMed Abstract | CrossRef Full Text | Google Scholar
Schneider, S., Roessli, D., and Excoffier, L. J. U. (2000). Arlequin: A Software for Population Genetics Data Analysis, Vol. 2. Geneva: Genetic and Biomedical Laboratory, 2496–2497.
Google Scholar
Seemann, T. (2014). Prokka: rapid prokaryotic genome annotation. Bioinformatics 30, 2068–2069. doi: 10.1093/bioinformatik/btu153
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Timme, R. E., Pettengill, J. B., Allard, M. W., Strain, E., Barrangou, R., Wehnes, C., et al. (2013). Phylogenetische Diversität des magensaftresistenten Erregers Salmonella enterica subsp. enterica abgeleitet aus genomweiten referenzfreien SNP-Zeichen. In: Genome Biol. In: Evol. 5, 2109–2123. doi: 10.1093/gbe/evt159
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Treangen, T. J., Ondov, B. D., Koren, S. und Phillippy, A. M. (2014). Die Harvest Suite für die schnelle Ausrichtung des Kerngenoms und die Visualisierung tausender intraspezifischer mikrobieller Genome. In: Genome Biol. 15:524. ust-IDNR.: 10.1186/s13059-014-0524- x
PubMed Abstract / CrossRef Full Text / Google Scholar
Vernikos, GS, Thomson, N. R. und Parkhill, J. (2007). Genetischer Fluss im Laufe der Zeit in der Salmonellen-Linie. In: Genome Biol. 8:R100. kennzahl: 10.1186/gb-2007-8-6- r100
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Wattiau, P., Boland, C. und Bertrand, S. (2011). Methoden für die Subtypisierung von Salmonella enterica ssp enterica: Goldstandards und Alternativen. Appl. ENVIRON. Microbiol. 77, 7877–7885. modell: 10.1128/AEM.05527-11
PubMed Abstract / CrossRef Full Text / Google Scholar
Wattiau, P., Van Hesche, M., Schlicker, C., Vander Veken, H. und Imberechts, H. J. (2008). Vergleich der klassischen Serotypisierung und des PremiTest-Assays zur routinemäßigen Identifizierung häufiger Salmonella enterica-Serovare. J. Clin. Microbiol. 46, 4037–4040. doi: 10.1128/JCM.01405-08
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Yachison, C. A., Yoshida, C., Robertson, J., Nash, J. H., Kruczkiewicz, P., Taboada, E. N., et al. (2017). Die Validierung und Auswirkungen der Verwendung der Sequenzierung des gesamten Genoms als Ersatz für die traditionelle Serotypisierung für ein nationales Salmonellenreferenzlabor. Front. Microbiol. 8:1044. doi: 10.3389/fmicb.2017.01044
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Yoshida, C. E., Kruczkiewicz, P., Laing, C. R., Lingohr, E. J., Gannon, VP, Nash, JH, et al. (2016). Die Salmonella in silico Typing Resource (SISTR): Ein offenes, über das Internet zugängliches Tool zur schnellen Typisierung und Subtypisierung von Salmonella-Genomassemblierungen. Plus Eins 11:e0147101. doi: 10.1371/Zeitschrift.pone.0147101
PubMed Zusammenfassung / CrossRef Volltext / Google Scholar
Zhang, S., Yin, Y., Jones, MB, Zhang, Z., Kaiser, BLD, Dinsmore, BA, et al. (2015). Bestimmung des Salmonellen-Serotyps unter Verwendung von Hochdurchsatz-Genomsequenzierungsdaten. J. Clin. Microbiol. 53, 1685–1692. doi: 10.1128/JCM.00323-15
PubMed Abstract / CrossRef Full Text / Google Scholar
Zou, Q.-H., Li, R.-Q., Liu, G.-R. und Liu, S.-L. (2016). Genotypisierung von Salmonellen mit abstammungsspezifischen Genen: Korrelation mit Serotypisierung. Int. J. Infizieren. Dis. 49, 134–140. doi: 10.1016/j.ijid.2016.05.029
PubMed Abstract / CrossRef Full Text / Google Scholar
Zou, Q.-H., Li, R.-Q., Wang, Y.-J. und Liu, S.-L. (2013). Identifizierung von Genen zur Differenzierung eng verwandter Salmonellenlinien. Plus Eins 8:e55988. doi: 10.1371/journal.pone.0055988
PubMed Abstract | CrossRef Full Text | Google Scholar