Articles

Frontiers in Microbiology

Introduction

Salmonella aiheuttaa ihmisen salmonelloosia ja lämminveristen eläinten infektioita (Kingsley and Bäumler, 2000). Salmonella-suku jaetaan kahteen lajiin, S. enterica ja S. bongori. serotyypin määrityksessä Salmonella luokitellaan edelleen yli 2600 serotyyppiin (serovaariin) antiseerumien agglutinaatioreaktiolla kolmeen pinta-antigeeniin O, H1 ja H2 (Le Minor and Bockemühl, 1984; Le Minor et al., 1990). Seroryhmän tunnistavia O-antigeenejä on 46. Yhdessä 119 H1-ja H2-flagelliini-antigeenin kanssa O -, H1-ja H2-yhdistelmät tunnistavat serovaarit. Vain pieni osa serovaareista aiheuttaa suurimman osan ihmisten Salmonellatartunnoista (Popoff et al., 2004).

serotyypin määritys antigeenisellä agglutinaatiolla korvataan molekyyliserotyypityksellä (Cai et al., 2005; Wattiau et al., 2011). Tämä voidaan saavuttaa tutkimalla O-antigeenin geeniklusterin, H1-antigeenia koodaavan geenin fliC-ja H2-antigeenia koodaavan geenin fljB-sekvenssiä (Fitzgerald et al., 2007). O antigeenigeeniklusterit voidaan eriyttää geenien läsnäololla tai puuttumisella, kun taas H1-ja H2-antigeenit erilaistuvat sekvenssivaihtelulla (McQuiston et al., 2004; Guo et al., 2013; Zhang et al., 2015). Salmonellan serotyypit voidaan päätellä myös MLST: n (Wattiau et al., 2011; Achtman ym., 2012) serotyyppinä voidaan päätellä sen sekvenssityypit. Edellytyksenä tälle lähestymistavalle on kuitenkin se, että serovarin vastaavasta suhteesta sekvenssityyppiin tarvitaan ennakkotietoa.

viime aikoina, kun koko genomisekvenssiin perustuvaa vertailua on kehitetty, useissa tutkimuksissa on tunnistettu genomimarkkereita vaihtoehtoiseksi molekyylimenetelmäksi serotyypin määritykseen. Zou ym. (2016) tunnisti seitsemän geeniä, jotka antavat riittävän erottelukyvyn erottaakseen 309 Salmonellakantaa, jotka edustavat 26 serovaaria, ja löysi serovaarispesifisiä geenejä 13: sta 26 serovaarista. Laing ym. (2017) tunnistettiin salmonellan lajeille ja alalajeille ominaisia genomifragmentteja pan-genomianalyysin avulla. Näitä erityisiä geenejä tai DNA-fragmentteja on käytetty molekyylikohteina, kun on kehitetty useita molekyylimäärityksiä salmonellan nopeaan tunnistamiseen ja osoittamiseen laji-ja serotasolla. Näiden spesifisten geenien tai DNA-fragmenttien erottelukyky on kuitenkin rajallinen, koska ne pystyvät erottamaan vain pienemmän määrän serovaareja.

tässä tutkimuksessa pyrittiin käyttämään laajaa julkisesti saatavilla olevaa salmonellan genomikokoelmaa serovarispesifisten geenimarkkereiden tunnistamiseen yleisimmille Salmonellaserovaareille. Osoitamme näiden serovarispesifisten geenimarkkereiden potentiaalin molekyyliserotyypityksen merkkiaineina joko genomitiedon silikootyypityksessä tai laboratoriodiagnostiikkamenetelmien kehittämisessä.

materiaalit ja menetelmät

ribosomaalinen MLST St-pohjainen Isolaattivalinta

Salmonellatietokanta Enterobaasissa (Alikhan et al., 2018) maaliskuusta 2018 lähtien kysyttiin ja tutkittiin 118997 isolaattia. Kunkin rst: n edustavat isolaatit valittiin ja uutettiin Python-skriptin avulla. Tutkimuksessa oli mukana vain serovaareja, joissa oli enemmän kuin neljä rst: tä. 20 suurimman serovaarin edustavia isolaatteja valittiin vain satunnaisesti rst-testeistä, joissa oli kaksi tai useampia isolaatteja. Jäljelle jääneille serovaareille valittiin satunnaisesti yksi edustava isolaatti kutakin rST: tä kohti. Raw lukee nämä isolaatit haettiin ena (European Nucleotide Archive1) ja oli de novo koottu käyttäen pata v3.10.1 assembler oletusasetukset2 (Bankevich et al., 2012). Koottujen genomien serovaarin ennusti SISTR (Yoshida et al., 2016)sen jälkeen, kun he täyttivät seuraavat kriteerit, jotka Robertson et al. (2018)käyttäen QUAST3 (Gurevitš et al., 2013): kokoonpano koko välillä 4 ja 6 Mb määrä contigs alle 500, suurin contig suurempi kuin 100 kb, GC pitoisuus välillä 50 ja 54%, geeni ennusti glimmer sisällä QUAST yli 3000. Tuloksena saatujen SISTR-serovari-ennusteiden ja Enterobase-metatietueen raportoidun serovarin välinen vastaavuus tutkittiin ja pieni määrä genomeja poistettiin analyysistä epäjohdonmukaisten serovari-ennusteiden vuoksi. Lopullisessa aineistossa oli 2258 korkealaatuista genomia, joiden serovaariennuste oli yhdenmukainen ja jotka edustivat 107 serovaaria (täydentävä taulukko S1).

salmonellan Serovarispesifisten Geenimarkkereiden tunnistaminen

mahdollisten serovarispesifisten geenimarkkereiden määrittämiseksi 107 serovarille 2258 genomia merkittiin prokan avulla (Seemann, 2014). Pan-genomi ja core-genomi analysoitiin roary (Page et al., 2015) käyttäen 80 prosentin sekvenssidentiteettikynnystä. Kullekin serovaarille ominaiset geenit tunnistettiin pan-genomin lisävarustegeeneistä sisäisellä python-kirjoituksella. Tässä tutkimuksessa tietyn serovaarin genomien lukumäärää, joka sisältää kyseisen serovaarin tietyn geenin, kutsuttiin true positiiviseksi (TP), saman serovaarin genomien lukumäärää, jolta puuttui sama geeni, kutsuttiin vääräksi negatiiviseksi (Fn). Saman serovarispesifisen geenin sisältävien muiden serovaarien genomien lukumäärää kutsuttiin false positveksi (FP). Lievennettyjä cutoffeja (20% FN, 10% FP) käytettiin aluksi sen varmistamiseksi, että kaikilla serovaareilla oli kandidaattispesifisiä geenejä, joita voitiin tutkia tarkemmin. Analyyseistä poistettiin halvaantuneet geenit.

mahdollisten Serovarispesifisten Geenimarkkereiden arviointi

F1 – pisteytystä käytettiin potentiaalisten serovarispesifisten geenimarkkereiden alustavaan valintaan. F1-pisteet arvioitiin kaavalla 2 × (PPV × herkkyys)/(PPV + herkkyys), jossa PPV määriteltiin arvoksi TP/(TP+FP) ja herkkyys arvoksi TP / (TP+FN). F1: n vaihteluväli on 0-1, jossa 1 tarkoittaa serovarispesifistä geeniä, joka esiintyi tietyn serovaarin kaikissa genomeissa ja puuttuu muiden serovaarien kaikista genomeista. Serovarispesifiset geenimerkit valittiin kullekin serovarille parhaiten suoriutuneen geenin avulla F1-pisteiden perusteella. Serovarispesifisten geenimarkkereiden todellisen negatiivisen(tn) määrän arvioinnissa käytettiin tn/(tn+FP)-spesifisyyttä. False positive rate (FPR) määriteltiin 1 – TNR: llä.

fylogeneettiset analyysit

mahdollisten serovarispesifisten geenimarkkereiden väärien negatiivisten ja FPRs: ien syiden määrittämiseksi tutkittiin kyseisten serovaarien fylogeneettisiä suhteita. 1258 isolaatin luonnoskokoonpanoja käytettiin fylogeneettisten puiden tuottamiseen käyttämällä parsnp v1. 24 (Treangen et al., 2014) oletusparametreilla fylogenian määrittämiseksi serovarien välillä ja sisällä. Puun visualisoi Figtree v1. 4. 3 (Schneider et al., 2000).

Serovarispesifisten Geenimarkkereiden

kunkin geeniominaisuuksia sisältävän serovarin edustavien kokonaisten genomien sijainti ja toiminnot ladattiin ncbi5: stä ja niitä käytettiin kunkin kandidaattiserovarispesifisen geenin sijainnin määrittämiseen blastn: llä oletusasetuksilla (versio 2.2.6, Täydentävä Taulukko S2). Niissä serovaareissa, joilla ei ollut edustavaa täydellistä genomia, valittiin edustava genomi tässä tutkimuksessa kootuista isolaateista. Serovarispesifisten geenimarkkereiden sekvenssit sisältyvät lisätietoihin S1. Geenien ryhmittelyn kautta perimän tutkittiin, olivatko serovarispesifiset geenimarkkerit mahdollisesti osa yhtä alkuainetta, jonka serovari saa yhdessä tapahtumassa. Kandidaatin serovarispesifiset geenimarkkerit katsottiin klusteriksi, jos ne sijaitsivat alle 5 kb: n päässä toisistaan.

geenimarkkereiden funktionaaliset luokat tunnistettiin rastin merkinnästä6 (Aziz et al., 2008). Prophage sekvenssit sisällä serovars viite genomit tunnistettiin käyttämällä PHASTER osoittaa, onko serovarispesifinen geenin markkereita ehkä hankittu yhdessä profages (PHAge hakutyökalun parannettu julkaisu) (Arndt et al., 2016).

silico-Serotyyppiennustuksessa serovarispesifisiä Geenimarkkereita käyttäen

Enterobaasista valittiin lisäksi 1089 isolaattia Python-kirjoituksen avulla, lukuun ottamatta 2258 isolaattia, joita käytettiin alustavaan seulontaan samasta tietokannasta maaliskuussa 2018 (täydentävä taulukko S3). BLASTN: n avulla etsittiin 106 salmonellan serovaariin kuuluvista 1089 genomista, onko niissä serovaarikohtaisia geenimarkkereita. Mukautettuja python-skriptejä käytettiin sitten ennustamaan serovari näistä serovarisista tehtävistä kunkin serovarin tunnetun geenin läsnäolomallin perusteella. TP luokiteltiin oikein annettujen serovaarien kokonaismääräksi ja tapauksiksi, joissa kutsuttiin oikeaa serovaaria sekä yhdeksi tai useammaksi FP: ksi. Epäonnistunut tehtävänanto määriteltiin, kun serovaria tai virheellisiä serovareja ei kutsuttu. Serovarisia ennusteita verrattiin Seqseroon (Zhang et al., 2015) ja SISTR-ennusteita.

Kandidaattiserovarispesifisten Geenimarkkereiden spesifisyyden laskeminen yleisille Serovareille

spesifisyyden spesifisyys yleisille serovareille (Hendriksen et al., 2011) oli yhtä suuri kuin (1 – potentiaalinen virhetaso). Serovarispesifisten geenimarkkereiden mahdollinen virhetaso, joka määritellään kaavalla: (FPs: n lukumäärä)∗(kyseisen serovarin esiintymistiheys tietyllä alueella)/(kyseisen serovarin genomien kokonaismäärä).

tulokset

ehdokkaiden Serovarispesifisten Geenimarkkereiden tunnistaminen

apugeenit 2258 genomista, jotka edustivat 107 serovaria, seulottiin mahdollisten serovarispesifisten geenimarkkereiden tunnistamiseksi. Tässä alustavassa seulonnassa tunnistettiin 354 potentiaalista serovarispesifistä geenimarkkeria 101 serovarista. Kuudella serovarilla, Bareilly, Bovismorbificans, Thompson, Reading, Typhi ja Saintpaul, ei ollut ehdokasta serovarispesifistä geenimarkkeria, joka oli läsnä kaikissa tietyn serovarin sukulinjoissa. Myös 354 ehdokkaan serovarispesifisten geenimarkkereiden spesifisyys (TNR) ja herkkyys (TPR) tutkittiin ja tiivistettiin kuvioon 1. Neljässäkymmenessä serovarissa oli 194 serovarispesifistä geenimarkkeria, joiden spesifisyys ja herkkyys olivat 100% (ei Fn: ää tai FP: tä), kun taas 31 serovarissa oli 80 kandidaattiserovarispesifistä geenimarkkeria, joiden herkkyys oli 100% mutta spesifisyys alle 100% (vaihteleva FP). Yhdeksässä serovarissa oli 27 ehdokasta serovarispesifistä geenimarkkeria, joiden spesifisyys oli 100% mutta herkkyys alle 100% (vaihteleva FN). Loput 21 serovaaria sisälsivät 53 ehdokasta serovaarispesifistä geenimarkkeria, joiden spesifisyys ja herkkyys olivat alle 100% (vaihtelivat FN ja FP).

kuva 1
www.frontiersin.org

kuva 1. 354 potentiaalisen serovarispesifisen geenimarkkerin herkkyyden ja spesifisyyden jakautuminen. TPR, todellinen positiivinen korko; FPR, väärä positiivinen korko. Jossa näytetään kaltevuus vaaleansinisestä (pieni prosenttiosuus) tummansiniseen (suuri prosenttiosuus).

rakensimme fylogeneettisen puun käyttäen 1258 edustavaa isolaattia 107 serovaarista käyttäen palsternakkaa (täydentävä Kuva S1). 1258 isolaattia valittiin ensimmäisten 2258 isolaatin fylogeneettisten suhteiden perusteella, joista valitsimme isolaatit edustamaan jokaista itsenäistä sukua. Havaitsimme, että kunkin 82 serovaarin jäsenet muodostivat monofyleettisen sukulinjan, kun taas 24 serovaaria oli polyfyleettisiä, ja jokainen niistä koostui 2-4 sukulinjasta. Useat näistä serovaareista tunnetaan polyfyleettisinä, eivätkä ne todennäköisesti sisällä serovaarispesifisiä geenimarkkereita (Falush et al., 2006; den Bakker ym., 2011; Achtman ym., 2012; Timme et al., 2013). Serovar Enteritidis on parafyleettinen, jossa on kolme muuta serovaaria (Dublin, Berta ja Gallinarium), jotka ovat peräisin suuremmasta Enteritidis-kladista, joka itse koostuu kolmesta sukulinjasta, jotka tunnetaan nimellä clade A, B ja C (Graham et al., 2018). Viisi Enteritidis – spesifistä kandidaattigeenin markkeria olivat negatiivisia Enteritidis-isolaateille, jotka ryhmittyivät erikseen puuhun.

neljällä polyfyleettisellä serovaarilla, Bredeney, Kottbus, Livingstone ja Virchow, oli kullakin yksi kandidaattiserovaarispesifinen geeni, joka oli kyseisen serovaarin kaikissa isolaateissa. Jäljelle jääneille 20 polyfyleettiselle serovaarille ja parafyleettiselle Serovaarille Enteritidikselle etsimme perimäkohtaisia geenimarkkereita, sillä jokainen serovaari sisälsi enemmän kuin yhden perimän. Jos kaikki sukusolut sisälsivät vähintään yhden sukusidonnaisen geenin, katsomme, että kyseinen serovari sisältää serovarispesifisiä geenimarkkereita. 19 polyfyleettiselle serovaarille ja parafyleettiselle Enteritidis-Serovaarille tunnistettiin yhteensä 111 potentiaalista geenimarkkeria, joista 27 geenimarkkeria tunnistettiin 5 serovaarille, joiden spesifisyys ja herkkyys oli 100% (ei Fn: ää ja FP: tä), 76 kandidaattimerkkimerkkiä14 serovaarille, joiden herkkyys oli 100% ja spesifisyys alle 100% (vaihteleva FP), ja Enteritidis, joka sisälsi 6 kandidaattimerkkimerkkiägeenin markkeria, joilla oli vaihteleva FN ja FP (taulukko 1).

taulukko 1
www.frontiersin.org

Taulukko 1. Polyfyleettisten serovaarien ja parafyleettisten serovaarien geenimarkkerit.

11 niistä 82 monofyleettisestä serovaarista, joilta puuttui serovaarispesifisiä kandidaattigeenin markkereita FN: n takia, huomasimme, että FN johtui usein isolaateista, jotka ovat ryhmittyneet yhteen haaraan ja erkaantuneet aiemmin muista isolaateista. Tällaisille ryhmille etsimme perimäkohtaisia geenimarkkereita. Tämän vuoksi serovaarin tunnistamiseen voidaan käyttää kahta tai useampaa geenimerkkiainetta, ja tällaisten serovaarien katsottiin myös sisältävän polyfyleettisten serovaarien tapaan serovaarispesifisiä geenimarkkereita. Kolme serovaaria, Paratyphi A, Heidelberg ja Muenchen, voitiin tunnistaa yhdistettyjen perimäkohtaisten geenimarkkereiden avulla.

täydentävään taulukkoon S2 on koottu yhteensä 414 ehdokasta serovarispesifistä geenimerkkiainetta, mukaan lukien 295 serovarispesifistä geenimerkkiainetta ja 119 sukuryhmäkohtaista geenimerkkiainetta. Kaikkiaan 106 serovaaria 107: stä sisälsi yhden tai useamman geenimerkin, 33 serovaaria yhden tietyn geenin ja 73 kahta tai useampaa geenimarkkeria. Monofyleettiselle Typhille ei löytynyt ehdokasta serovarispesifistä geenimerkkiainetta eikä Stanleyvillen sukujuurelle III löydettyä potentiaalista sukujuurta, joka sisälsi vain yhden isolaatin.

Serovarispesifisten Geenimarkkereiden funktionaaliset luokat

kaikkien 106 serovaarille rastilla tunnistettujen 414 geenimarkkerin funktionaalinen karakterisointi havaitsi, että 197: llä oli tunnetut funktiot ja 217 koodatulla hypoteettisella proteiinilla tuntemattomat funktiot. Vain 46 geeniä, joissa on merkintöjä, voidaan ryhmitellä funktionaalisiin luokkiin, kun taas 151 funktionaalista geeniä ei kuulunut RAST-funktionaalisiin kategorioihin (Taulukko 2). PHASTERIN avulla. 45 ehdokasta serovarispesifistä geenimarkkeria sijaitsi ennustetuissa ennusteissa.

taulukko 2
www.frontiersin.org

Taulukko 2. Serovarispesifiset geenit funktionaaliset luokat.

monille serovareille tunnistettiin minimaalinen joukko Serovarispesifisiä Geenimarkkereita in silico-Molekyyliserotyypin määritystä varten

, useita kandidaattiserovarispesifisiä geenimarkkereita tai sukusidoskohtaisia geenimarkkereita. Näissä tapauksissa valittiin yksi geeni, jolla on alhaisimmat FN-ja FP-asteet. Vähintään 131 geenimerkkiaineen avulla voidaan tunnistaa serovaarit, joiden virhetaso on 0-8, 33%. Geenin merkkiaineiden jakautuminen kaikkiin 106 serovaariin osoittaa suurta spesifisyyttä, kuten kuvassa 2 esitetään, jossa diagonaalissa näkyy serovaarin tai sukulinjan suhde serovaarispesifisiin geenimarkkereihin, kun taas off-diagonaaliavaruudessa näitä geenejä esiintyy harvakseltaan muissa serovaareissa, joiden prosentuaaliset osuudet ovat vaihtelevia, mikä osoittaa alhaista FPR: ää. Näiden geenimarkkereiden yksityiskohdat on lueteltu täydentävässä taulukossa S4. Kaiken kaikkiaan 45 serovaaria voidaan erottaa niiden serovaarispesifisen geenin perusteella ja 61 serovaaria voidaan erottaa geenimarkkereiden yhdistelmällä.

kuva 2
www.frontiersin.org

kuva 2. Minimaalisen joukon 131 serovarispesifistä geeniä jakautuminen 106 serovaariin. Y-akselilla on serovarisia tai sukusidonnaisia geenimarkkereita ja X-akselilla serovareja eli-sukuisia. Tiedot on lueteltu täydentävässä taulukossa S4. Gray osoitti Nollaa genomia, jotka sisälsivät geenin (TN). Diagonaalia pitkin kulkevat geeni / Genomiparit edustavat genomeja, jotka sisältävät serovarispesifiset geenimarkkerit, jotka vastaavat niiden serovaria (TP). Punainen edustaa geenejä, joita on 100% genomeista tietyn serovaarin tai sukulinjan osalta. Jos geeni on alle 100% serovarista, näytetään gradientti vaaleansinisestä (pieni prosentti) tummansiniseen (suuri prosentti). Diagonaalia pitkin kulkevat siniset parit edustavat FN: n läsnäoloa. Pareja, jotka ovat diagonaalin ulkopuolella sinisiä tai punaisia, edustavat pareja, jotka sisältävät geenejä, jotka eivät vastaa genomin ennustettua serovaria (FP).

testasimme lisäksi 1089 genomia, jotka kuuluvat 106 ei-typhoidiseen Salmonella-serovaariin, arvioidaksemme 131 spesifisen geenimarkkerin kykyä määrittää serovaarit oikein isolaateille. Serovarispesifisten geenimarkkereiden avulla 1089 isolaatista 1038 (95, 3%) onnistuttiin määrittämään ja 51 (4, 7%) epäonnistui. Sistr: n ja Seqseron osalta konkordanttien serovarien määrä oli 1037 (95%) ja 905 (82,8%) (täydentävä taulukko S3).

Serovarispesifiset Geenimarkkerit yleisten serovaarien serotyypin määritykseen

20 suurinta ihmisen infektiota aiheuttavaa serovaaria, joita on löydetty kustakin mantereesta (Hendriksen et al., 2011) romahtivat 46 serovaarin yhdistelmälistalle (täydentävä taulukko S5). Koska nämä serovaarit sisälsivät valtaosan ihmisen infektioita aiheuttavista isolaateista maailmanlaajuisesti, harkitsemme niitä erikseen arvioidaksemme ehdokkaiden serovaarispesifisten geenimarkkereiden hyödyllisyyttä yleisimpien serovaarien serotyypityksessä paikallisessa ympäristössä. Kun tarkasteltiin vain näitä serovareja, 18 46: sta voitiin tunnistaa yksilöllisesti jollakin serovarispesifisellä geenimarkkerilla. Lisätäksemme kirjoitustarkkuutta jäljellä olevissa 28 yleisessä serovarissa, joissa serovarispesifiset geenimarkkerit ovat vaihdelleet FPRs: ää, tutkimme käyttäen 131 geenimarkkerin osajoukkoja (2-9 geeniä per serovari) mahdollisten FP: n poistamiseksi. Esimerkiksi koleraesuis-spesifisen geenin ja Cerro-I-geenispesifisen geenin yhdistelmä voi eliminoida Cerron väärän positiivisen isolaatin Koleraesuisista, jos molemmat geenit ovat positiivisia, isolaatille voidaan antaa Cerro, kun taas jos Cerro-I-geenispesifinen geeni on negatiivinen, isolaatti on Koleraesuis.

arvioidaksemme mahdollisia kirjoitusvirheitä otimme huomioon 46 yleisen serovaarin esiintymistiheyden, joka osoitti suuria eroja alueiden välillä (Hendriksen ym., 2011). Sen vuoksi eri geeniyhdistelmiä voidaan käyttää erityisesti kyseisellä alueella esiintyvien serovaarien väärien positiivisten tulosten rajoittamiseen. Tietyllä alueella yhteisten kandidaattiserovarispesifisten geenimarkkereiden spesifisyys laskettiin FP: n määrän ja väärien positiivisten serovaarien esiintymistiheyden perusteella kyseisellä alueella. Ehdokkaan serovarispesifisten geenimarkkereiden spesifisyys laskettiin myös FP-kertoimella (täydentävä taulukko S4). Esimerkiksi Australian 10 yleisintä serovaaria voidaan kirjoittaa 15 geenistä koostuvalla paneelilla (NEPSS 2010) (Taulukko 3). Kun Australian alueelliset frekvenssit otetaan huomioon, taulukossa 3 lueteltuja geenejä voidaan käyttää merkkiaineina laboratoriopohjaisessa tyypityksessä ja virhetaso on alle 2,4%.

taulukko 3
www.frontiersin.org

Taulukko 3. Paneeli serovarispesifisiä geenejä kymmenen yleisimmän serovaarin kirjoittamiseen Australiassa.

Keskustelu

salmonellan serotyypin määritys on ollut elintärkeää diagnoosin ja seurannan kannalta. Serovarista ennustamista perinteisellä serotyypityksellä voi rajoittaa pinta-antigeeniekspression tai autoagglutinaatio-ominaisuuksien puuttuminen (Wattiau et al., 2008). Viime aikoina koko genomin sekvensointiteknologian kehittymisen myötä RFB-geeniklusterin asiaankuuluvat genomialueet O-antigeenille, geeni fliC ja geeni fljB h-antigeeneille sekä mlst: n kohteena olevat geenit voidaan erottaa ja käyttää serovariseen tunnistamiseen. Useissa tutkimuksissa on tunnistettu serovarispesifisiä geenejä tai DNA-fragmentteja serotyypin määritystä varten koko genomin sekvensointiin perustuvalla genomivertailulla (Zou et al., 2013, 2016; Laing et al., 2017). Nämä serovarispesifiset geenit tai DNA-fragmentit erottivat kuitenkin vain pienen määrän serovareja. Tässä tutkimuksessa tunnistimme 414 ehdokasta serovarispesifistä tai sukusidoskohtaista geenimarkkeria 106 serovaarille, joihin kuuluu 24 polyfyleettistä serovaaria ja parafyleettistä serovaaria Enteritidis. Osa näistä geenimarkkereista validoitiin riippumattomilla genomeilla, ja 95,3%: ssa tapauksista serovaarit pystyttiin osoittamaan oikein.

edellä olevaa analyysia hankaloitti polyfyleettisten serovaarien esiintyminen, jotka syntyvät toisistaan riippumatta erillisistä esivanhemmista muodostaen erillisiä sukulinjoja. Tämän vuoksi useimpien polyfyleettisten serovaarien selvään tunnistamiseen tarvittiin yhdistelmä perimälle spesifisiä geenimarkkereita. Mielenkiintoisesti neljä polyfyleettistä serovaaria, Bredeney, Kottbus, Livingstone ja Virchow, jokaisella oli yksi ehdokas serovaarispesifinen geenimarkkeri, joka oli läsnä kaikissa kyseisen serovaarin isolaateissa. Bredeneyn serovaarispesifisen geenin ennustettiin koodaavan O-antigeenin konversioon osallistuvaa translokaasia, ja se olisi voitu saada rinnakkain. Kolmen muun polyfyleettisen serovaarin serovarispesifiset geenit koodaavat hypoteettisia proteiineja, joiden tehtävä on tuntematon eikä niiden esiintymiselle saman serovaarin eri sukulinjoissa ole selvää selitystä.

toisin kuin polyfyleettiset Serovaarit, parafyleettisen Enteritidiksen kolmella sukulinjalla (kladi A, B ja C) on tuore yhteinen kantamuoto. Clade A ja C ovat esi-isiä Clade B: lle.aiemmat tutkimukset kuvasivat, että Enteritidis oli ryhmittynyt serovarseihin Dublin, Berta ja Gallinarium, jota kutsuttiin nimellä ”Section Enteritidis” (Vernikos et al., 2007; Achtman et al., 2012; Allard et al., 2013; Timme et al., 2013). Toinen tutkimus osoitti, että Serovarinitra upotettiin Enteritidis-sukuhaaraan käyttämällä koko genomin fylogeniaa (Deng et al., 2014). Myös Enteritidiksen ja Nitran välillä oli Ogunremin tutkimuksen (Ogunremi et al., 2017). Tutkimuksessamme valitsimme isolaatit rst: iden perusteella, Nitra ei ollut Enterobase rMLST-tietokannassa tutkimuksen alkaessa, joten sitä ei sisällytetty tähän tutkimukseen. Gallinarium on erotettavissa Enteritidiksestä käyttämällä 4 bp: n deleetiota speC-geenissä (Kang et al., 2011). Havaitsimme, että Dublinin, Bertan ja Gallinariumin yhteiset esi-isät syntyivät Clades B: n ja A/C: n välisestä esi-isästä.vaikka Dublin voidaan tunnistaa erikseen, Emme voi erottaa Bertaa tai Gallinariumia Enteritidis clade A/C: stä. nämä tulokset korostavat lähestymistavan rajoittamista, koska serovarien on oltava riittävän erilaisia, että ne eroavat toisistaan vähintään yhden ainutlaatuisen geenin avulla. Samoin oli 8 muuta serovaaria, jotka eivät olleet erotettavissa todennäköisesti hyvin viimeaikaisten jaettujen kantojen vuoksi, joilla oli vain vähän geeninhankintaa.

Serovarispesifiset kandidaattigeenin markkerit tai sukusidoskohtaiset kandidaattigeenin markkerit 69: llä 106: sta serovaarista olivat genomissa vierekkäisiä ja samankaltaiset toiminnot ryhmiteltyinä yhteen (tietoja ei näy). Tämä viittaa siihen, että nämä geenimarkkerit ovat saattaneet liittyä serovarisiin genomeihin yhdessä horisontaalisen geeninsiirron kautta. Itse asiassa seitsemän Typhimurium spesifinen ehdokas geenin markkereita tunnistettu tässä tutkimuksessa (STM4492, STM4493, STM4494, STM4495, STM4496, STM4497, ja STM4498) sijaitsivat Typhimurium tRNAleuX integroimalla konjugatiivinen Elementti liittyvä alue mukaan lukien geenit stm4488 ja STM4498, joka on tunnettu horisontaalinen geenin siirto hotspot (Bishop et al., 2005). Vastaavasti tunnistetut viisi Enteritidis-spesifistä kandidaattigeenin markkeria (SEN1379, Sen1380, SEN1382, SEN1383 ja sen1383) sijaitsivat Sdr I-alueella (Agron et al., 2001) ja profagea muistuttava gei/φSE14-alue (Santiviago et al., 2010). Molemmat alueet liittyvät profetioihin, mikä viittaa siihen, että nämä alueet integroituivat globaalin Enteritidis-kladin yhteisen esi-isän genomiin ja olivat peräisin horisontaalisesta geeninsiirrosta.

muita in silico-serovarin ennustusmenetelmiä käytetään seqserossa (Zhang et al., 2015)ja SISTR (Yoshida et al., 2016). Molemmissa menetelmissä tutkitaan genomialueita, jotka vastaavat pinta-antigeeneistä, kun taas SISTR toteuttaa myös cgMLST-järjestelmän tutkiakseen yleistä geneettistä relatedenssia. Lisäksi siitä johdettuja perinteisiä 7 geenin mlst-ja eBURST-ryhmiä voidaan käyttää myös silico-serovarin määritykseen (Achtman et al., 2012; Ashton et al., 2016; Robertson ym., 2018). Sekä SISTR että SeqSero tarjoavat suuremman syrjivän voiman kuin perinteinen serovaritunnistus (Yachison et al., 2017). Niillä on kuitenkin useita haittoja, kuten erottamattomat serovaarit, joilla on sama antigeeninen kaava tai antigeeniset taustatekijät, joita ei ilmaista (Robertson et al., 2018). Tässä tutkimuksessa tarkastelimme silico-serovari-ennustetta seulomalla genomeja 131 serovarispesifisen geenimarkkerin joukosta. Lähestymistapa tarjosi serovarista ennustetta tuottamalla yksittäisen serovarispesifisen geenimarkkerin” läsnäolon tai puuttumisen ” tai geenimarkkerien yhdistelmän kyselyeristeessä. Osoitamme, että serovarispesifisten geenimarkkereiden tarkkuus on verrattavissa muihin in silico-serotyypin määritysmenetelmiin, joissa 91,5% isolaatteja on alustavasta tunnistusaineistosta ja 84,8% isolaatteja validointiaineistosta, joka on osoitettu oikealle serovarille (ilman FN: tä ja FP: tä). 10.5% validointitiedoista saaduista isolaateista voidaan osoittaa pieneen serovarien osajoukkoon, joka sisältää oikean serovarin (vaihtelevalla FP: llä). Spesifisyys in silico serovar prediction-lähestymistavalle serovarispesifisillä geenimarkkereilla oli 95,3%, hieman korkeampi kuin SISTR (95%) ja SeqSero (82,8%) samassa testaamassamme aineistossa. Tämä tulos oli samanlainen erityispiirteet SISTR ja SeqSero raportoitu Yachison et al. (2017), jotka olivat 94,8% ja 88,2%.

serovarispesifinen geenimarkkeripohjainen menetelmämme ei vaadi O-antigeenigeeniklusterien tarkkaa tutkimista tai H-antigeenien sekvenssivaihtelua, joka voi olla ongelmallista. Menetelmämme helpottaa myös tarvetta koota koko geeni-tai genomisekvenssi, joka on tarpeen MLST-tai cgMLST-pohjaisilla menetelmillä. Tästä syystä tämä lähestymistapa voi olla hyödyllinen tapauksissa, joissa sekvenssiä on hyvin vähän, kuten metagenomiikassa tai kulttuurin vapaassa tyypityksessä, ja se tarjoaa kolmannen vaihtoehdon muiden analyysien vahvistamiseen.

sellaisten geenimarkkereiden tunnistaminen, jotka pystyvät yksilöimään kaikki alueella vallitsevat serovaarit, voi olla hyödyllistä myös kehitysmolekyylimäärityksissä. Nämä määritykset olisivat hyödyllisiä isolaattien serotyypin määrityksessä, jos viljelmiä ei enää saada ja perinteinen serotyypin määritys on sen vuoksi mahdotonta. Voitaisiin esimerkiksi suunnitella PCR-määritysten sarja, joka mahdollistaisi tiettyjen geenimarkkereiden herkän havaitsemisen ja siten serovaarin ennustamisen kliinisestä näytteestä. Lisäksi poistamalla tarpeen havaita serovaarit, joita havaitaan alueella hyvin harvoin, näiden geenimarkkereiden määrää, joka tarvitaan kaikkien alueen tärkeimpien serovaarien havaitsemiseen, voidaan vähentää merkittävästi, mikä mahdollistaa kustannustehokkaamman määrityksen.

johtopäätös

tässä tutkimuksessa tunnistimme 106 serovaria koskevat kandidaattiserovaarispesifiset geenimarkkerit ja ehdokasseroviinispesifiset geenimarkkerit luonnehtimalla edustavan valikoiman 2258: aa kantaa edustavia liitännäisgenomeja potentiaalisiksi merkkiaineiksi silico-serotyypin määritystä varten. Otamme huomioon polyfyleettiset ja parafyleettiset serovarit tarjotaksemme uuden menetelmän, käyttäen näiden geenimarkkereiden läsnäoloa tai puuttumista, ennustaaksemme isolaatin serovarin genomitiedoista. Tässä tunnistettuja geenimarkkereita voidaan käyttää myös serotyypin määritysten kehittämiseen eristetyn kannan puuttuessa, mikä on hyödyllistä, kun diagnoosi siirtyy viljelmistä riippumattomiin ja metagenomisiin menetelmiin.

Tekijäosuudet

MP ja RL suunnittelivat tutkimuksen ja toimittivat käsikirjoituksen kriittisen tarkistuksen. XZ ja MP suorittivat bioinformaattisen analyysin. XZ, MP ja RL analysoivat tulokset. XZ laati käsikirjoituksen.

Rahoitus

tälle työlle myönnettiin National Health and Medical Research Councilin hankeapuraha.

Eturistiriitalausunto

kirjoittajat toteavat, että tutkimus tehtiin ilman kaupallisia tai taloudellisia suhteita, joita voitaisiin pitää mahdollisena eturistiriitana.

lisäaineisto

tämän artikkelin lisäaineisto löytyy verkosta osoitteesta: https://www.frontiersin.org/articles/10.3389/fmicb.2019.00835/full#supplementary-material

kuva s1 | ParSNP: n rakentama SNP-pohjainen fylogeneettinen puu, joka osoittaa serovaarien sisäiset ja väliset evolutiiviset suhteet käyttäen 1344 edustavaa isolaattia, mukaan lukien 1258 isolaattia tutkimuksessa tutkituista 107 serovaarista ja 86 isolaattia serovaareista, joissa oli alle 5 rst: tä ja jotka muuten jätettiin tutkimuksen ulkopuolelle.

taulukko S1 / lopullinen tietojoukko 2258 korkealaatuisesta ja johdonmukaisesta serovarisesta ennustusgenomista, jotka edustavat 107 serovaria.

taulukko S2 / yhteensä 414 ehdokasta serovarispesifistä geeniä, joista 295 serovarispesifistä geeniä ja 119 sukuspesifistä geeniä.

taulukko S3 / lisäksi 1089 validointisolaattia, joilla on sistr -, SeqSero-ja serovarispesifisten geenimarkkereiden serovarisia ennustetuloksia.

taulukko S4 / vähintään 131 geeniä 106 serovaarin tunnistamiseksi.

taulukko S5 / 65 geenin joukko 46 yleisen serovaarin tunnistamiseksi.

DATA S1 / sekvenssit 131 serovarispesifisestä geenimarkkerista.

lyhenne

Fn, vääriä negatiivisia; FP, vääriä positiivisia; FPR, vääriä positiivisia; MLST, multi-locus sequence typing; NEPSS, National Enteric Patogeens Surveillance Scheme; PPV, positive predictive value; rSTs, ribosomal MLST STs; SISTR, Salmonella in silico typing resource; TN, true negatives; TNR, true negative rate; TP, true positives; TPR, true positives.

Footnotes

  1. ^ https://www.ebi.ac.uk/ena
  2. ^ http://bioinf.spbau.ru/spades
  3. ^ http://bioinf.spbau.ru/quast
  4. ^ http://github.com/marbl/harvest
  5. ^ https://www.ncbi.nlm.nih.gov/
  6. ^ http://rast.theseed.org/FIG/rast.cgi

Achtman, M., Wain, J., Weill, F.-X., Nair, S., Zhou, Z., Sangal, V., et al. (2012). Multilocus sequence typing as a replacement for serotyping in Salmonella enterica. PLoS Pathog. 8:e1002776. doi: 10.1371/journal.ppat.1002776

PubMed Abstract | CrossRef Full Text | Google Scholar

Agron, P. G., Walker, R. L., Kinde, H., Sawyer, S. J., Hayes, D. C., Wollard, J., et al. (2001). Identification by subtractive hybridization of sequences specific for Salmonella enterica serovar Enteritidis. Appl. Environ. Microbiol. 67, 4984–4991. doi: 10.1128/AEM.67.11.4984-4991.2001

PubMed Abstract | CrossRef Full Text | Google Scholar

Alikhan, N.-F., Zhou, Z., Sergeant, M. J., and Achtman, M. (2018). A genomic overview of the population structure of Salmonella. PLoS Genet. 14: e1007261. doi: 10.1371 / lehti.pgen.1007261

PubMed Abstract / CrossRef Full Text/Google Scholar

Allard, M. W., Luo, Y., Strain, E., Pettengill, J., Timme, R., Wang, C., et al. (2013). On the evolutionary history, populaatiogenetics and diversity among isolates of Salmonella Enteritidis Pfge pattern JEGX01. 0004. PLoS yksi 8: e55254. doi: 10.1371 / lehti.pone.0055254

PubMed Abstract | CrossRef Full Text/Google Scholar

Arndt, D., Grant, J. R., Marcu, A., Sajed, T., Pon, A., Liang, Y., et al. (2016). PHASTER: parempi ja nopeampi versio PHAST phage-hakutyökalusta. Nukleiinihapot Res. 44, W16–W21. doi: 10.1093/Nar | gkw387

PubMed Abstract/CrossRef Full Text/Google Scholar

Ashton, P. M., Nair, S., Peters, T. M., Bale, J. A., Powell, D. G., Painset, A., et al. (2016). Salmonellan tunnistaminen kansanterveyden seurantaa varten käyttäen koko genomin sekvensointia. PeerJ 4: e1752. doi: 10.7717 / peerj.1752

PubMed Abstract | CrossRef Full Text/Google Scholar

Aziz, R. K., Bartels, D., Best, A. A., DeJongh, M., Disz, T., Edwards, R. A., et al. (2008). RAST-palvelin: pikahuomautukset alijärjestelmätekniikalla. BMC Genomics 9: 75. doi: 10.1186 / 1471-2164-9-75

PubMed Abstract / CrossRef Full Text/Google Scholar

Bankevich, A., Nurk, S., Antipov, D., Gurevitš, A. A., Dvorkin, M., Kulikov, A. S., et al. (2012). SPAdes: Uusi genomin assembly algoritmi ja sen sovelluksia yksisoluinen sekvensointi. J. Computat. Biol. 19, 455–477. doi: 10.1089 / cmb.2012.0021

PubMed Abstract / CrossRef Full Text/Google Scholar

Bishop, A. L., Baker, S., Jenks, S., Fookes, M., Gaora, P. Ó, Pickard, D., et al. (2005). Trnaleuxiin liittyvän Salmonella enterica-genomin hypervariable-alueen analyysi. J. Bakterioli. 187, 2469–2482. doi: 10.1128 / JB.187.7.2469-2482.2005

PubMed Abstract | CrossRef Full Text | Google Scholar

Cai, H., Lu, L., Muckle, C., Prescott, J., and Chen, S. (2005). Development of a novel protein microarray method for serotyping Salmonella enterica strains. J. Clin. Microbiol. 43, 3427–3430. doi: 10.1128/JCM.43.7.3427-3430.2005

PubMed Abstract | CrossRef Full Text | Google Scholar

den Bakker, H. C., Switt, A. I. M., Govoni, G., Cummings, C. A., Ranieri, M. L., Degoricija, L., et al. (2011). Genomin sekvensointi paljastaa virulenssitekijän sisällön monipuolistumisen ja mahdollisen isännän sopeutumisen Salmonella enterican erillisissä alapopulaatioissa. BMC Genomics 12: 425. doi: 10.1186 / 1471-2164-12-425

PubMed Abstract | CrossRef Full Text/Google Scholar

Deng, X., Desai, P. T., den Bakker, H. C., Mikoleit, M., Tolar, B., Trees, E., et al. (2014). Salmonella enterican serotyypin Enteritidin genomiepidemiologia perustuu vallitsevien sukujen väestörakenteeseen. Emerg. Tartuttaa. Tämä. 20, 1481–1489. doi: 10.3201 / eid2009.131095

PubMed Abstract | CrossRef Full Text | Google Scholar

Falush, D., Torpdahl, M., Didelot, X., Conrad, D. F., Wilson, D. J., and Achtman, M. (2006). Mismatch induced speciation in Salmonella: model and data. Philos. Trans. R. Soc. Lond. B Biol. Sci. 361, 2045–2053. doi: 10.1098/rstb.2006.1925

PubMed Abstract | CrossRef Full Text | Google Scholar

Fitzgerald, C., Collins, M., van Duyne, S., Mikoleit, M., Brown, T., and Fields, P. (2007). Multiplex, helmi-pohjainen suspensio array molecular determination of common Salmonella seroryhmät. J. Clin. Mikrobiolia. 45, 3323–3334. doi: 10.1128 / JCM.00025-07

PubMed Abstract | CrossRef Full Text/Google Scholar

Graham, R. M., Hiley, L., Rathnayake, I. U., and Jennison, A. V. (2018). Vertaileva genomiikka tunnistaa S. Enteritidiksen eri sukuja Queenslandista Australiasta. PLoS One 13: e0191042. doi: 10.1371 / lehti.pone.0191042

PubMed Abstract | CrossRef Full Text/Google Scholar

Guo, D., Liu, B., Liu, F., Cao, B., Chen, M., Hao, X., et al. (2013). Kehitetään DNA-mikroarray Kaikkien 46 Salmonella O-seroryhmän molekyylitason tunnistamiseksi. AEM 79, 3392-3399. doi: 10.1128 / AEM.00225-13

PubMed Abstract | CrossRef Full Text/Google Scholar

Gurevitš, A., Saveliev, V., Vyahhi, N., and Tesler, G. (2013). QUAST: genomikokoonpanojen laadun arviointityökalu. Bioinformatiikka 29, 1072-1075. doi: 10.1093 / bioinformatics/btt086

PubMed Abstract | CrossRef Full Text/Google Scholar

Hendriksen, R. S., Vieira, A. R., Karlsmose, S., Lo, Fo Wong, D. M., Jensen, A. B., et al. (2011). Maailman terveysjärjestön global monitoring of Salmonella serovar distribution from the world health organization global foodborne infections network country data bank: results of quality assured laboratories from 2001 to 2007. Ravintopatogi. Tämä. 8, 887–900. doi: 10.1089 / fpd.2010.0787

PubMed Abstract | CrossRef Full Text/Google Scholar

Kang, M.-S., Kwon, Y.-K., Jung, B.-Y., Kim, A., Lee, K.-M., An, B.-K., et al. (2011). Salmonella enterica subsp: n tunnistusero. enterica serovar Gallinarum biovarit Gallinarum ja Pullorum perustuvat glgc-ja speC-geenien polymorfisiin alueisiin. Eläinlääkäri. Mikrobiolia. 147, 181–185. doi: 10.1016 / J.vetmic.2010.05.039

PubMed Abstract | CrossRef Full Text/Google Scholar

Kingsley, R. A., and bäumler, A. J. (2000). Host adaptation and the emergence of infectious disease: The Salmonella paradigm. Mol. Mikrobiolia. 36, 1006–1014. doi: 10.1046 / j.1365-2958.2000. 01907.x

PubMed Abstract | CrossRef Full Text/Google Scholar

Laing, C. R., Whiteside, M. D., and Gannon, V. P. (2017). Salmonella enterica-lajin Pan-genomianalyysit ja lajeille, alalajeille ja serovareille ennakoivien genomimarkkereiden tunnistaminen. Edessä. Mikrobiolia. 8:1345. doi: 10.3389 / fmicb.2017.01345

PubMed Abstract / CrossRef Full Text/Google Scholar

Le Minor, L., and Bockemühl, J. (1984). Supplément no XXVII au schéma de Kauffmann-White. Ann. Institut Pasteur Microbiol. 135, 45-51. doi: 10.1016/S0769-2609(84)80042-3

CrossRef Full Text | Google Scholar

Le Minor, L., Popoff, M., and Bockemühl, J. (1990). Täydennys 1989 (n° 33) Kauffmann-White-järjestelmään. Res. Microbiol. 141, 1173-1177. doi: 10.1016/0923-2508(90)90090-d

CrossRef Full Text | Google Scholar

McQuiston, J., Parrenas, R., Ortiz-Rivera, M., Gheesling, L., Brenner, F., and Fields, P. I. (2004). Salmonellan Flic -, fljB-ja flpA-geenien sekvensointi ja vertaileva analyysi. J. Clin. Mikrobiolia. 42, 1923–1932. doi: 10.1128 / JCM.42.5.1923-1932.2004

PubMed Abstract | CrossRef Full Text | Google Scholar

Ogunremi, D., Nadin-Davis, S., Dupras, A. A., Márquez, I. G., Omidi, K., Pope, L., et al. (2017). Multiplex PCR-määrityksen arviointi Salmonella-serovarien enteritidis ja typhimurium tunnistamiseksi Vähittäismyynti-ja teurastamonäytteiden avulla. J. Food Prot. 80, 295–301. doi: 10.4315/0362-028X.JFP-16-167

PubMed Abstract | CrossRef Full Text | Google Scholar

Page, A. J., Cummins, C. A., Hunt, M., Wong, V. K., Reuter, S., Holden, M. T., et al. (2015). Roary: nopea laajamittainen prokaryote pan genomianalyysi. Bioinformatiikka 31, 3691-3693. doi: 10.1093/bioinformatics/btv421

PubMed Abstract | CrossRef Full Text | Google Scholar

Popoff, M. Y., Bockemühl, J., and Gheesling, L. L. (2004). Supplement 2002 (no. 46) to the Kauffmann–White scheme. Res. Microbiol. 155, 568–570. doi: 10.1016/j.resmic.2004.04.005

PubMed Abstract | CrossRef Full Text | Google Scholar

Robertson, J., Yoshida, C., Kruczkiewicz, P., Nadon, C., Nichani, A., Taboada, E. N., et al. (2018). Salmonellan koko genomin sekvenssitietojen laadun kattava arviointi julkisissa sekvenssitietokannoissa käyttäen Salmonella in silico typing resourcea (Sistr). Mikrobi. Genomiikka doi: 10.1099 / mgen.0.000151 .

PubMed Abstract | CrossRef Full Text/Google Scholar

Santiviago, C. A., Blondel, C. J., Quezada, C. P., Silva, C. A., Tobar, P. M., Porwollik, S., et al. (2010). Salmonella enterica serovar Enteritidis-spesifisen viallisen profagea muistuttavan elementin φSE14 spontaani poisto. J. Bakterioli. 192, 2246–2254. doi: 10.1128 / JB.00270-09

PubMed Abstract | CrossRef Full Text | Google Scholar

Schneider, S., Roessli, D., and Excoffier, L. J. U. (2000). Arlequin: A Software for Population Genetics Data Analysis, Vol. 2. Geneva: Genetic and Biomedical Laboratory, 2496–2497.

Google Scholar

Seemann, T. (2014). Prokka: rapid prokaryotic genome annotation. Bioinformatics 30, 2068–2069. doi: 10.1093 / bioinformatics / btu153

PubMed Abstract | CrossRef Full Text/Google Scholar

Timme, R. E., Pettengill, J. B., Allard, M. W., Strain, E., Barrangou, R., Wehnes, C., et al. (2013). Enteropatogeenin Salmonella enterica subsp fylogeneettinen monimuotoisuus. enterica pääteltiin genomin laajuisista viittaamattomista SNP-merkeistä. Genomibiolia. Evol. 5, 2109–2123. doi: 10.1093 / GbE/evt159

PubMed Abstract | CrossRef Full Text/Google Scholar

Treangen, T. J., Ondov, B. D., Koren, S., and Phillippy, A. M. (2014). Harvest suite nopeaan ydin-genomin yhdenmukaistamiseen ja visualisointiin tuhansille intraspecific microbial genomes. Genomibiolia. 15:524. doi: 10.1186 / s13059-014-0524-x

PubMed Abstract | CrossRef Full Text/Google Scholar

Vernikos, G. S., Thomson, N. R., and Parkhill, J. (2007). Geneettinen muutos salmonellan suvussa. Genomibiolia. 8: 100. doi: 10.1186 / gb-2007-8-6-r100

PubMed Abstract | CrossRef Full Text/Google Scholar

Wattiau, P., Boland, C., and Bertrand, S. (2011). Methodologies for Salmonella enterica ssp enterica subtyping: gold standards and alternatives. Appl. Environ. Mikrobiolia. 77, 7877–7885. doi: 10.1128 / AEM.05527-11

PubMed Abstract | CrossRef Full Text/Google Scholar

Wattiau, P., Van Hessche, M., Schlicker, C., Vander Veken, H., and Imberechts, H. J. (2008). Salmonella enterica-serovaarien klassisen serotyypin määrityksen ja Prmitest-määrityksen vertailu. J. Clin. Mikrobiolia. 46, 4037–4040. doi: 10.1128 / JCM.01405-08

PubMed Abstract | CrossRef Full Text | Google Scholar

Yachison, C. A., Yoshida, C., Robertson, J., Nash, J. H., Kruczkiewicz, P., Taboada, E. N., et al. (2017). Koko genomin sekvensoinnin käytön validointi ja vaikutukset kansallisen salmonellan vertailulaboratorion perinteisen serotyypin korvaajana. Edessä. Mikrobiolia. 8:1044. doi: 10.3389 / fmicb.2017.01044

PubMed Abstract | CrossRef Full Text | Google Scholar

Yoshida, C. E., Kruczkiewicz, P., Laing, C. R., Lingohr, E. J., Gannon, VP, Nash, JH, et al. (2016). Salmonella in silico typing resource (Sistr): avoin verkkotyökalu salmonellan genomikokoonpanojen nopeaan kirjoittamiseen ja alatyyppiin. PLoS One 11: e0147101. doi: 10.1371 / lehti.pone.0147101

PubMed Abstract | CrossRef Full Text | Google Scholar

Zhang, S., Yin, Y., Jones, M. B., Zhang, Z., Kaiser, B. L. D., Dinsmore, B. A., et al. (2015). Salmonellan serotyypin määritys käyttämällä suurikapasiteettista genomin sekvensointitietoa. J. Clin. Mikrobiolia. 53, 1685–1692. doi: 10.1128 / JCM.00323-15

PubMed Abstract | CrossRef Full Text/Google Scholar

Zou, Q.-H., Li, R.-Q., Liu, G.-R., and Liu, S.-L. (2016). Salmonellan genotyypin määritys sukuspesifisillä geeneillä: korrelaatio serotyypin määritykseen. Int. J. Infect. Tämä. 49, 134–140. doi: 10.1016 / J.ijid.2016.05.029

PubMed Abstract | CrossRef Full Text/Google Scholar

Zou, Q.-H., Li, R.-Q., Wang, Y.-J., and Liu, S.-L. (2013). Sellaisten geenien tunnistaminen, joilla voidaan erottaa toisiinsa läheisesti liittyvät Salmonellalinjat. PLoS yksi 8: e55988. doi: 10.1371/journal.pone.0055988

PubMed Abstract | CrossRef Full Text | Google Scholar