Articles

A PATRIC Bioinformatics Resource Center: bővülő adatok és elemzési képességek

absztrakt

a PathoSystems Resource Integration Center (PATRIC) a bakteriális bioinformatikai Resource Center által finanszírozott National Institute of allergia és fertőző betegségek (https://www.patricbrc.org). A PATRIC támogatja az összes baktérium bioinformatikai elemzését, különös hangsúlyt fektetve a kórokozókra, gazdag összehasonlító elemzési környezetet kínálva, amely a felhasználók számára hozzáférést biztosít több mint 250 000 egységesen jegyzetekkel ellátott és nyilvánosan elérhető genomhoz, kurátor metaadatokkal. A PATRIC webalapú vizualizációs és összehasonlító elemzési eszközöket kínál, egy privát munkaterületet, amelyben a felhasználók elemezhetik saját adataikat a közgyűjtemények összefüggésében, olyan szolgáltatásokat, amelyek egyszerűsítik a komplex bioinformatikai munkafolyamatokat és parancssori eszközöket a tömeges adatelemzéshez. Az elmúlt néhány évben, ahogy a genomikai és egyéb omikákkal kapcsolatos kísérletek költséghatékonyabbá és elterjedtebbé váltak, jelentős növekedést tapasztaltunk a könnyen használható, nyilvánosan elérhető bioinformatikai eszközök és szolgáltatások használatában és keresletében. Itt bemutatjuk a PATRIC erőforrás legújabb frissítéseit, beleértve az új webalapú összehasonlító elemző eszközöket, nyolc új szolgáltatást és egy parancssori felület kiadását az adatok eléréséhez, lekérdezéséhez és elemzéséhez.

bevezetés

a bioinformatikai Erőforrás Központ (BRC) programot az Országos allergia és Fertőző Betegségek Intézete (NIAID) hozta létre 2004-ben azzal a céllal, hogy hozzáférést biztosítson a genomszekvencia adatokhoz és a kórokozók tanulmányozásához szükséges elemző eszközökhöz. A PathoSystems Resource Integration Center (PATRIC) az egyik eredeti központként indult, amelynek feladata a bakteriális kórokozók összehasonlító elemzésének támogatása (1-3). 2009-ben a PATRIC egyesült a National Microbial Pathogen Database Resource (Nmpdr) BRC-vel (4), amely kifejlesztette a successful SEED database és a RAST (Rapid Annotation using Subsystem Technology) annotációs rendszert a genom annotációk egységes kurálására és vetítésére a mikrobiális fajok között (5-8). Az évek során a PATRIC erőforrás bővült és alkalmazkodott ahhoz, hogy lépést tartson a bioinformatikai adatkészletek növekedésével és a kapcsolódó elemzési eszközök szükségességével. 2019 szeptemberétől a PATRIC több mint 250 000 nyilvánosan elérhető mikrobiális genomot és gazdag összehasonlító elemzési környezetet tartalmaz.

2008-as bevezetése óta a RAST (http://rast.nmpdr.org) 700 000 genom annotációs feladatot végzett magánfelhasználók számára. Azáltal, hogy hozzáférést biztosít az akadémiai közösség által kifejlesztett genomfunkció-azonosító szkriptekhez, valamint a magból származó jól kurált fehérjefunkciók következetes előrejelzéseihez, a RAST modellként szolgál a sikeres bioinformatikai szolgáltatáshoz, mivel enyhíti a felhasználók szükségességét saját egyedi annotációs csővezetékek felépítésére, következetessége pedig lehetővé teszi a downstream összehasonlító elemzéseket. A RAST mint sablon használatával 2014-ben a PATRIC számos bioinformatikai szolgáltatást kezdett megvalósítani a weboldalon keresztül, lehetővé téve a felhasználók számára a genomszekvenciák összeállítását és jegyzetelését, metabolikus modellek rekonstruálását, SNP-k és Indelek elemzését, valamint az RNS-seq kísérletek elemzését és összehasonlítását. Az elemzési feladatok eredményeit ezután össze lehet hasonlítani az erőforrásban található nyilvánosan elérhető genomikai és egyéb omic adatgyűjtésekkel, miközben a felhasználó munkaterületén belül titokban tartják őket. 2016 végéig a PATRIC havi 1500 szolgáltatási állást dolgozott fel, ide nem értve a Rast weboldalára benyújtott állásokat (3).

mióta utoljára 2016-ban leírták a nukleinsavak kutatásában (3), A PATRIC számos frissítésen és fejlesztésen ment keresztül. Az adatgyűjtés javult, különösen az antimikrobiális rezisztencia (AMR) (9) területén; a webböngészési környezetet új eszközökkel és vizualizációkkal javították; a munkaterület fejlesztése megkönnyítette a kutatási projektek adatainak megtalálását és megosztását is. A parancssori felület (CLI) a tömeges adatgyűjtés és elemzés épült, és megjelent terjesztésre Mac, Linux és Windows rendszerek. A PATRIC nyolc új bioinformatikai szolgáltatást is elindított, a közelmúltban hangsúlyt fektettek a vegyes kultúrák vagy metagenomikus minták adatainak elemzésére. Végre, egy gazdag gyűjteménye oktatóanyagok hoztak létre, hogy segítse a felhasználókat az új eszközök (https://docs.patricbrc.org/tutorial/). Ez a jelentés a PATRIC erőforrás legutóbbi, nem publikált frissítéseit ismerteti.

mi újság a PATRIC-ban?

Adatnövekedés és fejlesztések

a BRC program kezdete óta a bioinformatikai munkát támogató egyik legdrámaibb változás a nyilvánosan elérhető mikrobiális genomszekvenciák exponenciális növekedése volt (1.ábra). A PATRIC által annotált és indexált magánfelhasználói genomszekvenciák gyűjteménye szintén nőtt a munkaterület környezet létrehozása óta, és a következő évben ténylegesen meghaladhatja a nyilvános genomszekvencia gyűjtemény méretét (1.ábra). Bár a privát készlet tartalmaz néhány újraelemzett genomszekvenciát,

1.ábra.

Az állami és magán genomok kumulatív növekedése a PATRIC-ban.

1.ábra.

Az állami és magán genomok kumulatív növekedése a PATRIC-ban.

nem látunk arra utaló jelet, hogy a mikrobiális genom szekvenálása és a kapcsolódó bioinformatikai elemzések lassulnának. A nyilvánosan elérhető genomszekvencia-adatok és a kapcsolódó strukturált metaadatok növekedése forradalmasította a lehetséges kísérleti elemzések típusait is. Például a PATRIC strukturált és manuálisan kurált metaadatokat biztosít az egyes genomokhoz, beleértve a laboratóriumi eredetű AMR-fenotípusokat, a gazdaszervezeteket, az izolációs forrásokat, az emberi test helyadatait és a földrajzi információkat. Ezek a strukturált metaadatgyűjtemények képezik az alapot a gépi tanulás és a mély tanulási kísérletek futtatásához (10,11), valamint a prediktív eszközök biztosításához a felhasználók számára (9). Arra számítunk, hogy a mesterséges intelligencia technikáinak fokozott használata a bioinformatikában kísérleti tervezési döntéseket fog hozni, és végül lerövidíti a genetikai és más laboratóriumi alapú jellemzési kísérletekhez szükséges időt.

az AMR-kutatás támogatása a PATRIC adatgyűjtésének és kurációjának egyik fő területe. Aktívan kuráljuk mind az AMR fehérje kommentárokat, mind a laboratóriumi eredetű AMR fenotípus adatokat, amelyek a nyilvános genomokhoz kapcsolódnak. Az annotációs rendszer képes több mint 600 kézzel kurált AMR fehérje funkció pontos kivetítésére. Szorosan kapcsolódó nem AMR fehérje funkciók nagy gyűjteményét is tartalmazza, amelyeket az AMR funkciók hamis előrejelzéseinek megelőzésére kuráltak. Az összehasonlítás további eszköze érdekében az annotációs rendszer olyan géneket is keres, amelyek nagy hasonlóságot mutatnak a CARD (12) és az NCBI AMR génadatbázis-projektek (13) által kurált génekkel. A laboratóriumi eredetű AMR fenotípus gyűjteményt az NCBI (https://www.ncbi.nlm.nih.gov/pathogens) és más nyilvános forrásokból származó adatok kurálásával hozták létre. Több mint 40 000 genomszekvenciát tartalmaz, és a kutatók világszerte használják. Több mint 10 000 plazmid-és profágszekvenciát adtunk hozzá, mivel ezek fontosak az AMR tanulmányozásában és leküzdésében.

szolgáltatások

a PATRIC által nyújtott szolgáltatások célja a komplex bioinformatikai munkafolyamatok könnyű elérése. Ezek a PATRIC webes felületen és a CLI-n keresztül érhetők el. A legtöbb szolgáltatás képes napi több száz vagy akár több ezer munkahely kezelésére. A munkákat általában belső kiszolgálók sorozatán futtatják, a túlfeszültség-kapacitást egy nagy számítási klaszter kezeli. A PATRIC szolgáltatások népszerűsége 2014 óta nőtt, és 2019 szeptemberétől több mint 263 000 munkahelyet sikerült sikeresen befejezni (2.ábra).

2.ábra.

felhasználó által kezdeményezett elemzési feladatok, amelyeket a PATRIC bioinformatikai szolgáltatások végeznek. A felső ábra a nagy volumenű szolgáltatások használatát mutatja. Az alsó ábra az alacsonyabb volumenű és az új szolgáltatások használatát mutatja. Vegye figyelembe a két ábra közötti méretbeli különbséget.

2.ábra.

felhasználó által kezdeményezett elemzési feladatok, amelyeket a PATRIC bioinformatikai szolgáltatások végeznek. A felső ábra a nagy volumenű szolgáltatások használatát mutatja. Az alsó ábra az alacsonyabb volumenű és az új szolgáltatások használatát mutatja. Vegye figyelembe a két ábra közötti méretbeli különbséget.

a meglévő szolgáltatások figyelemre méltó frissítései

három pre=meglévő szolgáltatásunk, a Genome Assembly, a Genome Annotation és az RNS-seq analysis számos figyelemre méltó frissítésen ment keresztül. A Genome Assembly szolgáltatást egy új job schedulerrel újították fel, amely lehetővé teszi a tisztességesebb job-queuing folyamatot, amely megakadályozza, hogy a nagy munkahelyek szűk keresztmetszeteket hozzanak létre (14). A SPAdes (15) mellett hozzáadtuk a Canu-t (16) a hosszú olvasású szerelvényekhez és az Unicycler – t a hibrid hosszú és rövid olvasású szerelvényekhez (17). Az összeszerelési grafikonról kötést (18) is készítünk képet, és a szerelvényeket Racon (19) és Pilon (20) segítségével polírozhatjuk hosszú és rövid olvasású összeállításokhoz. Végül az olvasási leképezés a Bowtie2 (21) vagy a Minimap2 (22) és a SAMtools (23) segítségével pontos lefedettségi statisztikákat hoz létre. A genom annotációs szolgáltatás két új kiegészítése a bakteriofág genomszekvenciák annotálásának képessége (24), valamint a Genomminőségi statisztikák kiszámítása, amelyek a CheckM alkalmazáson alapulnak (25), valamint egy belső RAST modell, amely a minőséget a genomban lévő alrendszer szerepek előfordulása és teljessége alapján értékeli (26). Az RNS-seq elemzési szolgáltatást szintén frissítették, hogy lehetővé tegyék a gazdaszervezet mikrobiális fertőzésekre adott válaszát vizsgáló kísérleteket. Ennek alátámasztására számos közös eukarióta gazda referencia genomot adtunk hozzá, köztük Caenorhabditis elegant, Danio rerio, Drosophila melanogaster, kakas, kakas, Homo sapiens, Macaca mulatta, Mus muscle, menyét putorius furo, Rattus norvegicus és Sus scrofa. Nemrégiben hozzáadtuk a hisat2-t (hierarchical indexing for spliced alignment of transcripts) (27), egy rendkívül hatékony rendszert az RNS-Seq kísérletekből származó olvasások host genomokhoz való igazításához, és lehetővé tettük az adatkészletek importálását az SRA-ból az RNS-seq interfészbe, tovább növelve a nyilvános és magánadatok vegyes differenciális expressziós elemzésének elvégzésének képességét.

átfogó genomelemzés

a PATRIC magángenomjainak elemzésének egyik leggyakoribb felhasználási esete az, hogy a kutatók két külön szolgáltatás segítségével összeállítják, majd jegyzetekkel látják el genomszekvenciáikat. 2018 tavaszán elindítottunk egy egyszerűsített átfogó Genomanalízis meta-szolgáltatást, amely elfogadja a szekvenálási olvasásokat, kiszámítja az összeszerelést és az annotációt, és felhasználóbarát leírást nyújt a genomról. A kimenet tartalmazza a genom minőségének értékelését, az AMR géneket és a fenotípus előrejelzéseket, a speciális géneket, az alrendszer áttekintését, a legközelebbi genomszekvenciák azonosítását, a filogenetikai fát és azon jellemzők listáját, amelyek megkülönböztetik a genomot a legközelebbi szomszédoktól. Az átfogó Genomelemző szolgáltatás gyorsan PATRIC egyik legnépszerűbb szolgáltatásává vált, több mint 11 000 munkahelyet fejezett be az 2018 áprilisi elindítása óta.

filogenetikai fák

az evolúciós kapcsolatok rekonstruálásának és vizualizálásának képessége a biológia középpontjában áll. 2017-ben a PATRIC elindította a filogenetikai fa szolgáltatást, amely lehetővé teszi a felhasználók számára, hogy kiváló minőségű filogenetikai fákat építsenek az állami és magán genomszekvenciákhoz. A szolgáltatás jelenleg két munkafolyamatot kínál a felhasználó számára. Az első egy fehérjealapú faépítő munkafolyamat, az úgynevezett “All Shared Proteins”, amely a Filogenomikus becslést használja progresszív finomítással (pepr) csővezeték (https://github.com/enordber/pepr). A PEPR úgy működik, hogy meghatározza a De novo megosztott fehérjecsaládokat egy genomcsoport számára a BLAST (28) és a HMMER (29) segítségével a hasonló fehérjék azonosítására, az MCL (30) pedig a klaszterek felépítésére. Ezután az illesztéseket izom (31) segítségével generáljuk, majd Gblockokkal (32) vágjuk le. Végül a felhasználó preferenciája alapján a PEPR kiszámítja a fát a FastTree (33) vagy a RAxML (34) használatával. 2019-ben elindítottunk egy második, gyorsabb, filogenetikai faépítési munkafolyamatot Kodonfák néven. Kihasználja az előre meghatározott PATRIC globális fehérjecsaládokat (PGFams) (35), kiválasztva a felhasználó által megadott számú családot (10-1000), amelyek egypéldányúak (vagy majdnem ilyenek) egy genomcsoport tagjai között. Az egyes családok fehérjeszekvenciáihoz izom (31) segítségével állítunk elő igazításokat, és a megfelelő nukleotidszekvenciákat ehhez igazítjuk a biopython (36) kodonalign függvényével. Az összes fehérje és nukleotid összefűzött összehangolása egy PHYLIP formátumú fájlba van írva (37). Ezután létrejön a raxml (34) partíciófájl, amely leírja a fehérjék és nukleotidok összehangolását az első, a második és a harmadik kodonpozícióban. A támogatási értékek a raxml (38) gyors bootstrapping 100 fordulójából származnak.

a Newick által formázott fa fájlok mellett a filogenetikai fa szolgáltatás egy hordozható dokumentumfájlt (PDF), egy hordozható hálózati grafikát (PNG) és egy skálázható vektorgrafikus (SVG) képfájlt ad vissza a Figtree által generált középpontban gyökerező fa képekről (http://tree.bio.ed.ac.uk/software/figtree/). A PATRIC weboldal filogenetikai fa nézete lehetővé teszi a kutatók számára, hogy kiválasszák a csomópontokat és a leveleket, lehetővé téve a felhasználó számára, hogy csoportokat hozzon létre konkrét kládokból további elemzés céljából. Ezenkívül létrehoz egy genomjelentést, amely felsorolja a fa felépítéséhez használt genomszekvenciákat és fehérjecsaládokat, valamint a fa kiszámításához használt gének, fehérjék, aminosavak és nukleotidok számát. Végül felsoroljuk azokat a problémás genomszekvenciákat, amelyek eltávolíthatók a génszelekció növelése és a fa erősségének javítása érdekében. Építése óta közel 5000 munkahelyet dolgozott fel a filogenetikai fa szolgálat.

Fastq utilities

a szekvenálási olvasások minőségének értékelése fontos első lépés annak biztosításához, hogy a későbbi elemzések, például összeszerelés, annotáció stb. pontosak. A 2019 júliusában elindított Fastq Utilities szolgáltatás lehetővé teszi a felhasználók számára az olvasások összehangolását, az alaphívások minőségének mérését és az olvasási fájlokból származó alacsony minőségű szekvenciák kivágását. A szolgáltatás hosszú vagy rövid olvasású fájlokat fogad el egy vagy párosított formátumban. Azt is letölteni olvasni fájlokat közvetlenül a NCBI Sequence Read Archive (SRA) egy run azonosító bemenetként. A szolgáltatás három összetevőből áll: trim, fastqc és align, amelyek egymástól függetlenül vagy bármilyen kombinációban használhatók. A vágókomponens a Trim Galore (39) – t használja, amely egy Perl burkoló a Cutadapt (40) és a FastQC (https://www.bioinformatics.babraham.ac.uk/projects/fastqc) eszközök körül. A FastQC komponens minőségellenőrzést biztosít a nagy áteresztőképességű szekvenáló csővezetékekből származó nyers szekvenciaadatokon, és lehetővé teszi a gyors minőségellenőrzést azáltal, hogy jelzi azokat a problémákat, amelyek befolyásolhatják a downstream elemzéseket. Az igazítási függvény A Bowtie2 (21,41) használatával igazítja az olvasásokat egy referencia genomszekvenciához, mentve a feltérképezetlen olvasásokat, és SamStat (42) jelentéseket készít az igazítások mennyiségéről és minőségéről.

Genom igazítás

2018 novemberében a PATRIC elindította a genom igazítási szolgáltatást, amely lehetővé teszi a felhasználók számára a teljes genomszekvencia-igazítások kiszámítását. Ez a szolgáltatás a progressiveMauve alkalmazást (43) használja, amely az eredeti mályva algoritmus (44) kiterjesztésében több genomszekvencia-igazítást épít fel. A szolgáltatás lehetővé teszi a kutatók számára, hogy egyszerre akár húsz genomszekvenciát is összehangoljanak. A szolgáltatás kimenete magában foglalja a genom vizuális megjelenítését, amely lehetővé teszi a felhasználók számára, hogy megtekintsék és felfedezzék a teljes genomszekvencia-igazítást, vagy nagyítsanak az egyes régiók vagy gének összehasonlításához (3.ábra).

3.ábra.

adatelemzési munkafolyamat a PATRIC-ban a Genome Alignment szolgáltatás használatával. (A) a weboldal kezelőfelülete lehetővé teszi a genomok kiválasztását; (B) az igazított genomrégiók megjelenítése az esetleges törlésekkel, beillesztésekkel vagy átrendeződésekkel; (C) az igazítás nagyításával megjelennek a kiválasztható előre és hátra lévő állványokon lévő gének; (D) egy adott gén kiválasztása a genom igazítási megjelenítőből megnyitja a PATRIC Funkcióoldalt, ahol az adott génre rendelkezésre álló összes adat megjelenik. (E) a Patric gén oldalon található Régió nézet összehasonlítása lap a kiválasztott gén megőrzését mutatja (piros színnel), valamint a környező géneket. (F) minden gén egy genus-specifikus (PLFam) vagy globális (pgfam) fehérjecsaládhoz van hozzárendelve, amelyet a Funkcióoldalról lehet kiválasztani, és a családtagok összehasonlíthatók a többszörös szekvencia Igazítás/Génfa eszközzel.

3.ábra.

adatelemzési munkafolyamat a PATRIC-ban a Genome Alignment szolgáltatás használatával. (A) a weboldal felülete lehetővé teszi a genomok kiválasztását; (B) az összehangolt genomrégiók megjelenítése bármilyen törléssel, beillesztéssel vagy átrendezéssel; (C) az igazítás nagyítása megmutatja a géneket az előre és hátra állványokon, amelyek kiválaszthatók; (D) egy adott gén kiválasztása a Genome Alignment viewer-ből megnyitja a PATRIC Feature oldalt, ahol az adott génre rendelkezésre álló összes adat megjelenik. (E) a Patric gén oldalon található Régió nézet összehasonlítása lap a kiválasztott gén megőrzését mutatja (piros színnel), valamint a környező géneket. (F) minden gén egy genus-specifikus (PLFam) vagy globális (pgfam) fehérjecsaládhoz van hozzárendelve, amelyet a Funkcióoldalról lehet kiválasztani, és a családtagok összehasonlíthatók a többszörös szekvencia Igazítás/Génfa eszközzel.

hasonló genomkereső

amikor egy kutatónak új genomszekvenciája van, az egyik első dolog, amit azonosítani akarnak, a szervezet legközelebbi rokonai, de ez nehéz lehet, ha a nyilvános gyűjtemény ilyen nagy. A PATRIC a hasonló Genomkereső nevű szolgáltatást nyújtja, amely lehetővé teszi a kutatók számára, hogy gyorsan azonosítsák a hasonló genomszekvenciákat a Mash segítségével (45). A Mash úgy működik, hogy a nagy szekvenciákat kis reprezentatív vázlatokká redukálja, amelyek felhasználhatók a mutációs távolságok becslésére a megosztott k-Mer-ek alapján. A PATRIC lehetővé teszi az összehasonlítást az összes nyilvános genomszekvenciával vagy az NCBI referencia genomkészlettel. Az eszköz lehetővé teszi a kutatók számára, hogy beállítsák a keresési érzékenységet a közös k-merek maximális számának, a P-érték küszöbének vagy a távolságnak a kiválasztásával. Az eredményeket a leginkább hasonló genomszekvenciák listájaként adjuk vissza a megfelelő metaadatokkal. Mint minden PATRIC táblánál, a kutatók kiválaszthatnak szekvenciákat csoportok létrehozásához későbbi elemzés céljából, vagy letölthetik az eredményeket.

taxonómiai osztályozás

a 2019 márciusában indított taxonómiai osztályozási szolgálat azonosítja a vegyes vagy metagenomikus minták taxonómiai összetételét. Ez a szolgáltatás a Kraken2 (46) alkalmazást használja, amely azonosítja a különböző rendszertani egységekre utaló k-Mer-eket. A Szolgáltatás által használt Kraken adatbázis egy teljes felépítés, amely az összes RefSeq genomszekvencián (47), az emberi genomszekvencián, a plazmidokon és a vektorszekvenciákon alapul. Job kimenet tartalmazza a szabványos Kraken jelentés formátum, minden bakteriális taxon hiperhivatkozással a megfelelő oldalt PATRIC. A szolgáltatás visszaad egy Krona plot-ot (48), amely megmutatja az egyes taxonokhoz leképezett olvasások százalékos arányát, és lehetővé teszi a felhasználó számára a kiválasztott taxonok felfedezését.

Metagenomikus olvasási leképezés

az AMR-t vagy virulenciát tanulmányozó kutatók érdeklődhetnek a vegyes vagy metagenomikus olvasási halmazokban lévő gének elemzésében. A Metagenome Read Mapping szolgáltatás lehetővé teszi a kutatók számára, hogy ezeket a specifikus géneket egy olvasási készletben keressék. Úgy működik, hogy az olvasásokat egy referenciagénhez igazítja a KMA segítségével, amely k-mer vetést és a Needleman–Wunsch algoritmust használ az olvasások pontos összehangolására a kérdéses génekhez (49). A felhasználók jelenleg az átfogó antibiotikum-rezisztencia Adatbázis (Card) (50) és a virulencia faktor Adatbázis (Vfdb) (51) referencia génkészleteihez igazíthatók. A szolgáltatás a standard KMA jelentés html és szöveges változatát adja vissza, amely részletes leképezési információkat, Nagy hasonlóságú Patric génekre mutató linkeket, valamint az összehangolt olvasásokból összeállított konszenzussorozatot mutat.

Metagenomikus binning

a 2017 augusztusában elindított Metagenomikus Binning szolgáltatás egy metagenomikus mintából származó olvasmányokat állít össze, majd megpróbálja elválasztani ezeket a összefüggéseket tartályokba, amelyek az egyes fajok genomját képviselik. Ezeket a tartályokat ezután teljesen jegyzetekkel látják el, és minden egyes tartályra részletes minőségi statisztikákat számítanak ki. A binning algoritmus azzal kezdődik, hogy a genomban szinte mindig egyenként előforduló specifikus marker fehérjéket vizsgálja. A marker-fehérje hasonlóságot hasonló genomok toborzására használják PATRIC, amelyeket ezután további kontigok toborzására használnak a fehérje megkülönböztetése alapján k-mers. Az egyes izolátum genomokhoz hasonlóan a tárolók a felhasználó munkaterületén helyezkednek el, és a PATRIC adatbázisban privát genomként indexelik őket, lehetővé téve a PATRIC összehasonlító elemzési és vizualizációs eszközök teljes körű használatát minden egyes tárolóhoz.

webalapú elemző eszközök

a PATRIC weboldal számos interaktív vizuális elemző eszközt kínál, amelyek lehetővé teszik a felhasználók számára az omics adatkészletek összehasonlítását. Ezek az eszközök különböző típusú adatokat integrálnak, számítási feladatokat hajtanak végre, és interaktív vizualizációkat készítenek a felhasználó számára. A PATRIC jelenleg számos webalapú elemző eszközt támogat, mint például a Heat Map Viewer a megosztott fehérjetartalom összehasonlítására, a Pathway Viewer a metabolikus utak feltárására és a Genome Browser a kromoszóma genomiális jellemzőinek megjelenítésére. Két új vizualizációt adtunk a PATRIC weboldalhoz, amelyek eredetileg a RAST és a SEED weboldalakon léteztek, de jelentős újratervezésre volt szükség ahhoz, hogy működőképesek legyenek több százezer genommal.

Régiónézegető összehasonlítása

a Régiónézegető összehasonlítása lehetővé teszi a kutatók számára, hogy összehasonlítsák a gén környékeit (genetikai lokuszok vagy kromoszómális klaszterek) sok faj között. A felhasználó kiválaszt egy érdekes gént, a genom régió méretét és a genomok számát az összehasonlításhoz. A kijelző a fókusz gén robbanásszerű hasonlóságát, valamint a környező gének hasonlóságát mutatja a régióban (3e ábra).

a RAST-ban ez az eszköz az all-to-all BLAST (28) hasonlóságok előre kiszámított adatbázisára támaszkodik, hogy meghatározza az érdeklődésre számot tartó génnek megfelelő genomkészletet, és kiszámítja a kiválasztott régió génjeinek részletes páros összehasonlítását az adatok színkódolásához. A PATRIC adatbázisban található genomok száma miatt ez a módszer túl lassú a valós idejű használathoz. Ennek az eszköznek a PATRIC verziója a fókuszgén-keresést és a színkódolást a genus-specifikus (PLFam) vagy a globális (pgfam) fehérjecsaládokra (35) alapozza, amelyek minden genomra előre kiszámításra kerülnek, így a keresési tér szélesebb körű. Ez a vizualizáció azonban skálázható, mert a BLAST – ot csak a készleten belüli fókuszgének fehérje hasonlóságának kiszámítására használják.

alrendszerek

az alrendszerek funkcionálisan rokon fehérjék gyűjteményei, és létfontosságú fogalmi eszközt jelentenek a fajok közötti fehérjefunkciók azonosítására és kivetítésére (7,52). A PATRIC most kiszámítja és megjeleníti az alrendszer adatait minden nyilvános és privát megjegyzéssel ellátott genomszekvenciához. Az alrendszerek, amelyek egy szakértői kurátorokból álló csapat kézi megjegyzéséből származnak, Szuperosztályra (példa: anyagcsere), osztályra (példa: stresszválasz, védekezés és virulencia), alosztályra (példa: antibiotikumokkal és mérgező vegyületekkel szembeni rezisztencia), Alrendszernévre (példa: Arzénrezisztencia) és az egyes gének funkcionális szerepére oszlanak. Az alrendszerek fülre kattintva bármely Genom három különböző nézetet biztosít. Az alrendszerek áttekintése egy kördiagramot mutat, amely megjeleníti az adott Szuperosztályba tartozó gének százalékát. Az alrendszerek fül tartalmazza az adott Szuperosztályban található gének számát. A gének lap tartalmazza az összes alrendszer összes génjének listáját, valamint tartalmazza a PATRIC és a RefSeq locus címkéket (47). Az alrendszer információ nem csak az egyes genomokhoz érhető el, hanem az egyes taxonómiai szintekre is összegezhető, egészen a Szuperkirályságig az NCBI taxonómia segítségével (53). A felhasználó létrehozhat egy hőtérkép-nézetet, amely a kiválasztott alrendszerenként specifikus fehérjék jelenlétét vagy hiányát mutatja egy taxonban vagy egy adott genomcsoportban.

parancssori felület (CLI)

az elmúlt 5 évben a PATRIC adattárat NoSQL Apache Solr adatbázis-struktúrával kezelték. A gyorsan növekvő adatgyűjtés, valamint a skálázhatóság és a rugalmasság előnyeinek kihasználása érdekében a PATRIC adatbázis-architektúrát Apache SolrCloud adatbázis-architektúrává alakították át 2019 tavaszán. A SolrCloud adatbázis SolrCores-sorozatokra oszlik a kapcsolódó adattípusok, például Genom jellemzők, szekvenciák és transzkriptomikus adatok kezelésére. Az alapul szolgáló alkalmazásprogramozási felület (API) lehetővé teszi a programozott hozzáférést ezekhez a magokhoz és az általuk tartalmazott adatokhoz; az adatgyűjtés azonban összetetté válhat, amikor navigál és összevonja a mezőket a különböző magokból. Kifejlesztettünk egy sor parancssori szkriptet, amelyek az API-t használják az adattárolóhoz való hozzáféréshez és a közös elemzések elvégzéséhez. Ez a disztribúció Mac, Windows és Linux operációs rendszerekre érhető el, beleértve az Ubuntu és a CentOS 6 és 7, valamint A Fedora 28 és 29 operációs rendszereket (https://github.com/PATRIC3/PATRIC-distribution/releases). Mind a disztribúció, mind a PATRIC weboldal tartalmaz oktatóanyagokat a szkriptek használatáról példákkal (https://docs.patricbrc.org/cli_tutorial/). A 482 MB disztribúció a PATIRC környezet számos mögöttes szkriptjét tartalmazza. Egyesek lehetővé teszik az adatok tömeges letöltését, egyesítését és kezelését, mások pedig összetettebb elemzéseket tesznek lehetővé. A disztribúció hasznos szkripteket is tartalmaz korábbi SEED (5) és RASTtk (8) projektekből. A PATRIC CLI disztribúció által kínált különösen figyelemre méltó funkció a fájlok kezelése a munkaterületen. A felhasználók bejelentkezhetnek egy privát munkaterületre, alkönyvtárakat hozhatnak létre, fájlokat helyezhetnek át a munkaterületbe vagy onnan ki, és indíthatnak annotációs és összeszerelési feladatokat. Ezek a szkriptek biztosítják az eszközöket több száz vagy akár ezer genomszekvencia összeállításához és jegyzeteléséhez. Ezenkívül elérhetővé tettük a PATRIC munkaterületet a File Transfer Protocol (FTP) segítségével is, amely alternatív eszközt kínál nagy mennyiségű adat mozgatására a munkaterületbe és onnan kifelé. A felhasználók a munkaterületet a parancssori vagy FTP fájlkezelő segítségével érhetik el. Terveink szerint folytatjuk a parancssori eszközök fejlesztését, amelyek lehetővé teszik a szolgáltatásokhoz való nagyobb hozzáférést és az adatok könnyebb kezelését.

jövőbeli irányok

2020-ban a Chicagói Egyetem PATRIC csapata, a Virginia Egyetem és a genomok értelmezésének ösztöndíja összekapcsolódik a viral BRC csapattal, amely támogatja a ViPR (Virus Pathogen Database and Analysis Resource) és az IRD (Influenza Research Database) erőforrásokat a J. Craig Venter Intézetben (JCVI). Az újonnan alakult bakteriális és vírusos BRC csapat (BV-BRC) továbbra is fenntartja a PATRIC, IRD és ViPR weboldalakat, miközben új, átfogó funkciókat ad hozzá. Nagy hangsúlyt fektetünk az új BV-BRC erőforrás epidemiológiai elemzésre való hasznosságának javítására, az adattár kiterjesztésére más adat-és metaadattípusokra, a mesterséges intelligencia alkalmazásokban használható strukturált adatokhoz való hozzáférés növelésére, valamint az eszközök és szolgáltatások telepítési architektúrájának javítására.

finanszírozás

Nemzeti allergia és Fertőző Betegségek Intézete (NIAID) . A nyílt hozzáférési díj finanszírozása: NIAID.

összeférhetetlenségi nyilatkozat. Nincs megadva.

Megjegyzések

jelenlegi cím: James J. Davis, Argonne National Laboratory, Computing, Environment and Life Sciences, 9700 S. Cass Avenue, Argonne, IL 60439, USA.

Snyder
E.

,

Kampanya
N.

,

Lu
J.

,

Nordberg
E. K.

,

Karur
H.

,

Shukla
M.

,

soneja
J.

,

tian
Y.

,

Xue
T.

,

Yoo
H.
PATRIC: a VBI pathosystems erőforrás-Integrációs Központ

.

nukleinsavak res.
2006

;

35

:

D401

D406

.

Wattam
A. R.

,

Abraham
D.

,

Dalay
O.

,

Dissz
T. L.

,

Driscoll
T.

,

Gabbard
J. L.

,

Gillespie
J. J.

,

Gough
R.

,

Hix
D.

,

Kenyon
R.
PATRIC, a bakteriális bioinformatikai adatbázis és elemzési forrás

.

nukleinsavak res.
2013

;

42

:

D581

D591

.

Wattam
A. R.

,

Davis
J. J.

,

Assaf
R.

,

Boisvert
S.

,

brettin
T.

,

bun
C.

,

Conrad
N.

,

Dietrich
E. M.

,

dissz
T.

,

div>Gabbard
J. L.
a PATRIC, az all-bakteriális bioinformatikai adatbázis és elemzési erőforrás központ fejlesztése

.

nukleinsavak res.
2016

;

45

:

D535

D542

.

McNeil
L. K.

,

Reich
C.

,

Aziz
R. K.

,

Bartels

.

,

cohoon
M.

,

dissz
T.

,

Edwards
R. A.

,

Gerdes
S.

,

Hwang
K.

,

Kubal
M.
a Nemzeti mikrobiális kórokozó Adatbázis erőforrás (NMPDR): az alrendszer annotációján alapuló genomikai platform

.

nukleinsavak res.
2006

;

35

:

D347

D353

.

Overbeek
R.

,

Olson
R.

,

Pusch
G. D.

,

Olsen
G. J.

,

Davis
J. J.

,

dissz
T.

,

Edwards
R. A.

,

Gerdes
S.

,

Parrello

.

,

Shukla
M.
a mikrobiális genomok magja és gyors feljegyzése az alrendszerek technológiájával (Rast)

.

nukleinsavak res.
2013

;

42

:

D206

D214

.

Aziz
R. K.

,

Bartels
D.

,

legjobb
A. A.

,

DeJongh
M.

,

dissz
T.

,

Edwards
R. A.

,

formsma
K.

,

Gerdes
S.

,

glass
E. M.

,

Kubal
M.
a RAST szerver: gyors megjegyzések az alrendszerek technológiájával

.

BMC genomika

.

2008

;

9

:

75

.

Overbeek
R.

,

Begley
T.

,

Butler
R. M.

,

Choudhuri
J. V.

,

Chuang
H.-Y.

,

cohoon
M.

,

de CR Enterprises-Lagard
V.

,

Diaz
N.

,

Dissz

.

,

Edwards
R.
az alrendszerek megközelítése a genom annotációhoz és annak felhasználása a projektben 1000 Genom annotálásához

.

nukleinsavak res.
2005

;

33

:

5691

5702

.

Brettin
T.

,

Davis
J. J.

,

Dissz
T.

,

Edwards
R. A.

,

Gerdes
S.

,

Olsen
G. J.

,

Olson
R.

,

Overbeek
R.

,

Parrello
B.

,

div>Pusch
G. D.
RASTtk: a Rast algoritmus moduláris és bővíthető implementációja egyedi annotációs csővezetékek építéséhez és Genom-tételek annotálásához

.

Sci.
2015

;

5

:

8365

.

Antonopoulos
D. A.

,

Assaf
R.

,

Aziz
R. K.

,

Brettin
T.

,

bun
C.

,

Conrad
N.

,

Davis
J. J.

,

Dietrich
E. M.

,

dissz
T.

,

Gerdes
S.
PATRIC mint egyedülálló forrás az antimikrobiális rezisztencia tanulmányozásához

.

rövid. Bioinformáció.
2019

;

20

:

1094

1102

.

Nguyen
M.

,

Brettin
T.

,

Long
S. W.

,

Musser
J. M.

,

Olsen
R. J.

,

Olson
R.

,

Shukla
M.

,

Stevens
R. L.

,

Xia
F.

,

Yoo
H.
a Klebsiella pneumoniae in silico minimális gátló koncentrációs panel tesztjének kidolgozása

.

Sci.
2018

;

8

:

421

.

Nguyen
M.

,

hosszú
S. W.

,

McDermott
P. F.

,

Olsen
R. J.

,

Olson
R.

,

Stevens
R. L.

,

Tyson
G. H.

,

Zhao
S.

,

Davis
J. J.
gépi tanulás használata az antimikrobiális Mikrofonok és a kapcsolódó Genom jellemzők előrejelzésére a nem-tifoid szalmonellára

.

J. Blink. Mikrobiol.
2019

;

57

:

e01260-18

.

Jia
B.

,

Rapenya
A. R.

,

Alcock
B.

,

Waglechner
N.

,

Guo
P.

,

Tsang
K. K.

,

Lago
B. A.

,

Dave
B. M.

,

Pereira
S.

,

Sharma
A. N.
CARD 2017: az átfogó antibiotikum-rezisztencia adatbázis bővítése és modellközpontú kurálása

.

nukleinsavak res.
2016

;

45

:

D566

D573

.

Feldgarden
M.

,

Brover
V.

,

Haft
D. H.

,

Prasad
A. B.

,

Slotta
D. J.

,

Tolsztoj
I.

,

Tyson
G. H.

,

Zhao
S.

,

Hsu

.-H.

,

McDermott
P. F.
Validating the NCBI AMRFinder tool and resistance gene database using antimicrobial resistance Genotype-Phenotype correlations in a collection of NARMS isolates

.

Antimicrob. Agents Chemother.
2019

;

63

:

e00483-19

.

Yoo
A.B.

,

Jette
M.A.

,

Grondona
M.
Slurm: Simple linux utility for resource management

.

Workshop on Job Scheduling Strategies for Parallel Processing

.

2003

;

Berlin, Heidelberg
Springer
44

60

.

Bankevich
A.

,

Nurk
S.

,

Antipov
D.

,

Gurevich
A. A.

,

dvorkin
M.

,

Kulikov
A. S.

,

leucin
V. M.

,

Nikolenko
S. I.

,

Pham
S.

,

prjibelski
A. D.
Spades: egy új Genom összeszerelési algoritmus és alkalmazásai az egysejtes szekvenáláshoz

.

J. Comput. Biol.
2012

;

19

:

455

477

.

Koren
S.

,

Walenz
B. P.

,

Berlin
K.

,

Miller
J. R.

,

Bergman
N. H.

,

phillippy
A. M.
Canu: skálázható és lehetséges pontos hosszú olvasású szerelvény adaptív k-Mer súlyozással és ismételt elválasztással

.

Genome res.
2017

;

27

:

722

736

.

Wick
R. R.

,

Judd
L. M.

,

Gorrie
C. L.

,

Holt
K. E.
Unicycler: a baktériumgenom-összeállítások megoldása rövid és hosszú szekvenálásból

.

PLoS Comput. Biol.
2017

;

13

:

e1005595

.

Wick
R. R.

,

Schultz
M. B.

,

Zobel
J.

,

Holt
K. E.
rácsok: a De Novo genom szerelvények interaktív megjelenítése

.

bioinformatika

.

2015

;

31

:

3350

3352

.

Vaser
R.

,

Sovi
I.

,

Nagarajan
N.

,

Xhamiki
M.
gyors és lehetséges pontos de novo Genom összeállítás hosszú korrigálatlan olvasatokból

.

Genome res.
2017

;

27

:

737

746

.

Walker
B. J.

,

Abeel
T.

,

Shea
T.

,

Priest
M.

,

Abouelliel
A.

,

Sakthikumar
S.

,

Cuomo
C. A.

,

Zn
Q.

,

Wortman
J.

,

young
S. K.
pylon: az integrált eszköz átfogó mikrobiális variáns kimutatására és Genom összeállítás javítása

.

PLoS One

.

2014

;

9

:

e112963

.

Langmead
B.

,

Yates
S. L.
gyors gapped-olvassa el az igazítást a Bowtie 2-vel

.

Nat. Módszerek

.

2012

;

9

:

357

359

.

It
H.
Minimap2: nukleotidszekvenciák páronkénti igazítása

.

bioinformatika

.

2018

;

34

:

3094

3100

.

It
H.

,

Handsaker
B.

,

Wysoker
A.

,

Fennell
T.

,

Ruan
J.

,

Homer
N.

,

Marth
G.

,

Abecasis
G.

,

Durbin
R.
a sorrend igazítása/térkép formátum és SAMtools

.

bioinformatika

.

2009

;

25

:

2078

2079

.

McNair
K.

,

Aziz
R. K.

,

Pusch
G. D.

,

Overbeek
R.

,

dutilh
B. E.

,

Edwards
R.
Clokie
MRJ

,

Kropinski
AM

,

Lavigne
r
Fággenom annotáció a RAST csővezeték segítségével

.

bakteriofág módszerek és protokollok

.

2018

;

3

:

NY
Humana sajtó
231

238

.

parkok
D. H.

,

Imelfort
M.

,

Skennerton
C. T.

,

Hugenholtz
P.

,

Tyson
G. W.
checkm: az izolátumokból, egysejtekből és metagenomokból kinyert mikrobiális genomok minőségének értékelése

.

Genom res.
2015

;

25

:

1043

1055

.

Parrello
B.

,

Butler
R.

,

Chlenski
P.

,

Olson
R.

,

Overbeek
J.

,

Pusch
G. D.

,

vonstein
V.

,

Overbeek

.

a gépi tanulás-alapú szolgáltatás minőségének becslésére genomok segítségével PATRIC

.

BMC bioinformatika

.

2019

;

20

:

486

.

Kim
D.

,

Langmead
B.

,

Yates
S. L.
HISAT: gyors illesztésű aligner alacsony memóriaigénnyel

.

Nat. Módszerek

.

2015

;

12

:

357

360

.

Boratyn
G. M.

,

Camacho
C.

,

Cooper
P. S.

,

Coulouris
G.

,

Fong
A.

,

Matt
N.

,

Madden
T. L.

,

div> Matten
W. T.

,

walk
S. D.

,

merezhuk
Y.
robbanás: hatékonyabb jelentés a használhatóság javításával

.

nukleinsavak res.
2013

;

41

:

W29

W33

.

Eddy
S. R.
profil rejtett Markov modellek

.

bioinformatika

.

1998

;

14

:

755

763

.

Enright
A. J.

,

Van Dongen
S.

,

Ouzounis
C. A.
a hatékony algoritmus a fehérjecsaládok nagy léptékű kimutatásához

.

nukleinsavak res.
2002

;

30

:

1575

1584

.

Edgar
R. C.
izom: többszörös szekvencia igazítás nagy pontossággal és nagy áteresztőképességgel

.

nukleinsavak res.
2004

;

32

:

1792

1797

.

Talavera
G.

,

Castresana
J.
a törzsfejlődések javítása a divergens és kétértelműen igazított blokkok eltávolítása után a fehérjeszekvencia-igazításokból

.

Syst. Biol.
2007

;

56

:

564

577

.

Ár
M. N.

,

Dehal
P. S.

,

Arkin
A. P.
FastTree 2–körülbelül maximális valószínűségű fák nagy igazításokhoz

.

PLoS One

.

2010

;

5

:

e9490

.

Stamatakis
A.
RAxML 8.verzió: eszköz a filogenetikai elemzéshez és a nagy filogenitások utáni elemzéséhez

.

bioinformatika

.

2014

;

30

:

1312

1313

.

Davis
J. J.

,

Gerdes
S.

,

Olsen
G. J.

,

Olson
R.

,

Pusch
G. D.

,

Shukla
M.

,

Vonstein
V.

,

Wattam
A. R.

,

Yoo
H.
pattyfams: a Patric adatbázisban található mikrobiális genomok Fehérjecsaládjai

.

elöl. Mikrobiol.
2016

;

7

:

118

.

Cock
P. J.

,

Antao
T.

,

Chang
J. T.

,

Chapman
B. A.

,

Cox
C. J.

,

Dalke
A.

,

Friedberg
I.

,

Hamelryck
T.

,

Kauff
F.

,

Wilczynski
B.
biopython: szabadon elérhető Python eszközök számítási molekuláris biológia és bioinformatika

.

bioinformatika

.

2009

;

25

:

1422

1423

.

Felsenstein
J.
phylip (filogenetikai következtetési csomag), 3.5 c verzió

.

1993

;

Seattle, Washington
Joseph Felsenstein

.

Stamatakis
A.

,

Hoover
P.

,

Rougemont
J.
a rapid bootstrap algoritmus a raxml webszerverekhez

.

Syst. Biol.
2008

;

57

:

758

771

.

Krueger
F.
Trim Galore: a Cutadapt és a FastQC köré csomagoló eszköz a minőség és az adapter vágásának következetes alkalmazásához a FastQ fájlokhoz, néhány extra funkcióval az MspI-emésztett RRBS típusú (Reduced Representation Bisufite-Seq) könyvtárakhoz

.

2012

;

(28 Április 2016, utolsó hozzáférés dátuma)

http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/.

Martin
M.
a Cutadapt eltávolítja az adapter szekvenciákat a nagy áteresztőképességű szekvenálásból

.

EMBnet J.
2011

;

17

:

10

12

.

Langmead
B.

,

Wilks
C.

,

Antonescu
V.

,

Charles
R.
az olvasási alignerek skálázása több száz szálra az általános célú processzorokon

.

bioinformatika

.

2018

;

35

:

421

432

.

Lassmann
T.

,

Hayashizaki
Y.

,

Daub
C. O.
SAMStat: torzítások figyelése a következő generációs szekvenálási adatokban

.

bioinformatika

.

2010

;

27

:

130

131

.

Darling
A. E.

,

Mau
B.

,

Perna
N. T.
progressiveMauve: több Genom összehangolása gén nyereség, veszteség és átrendeződés

.

PLoS One

.

2010

;

5

:

e11147

.

Darling
A. C.

,

Mau
B.

,

Blattner
F. R.

,

Perna
sz.
mályva: a konzervált genomi szekvencia többszörös igazítása átrendeződésekkel

.

Genome res.
2004

;

14

:

1394

1403

.

Ondov
B. D.

,

Treangen
T. J.

,

Melsted
P.

,

Mallonee
A. B.

,

Bergman
N. H.

,

Koren
S.

,

phillippy
A. M.
mash: gyors genom és Metagenom távolságbecslés minhash

használatával.

Genome Biol.
2016

;

17

:

132

.

Wood
D. E.

,

Yates
S. L.
Kraken: ultragyors metagenomikus szekvencia taxonómia pontos igazításokkal

.

Genome Biol.
2014

;

15

:

R46

.

Haft
D. H.

,

DiCuccio
M.

,

Badretdin
A.

,

Brover
V.

,

chetvernin
V.

,

O ‘ Neill
K.

,

it
W.

,

Chitsaz
F.

,

Derbyshire
M. K.

,

Gonzales
N. R.
RefSeq: frissítés a prokarióta Genom annotációjáról és kurációjáról

.

nukleinsavak res.
2017

;

46

:

D851

D860

.

Ondov
B. D.

,

Bergman
N. H.

,

Phillippy
A. M.
interaktív metagenomikus megjelenítés webböngészőben

.

BMC bioinformatika

.

2011

;

12

:

385

.

Clausen
P. T.

,

Aarestrup
F. M.

,

Lund
O.
a nyers olvasmányok gyors és pontos összehangolása a redundáns adatbázisokkal KMA

.

BMC bioinformatika

.

2018

;

19

:

307

.

McArthur
A. G.

,

Waglechner
N.

,

Nizam
F.

,

Yan
A.

,

Azad
M. A.

,

baylay
A. J.

,

Bhullar
K.

,

Canova
M. J.

,

két Pascale
G.

,

Ejim
L.
az átfogó antibiotikum-rezisztencia adatbázis

.

Antimikrob. Chemother Ügynökök.
2013

;

57

:

3348

3357

.

Liu
B.

,

Zheng
D.

,

Jin
Q.

,

kutya
L.

,

div> yang
J.
vfdb 2019: az összehasonlító patogenomikai platform az interaktív webes felülettel

.

nukleinsavak res.
2018

;

47

:

D687

D692

.

Overbeek
R.

,

Olson
R.

,

Pusch
G. D.

,

Olsen
G. J.

,

Davis
J. J.

,

dissz
T.

,

Edwards
R. A.

,

Gerdes
S.

,

Parrello
B.

,

Shukla
m
a mikrobiális genomok magja és gyors feljegyzése az alrendszerek technológiájával (Rast)

.

nukleinsavak res.
2013

;

42

:

D206

D214

.

Federhen
S.
az NCBI taxonómiai adatbázisa

.

nukleinsavak res.
2011

;

40

:

D136

D143

.

az Oxford University Press kiadta a Nucleic Acid Research 2019 nevében.
ezt a munkát (a) amerikai kormányzati alkalmazott(ok) írta, és az Egyesült Államokban nyilvánosan hozzáférhető.