Articles

微生物学におけるFrontiers

はじめに

サルモネラは、ヒトサルモネラ症 Salmonella属はS.entertericaとs.bongoriの二つの種に分けられる。 血清型決定は、さらに、3つの表面抗原O、H1、およびH2に対する抗血清の凝集反応を介して、サルモネラを2 6 0 0以上の血清型(血清型)に分類する(L E Minor and Bockemuhl,1 9 8 4;L E Minor e t a l., 1990). 血清群を同定する46のO抗原がある。 一緒に119H1とH2フラジェリン抗原と、O、H1、およびH2の組み合わせは、血清を識別します。 ヒトサルモネラ感染症の大部分を担うのは、ほんの一部のセロバールのみである(Popoff e t a l., 2004).抗原凝集による血清型決定は、分子血清型決定に置き換えられている(Cai et al. ら、2 0 0 5;Wattiau e t a l., 2011). これは、O抗原遺伝子クラスター、H1抗原コード遺伝子FLICおよびH2抗原コード遺伝子FLJBの配列を調べることによって達成することができる(Fitzgerald e t a l., 2007). O抗原遺伝子クラスターは、遺伝子の存在または非存在によって区別することができ、一方、H1およびH2抗原は、配列変異によって区別される(Mcquiston e t a l. ら,2 0 0 4;Guo e t a l. ら、2 0 1 3;Zhang e t a l., 2015). Salmonella血清型はまた、MLSTを介して推定することもできる(Wattiau e t a l. ら、2 0 1 1;Achtman e t a l. 血清型としては、その配列型によって推論することができる。 しかし、このアプローチの前提条件は、配列タイプに対する血清の対応する関係の事前知識が必要であるということである。

最近、全ゲノム配列ベースの比較の開発に伴い、いくつかの研究は、セロタイピングのための代替分子方法としてゲノムマーカーを同定しました。 Zou et al. (2016)は、26の血清型を表す309のサルモネラ株を区別するのに十分な分解能を提供する7つの遺伝子を同定し、26の血清型のうち13の血清型特異的遺伝子を発見した。 Laing et al. (2017)は、汎ゲノム解析によりサルモネラ種および亜種に特異的なゲノム断片を同定した。 これらの特定の遺伝子またはDNA断片は、種および血清レベルでのサルモネラの迅速な同定および検出のための複数の分子アッセイを開発するため しかしながら、これらの特定の遺伝子またはDNA断片は、より少ない数のセロバールのみを区別する能力のために、それらの識別能力に限定される。

本研究では、サルモネラゲノムの広範な公に利用可能なコレクションを使用して、最も頻繁なサルモネラセロバールの血清特異的遺伝子マーカーを同定することを目的とした。 これらの血清特異的遺伝子マーカーは,ゲノムデータのシリコタイピングまたは実験室診断法の開発のための分子血清型決定のマーカーとしての可能性を示した。

材料および方法

リボソームMLST STベースの単離物選択

Enterobaseにおけるサルモネラデータベース(Alikhan et al. 2018年現在、118997人が調査されている。 各rSTsの代表的な分離株を選択し、社内のpythonスクリプトによって抽出しました。 この研究には四つ以上のrstを有する血清のみが含まれていた。 20最大のserovarsの代表的な分離株は、ランダムに二つ以上の分離株とrSTsから選択されました。 残りの血清群について、各RSTについて1つの代表的分離物を無作為に選択した。 これらの分離株の生の読み取りは、ENA(European Nucleotide Archive1)から取得され、デフォルト設定2を有するSpades v3.1 0.1アセンブラを使用してde novo組み立てられた(Bankevich e t a l., 2012). 組み立てられたゲノムの血清は、SISTRによって予測された(Yoshida e t a l. ら、2 0 1 6)が、Robertsonらによって定義された以下の基準を満たした後に、Robertsonらによって定義された。 (2 0 1 8)QUAST3を使用する(Gurevich e t a l. ら、2 0 1 3):4〜6Mbのアセンブリサイズ、5 0 0未満の連続体の数、1 0 0kbより大きい最大の連続体、5 0〜5 4%のGC含量、3 0 0 0以上のQUAST内のglimmerによって予測される遺伝子。 得られたSISTR血清予測とEnterobaseメタデータレコード上の報告された血清との間の一致を調べ、矛盾した血清予測のために少数のゲノムが分析から除去された。 最終的なデータセットは、2258の高品質のゲノムで構成され、107の血清血清を表す一貫した血清血清予測(補足表S1)で構成されていました。

サルモネラ血清特異的候補遺伝子マーカーの同定

107血清の潜在的な血清特異的遺伝子マーカーを決定するために、2258ゲノムはPROKKAを用いて注釈された(Seemann、2014)。 Pan−ゲノムおよびコア−ゲノムを、roary(Page e t a l. ら、2 0 1 5)8 0%配列同一性閾値を使用する。 各血清に特異的な遺伝子は、社内のpythonスクリプトを用いて汎ゲノムの付属遺伝子から同定された。 本研究では、その血清に対する特定の遺伝子を含む所与の血清由来のゲノムの数を真陽性(TP)と称し、同じ遺伝子を欠く同じ血清由来のゲノムの数を偽陰性(FN)と称した。 同じ血清特異的遺伝子を含む他の血清由来のゲノムの数は、偽positve(FP)と呼ばれていた。 緩和されたカットオフ(20%FN、10%FP)は、すべての血清がさらに調査することができる候補特異的遺伝子を有することを保証するために最初に使用された。 パラログ遺伝子を解析から除去した。

潜在的な血清特異的遺伝子マーカーの評価

F1スコアは、潜在的な血清特異的遺伝子マーカーの初期選択のために使用されました。 F1スコアを、式:2×(PPV×感度)/(PPV+感度)に基づいて評価し、ここで、PPVはTP/(TP+FP)として定義され、感度はTP/(TP+FN)として定義された。 F1は0から1の範囲であり、ここで1は、所与の血清中のすべてのゲノムに存在し、他の血清中のすべてのゲノムに存在しない血清中特異的遺伝子を意味する。 血清特異的遺伝子マーカーは、F1スコアに基づいて、各血清のための最高の実行遺伝子を使用して選択されました。 Tn/(TN+FP)として定義された特異性を使用して、血清特異的遺伝子マーカーの真陰性(TN)率を評価した。 偽陽性率(FPR)は、1−TNRによって定義された。

系統発生解析

候補血清特異的遺伝子マーカーにおける観察された偽陰性およびFPRsの原因を決定するために、関与する血清の系統発生関係を調 1258の分離株のドラフトアセンブリは、parsnp v1.24を使用して系統樹を生成するために使用されました(Treangen et al.,2014)血清群間および血清群内の系統発生を決定するためのデフォルトパラメータを用いた。 3によって可視化した(Schneider e t a l., 2000).

Serovar特異的遺伝子マーカーの位置と機能

遺伝子機能を含む各serovarの代表的な完全なゲノムは、NCBI5からダウンロードし、デフォルト設定(バージョン2.2。6の補足のテーブルS2)。 代表的な完全なゲノムを持たない血清中では、この研究で組み立てられた分離株から代表的なゲノムが選択された。 血清特異的遺伝子マーカーの配列は、補足データS1に含まれています。 ゲノム全体の遺伝子のクラスタリングは、serovar特異的遺伝子マーカーが潜在的に一つのイベントでserovarによって得られた単一の要素の一部であったかどうか 候補血清特異的遺伝子マーカーは、それらが互いに5kb未満に位置していた場合、クラスターとして考えられていた。

遺伝子マーカーの機能カテゴリは、RAST annotation6から同定された(Aziz et al., 2008). Serovar参照ゲノム内のprophage配列は、serovar特異的遺伝子マーカーがprophages(PHAge Search Tool Enhanced Release)とともに取得されたかどうかを示すためにPHASTERを使用することによって同定された(Arndt et al., 2016).

Serovar特異的遺伝子マーカーを用いたin silico血清型予測

社内pythonスクリプトを用いてEnterobaseから1089の分離株を選択し、2258の分離株を2018年と同じデータベースから除外した(補足表S3)。 BLASTNは、血清特異的遺伝子マーカーのいずれかの存在のために1089サルモネラセロバールに属する106ゲノムに対して検索するために使用されました。 カスタムpythonスクリプトは、各血清の既知の遺伝子存在パターンに基づいて、これらの血清割り当てから血清を予測するために使用されました。 TPは、正しく割り当てられた血清バーの総数と、正しい血清バーが呼び出された症例、および一つ以上のFPとして分類された。 失敗した割り当ては、serovarまたは不正なserovarが呼び出されなかった場所で定義されました。 血清学的予測を、Seqseroと比較した(Zhang e t a l.,2015)とSISTR予測。

一般的なセロバールの候補セロバール特異的遺伝子マーカーの特異性の計算

一般的なセロバールのタイピング速度の特異性(Hendriksen et al.,2011)は(1–潜在的な誤り率)に等しい。 式によって定義される血清特異的遺伝子マーカーの潜在的な誤り率:(FPsの数)÷(所与の領域におけるその血清の頻度)/(その血清のゲノムの合計)。

結果

候補血清特異的遺伝子マーカーの同定

2258 107血清を表すゲノムからアクセサリー遺伝子は、潜在的な血清特異的遺伝子マーカ この最初のスクリーニングは354 101serovars内の潜在的なserovar特異的遺伝子マーカーを同定した。 六つの血清すなわち、Bareilly、Bovismorbificans、Thompson、Reading、Typhi、およびSaintpaulは、与えられた血清のすべての系統に存在していた候補血清特異的遺伝子マーカーを持っていませんでした。 354候補血清特異的遺伝子マーカーの特異性(TNR)と感度(TPR)も検討し、図1にまとめました。 四十serovarsは194serovar特異的遺伝子マーカー100%の特異性と感度(ないFNまたはFP)が含まれていたが、31serovarsは80候補serovar特異的遺伝子マーカー100%の感度が、100%未満の特異性(変化FP) ナイン血清は27候補血清特異的遺伝子マーカー100%の特異性を持つが、100%未満の感度(変化したFN)を含んでいた。 残りの21血清は、53候補血清特異的遺伝子マーカー特異性と感度の両方を100%未満(変化したFNとFP)が含まれていました。

図1
www.frontiersin.org

図1. 354潜在的な血清特異的遺伝子マーカーの感度と特異性の分布。 TPRの本当の肯定的な率;FPRの偽の肯定的な率。 水色(割合が低い)から濃紺(割合が高い)までのグラデーションが表示されます。

ParSNPを使用して1258の代表的な分離株から107の血清を使用して系統樹を構築しました(補足図S1)。 1258分離株は、我々はそれぞれの独立した系統を表すために分離株を選択し、そこから最初の2258分離株の系統発生関係に基づいて選択されました。 我々は、82血清のそれぞれのメンバーが単系統を形成し、24血清はそれぞれ2-4系統で構成された多系統であったことがわかった。 これらの血清中のいくつかは多系統性であることが知られており、血清特異的遺伝子マーカーを含有する可能性は低い(Falush et al., 2006; den Bakker et al. ら、2 0 1 1;Achtman e t a l. ら、2 0 1 2;Timme e t a l., 2013). Serovar Enteritidisは、それ自体がクレードA、BおよびCとして知られている3つの系統で構成されているより大きなEnteritidisクレード内から生じる3つの他のserovar(Dublin、Berta、およびGallinarium)とのパラフィレティックである(Graham et al., 2018). 五つのエンテリチディス特異的候補遺伝子マーカーは,樹木上に別々にクラスタ化されたエンテリチディス分離株に対して陰性であった。

興味深いことに、四つの多系統血清、Bredeney、Kottbus、LivingstoneとVirchowのために、それぞれがその血清のすべての分離株に存在していた一つの候補血清特異的遺伝子を持 残りの20polyphyletic serovarおよびparaphyletic serovar Enteritidisのために、各serovarが複数の系統を含んでいたので、系統特異的な遺伝子マーカーを検索しました。 すべての系統が少なくとも一つの系統特異的遺伝子を含んでいた場合、我々はその血清特異的遺伝子マーカーを含むものとみなします。 111の潜在的な系統特異的遺伝子マーカーの合計は、19ポリフィレティックセロバールとパラフィレティックセロバールEnteritidisのために同定された、その中で27系統特異的遺伝子マーカーは、100%の特異性と感度(FNとFPなし)、76の候補系統特異的遺伝子マーカー14セロバール100%の感度と100%未満の特異性(多様なFP)、および様々なFNとFPと6候補系統特異的遺伝子マーカーを含むEnteritidisを同定した(表1)。テーブル1

www.frontiersin.org

多系統性血清および副系統性血清の系統特異的候補遺伝子マーカー。

FNによるセロバル特異的候補遺伝子マーカーを欠いていた11の82単系統セロバルのために、我々はFNがしばしば一つの枝にグループ化され、他の分離株から先に分岐している分離株によるものであることを発見した。 このようなグループについては、系統特異的遺伝子マーカーを検索した。 したがって、二つ以上の遺伝子マーカーは、血清を同定するために使用することができ、そのような血清はまた、多系統血清と同様に、血清特異的な遺伝子マー Paratyphia,Heidelberg,Muenchenの三つの血清を,系統特異的遺伝子マーカーを組み合わせて同定した。

414候補血清特異的遺伝子マーカーを含む295血清特異的遺伝子マーカーと119系統特異的遺伝子マーカーは、補足表S2に要約されています。 合計では、106の107のserovarsは一つ以上の遺伝子マーカーを含んでいた、33のserovarsは一つの特定の遺伝子を含んでいたが、73は二つ以上の遺伝子マーカーを含んでいた。 単系統チフスのために見つかった候補血清特異的遺伝子マーカーはなく、一つだけの単離を含んでいたスタンリービルの系統IIIのために見つかった潜在的な系統特異的遺伝子マーカーはありませんでした。

血清特異的遺伝子マーカーの機能カテゴリ

すべての414遺伝子マーカーの機能的特性評価RASTを使用して106血清で同定された197は、既知の機能を持っていたと217は、未知の機能を持つ仮説的なタンパク質をコードしていたことがわかった。 注釈を持つ46遺伝子のみが機能カテゴリにグループ化することができ、機能を持つ151遺伝子はRAST機能カテゴリに含まれていませんでした(表2)。 PHASTERを使用しています。 45候補serovar特異的遺伝子マーカーは、予測prophages内に位置していました。テーブル2

www.frontiersin.org

血清特異的遺伝子の機能カテゴリ。

in silico分子血清型決定のための血清特異的遺伝子マーカーの最小セット

多くの血清に対して、複数の候補血清特異的遺伝子マーカーまたは系統特異的遺伝子マーカーが同定された。 これらの場合、最も低いFNおよびFP率を有する単一の遺伝子が選択された。 最低131の遺伝子のマーカーは0からの8.33%に誤り率のserovarsの同一証明を可能にする。 すべての106血清中の遺伝子マーカーの分布は、図2に示すように、対角は、低FPRを示す様々なパーセンテージの他の血清中のこれらの遺伝子の疎な散乱存在を示 これらの遺伝子マーカーの詳細は、補足表S4に記載されていた。 全体的に、45血清は、それぞれの血清特異的遺伝子によって区別することができ、61血清は、遺伝子マーカーの組み合わせによって区別することができる。

図2
www.frontiersin.org

106血清中の131血清特異的遺伝子の最小セットの分布。 Y軸は血清または系統特異的遺伝子マーカーを示し、X軸は血清または系統を示す。 詳細は補足表S4に記載されています。 グレーは、遺伝子(TN)を含むゼロゲノムを示した。 対角に沿った遺伝子/ゲノムペアは、それらの血清(TP)と一致する血清特異的遺伝子マーカーを含むゲノムを表す。 赤は、与えられた血清または系統のゲノムの100%に存在する遺伝子を表す。 遺伝子が血清中の1 0 0%未満に存在する場合には、水色(低い割合)から濃紺(高い割合)への勾配が表示される。 対角に沿った青色の対は、FNの存在を表す。 対角の外側にある青色または赤色の対は、ゲノムの予測血清(F p)と一致しない遺伝子を含む対を表す。

我々は、1089非腸チフス性サルモネラセロバールに属する追加のゲノムをテストし、131特異的遺伝子マーカーが分離株にセロバールを正しく割り当てる能力を評価した。 血清特異的遺伝子マーカーを使用して、1038の1089分離株(95.3%)が正常に割り当てられ、51が失敗した(4.7%)。 SISTRおよびSeqSeroについては、コンコーダント血清割り当ての数は、それぞれ1037(95%)および905(82.8%)であった(補足表S3)。

一般的なセロバールのセロタイピングのためのセロバール特異的遺伝子マーカー

各大陸で見つかったヒト感染を引き起こすトップ20セロバール(Hendriksen et al.,2011)は、46のセロバールの組み合わせリストに崩壊しました(補足表S5). これらのserovarsは、世界的にヒト感染症を引き起こす分離株の大半が含まれていたので、我々は、ローカル設定で最も一般的なserovarsのセロタイピングのための候補 これらの血清のみが考慮されたとき、18のうち46は、血清特異的遺伝子マーカーのいずれかによって一意に同定することができた。 血清特異的遺伝子マーカーがFPRsを変化させている残りの28の一般的な血清中のタイピングの精度を高めるために、我々は潜在的なFPを排除するために131遺伝子マーカー(血清あたり2から9遺伝子に至るまで)のサブセットを使用して検討した。 例えば、Choleraesuis特異的遺伝子とCerro-i系統特異的遺伝子の組み合わせは、CholeraesuisからCerroの偽陽性単離を排除することができ、両方の遺伝子が陽性であれば、単離はCerroに割り当

タイピングにおける潜在的なエラーを推定するために、我々は、領域間の大きな違いを示した46の一般的なセロバールの頻度を考慮に入れた(Hendriksen et al., 2011). したがって、遺伝子の異なる組み合わせは、その領域に存在する血清からの偽陽性結果を特異的に制限するために使用され得る。 所与の領域において、共通の候補血清特異的遺伝子マーカーの特異性は、FPの速度およびその領域における偽陽性血清の頻度を用いて計算された。 候補血清特異的遺伝子マーカーの特異性もまた、FP率を用いて計算した(補足表S4)。 例えば、1 5個の遺伝子のパネルを、オーストラリアで最も頻度の高い1 0個の血清型を入力するために使用することができる(NEPSS2 0 1 0)(表3)。 オーストラリアの地域頻度を考慮した場合、表3に記載されている遺伝子は、実験室ベースのタイピングのマーカーとして使用することができ、誤り率は2.4%表3

www.frontiersin.org

表3に示すように、

オーストラリアで最も頻繁に使用される10のセロバールを入力するためのセロバール特異的遺伝子のパネル。

ディスカッション

サルモネラセロタイピングは、診断とサーベイランスのために不可欠であった。 従来の血清型決定による血清型予測は、表面抗原発現または自己凝集特性の欠如によって制限され得る(Wattiau e t a l., 2008). 近年,全ゲノム配列決定技術の発展に伴い,O抗原に対するrfb遺伝子クラスター,H抗原に対する遺伝子flicおよび遺伝子fljbの関連ゲノム領域,およびMLSTが標的とする遺伝子を抽出し,血清同定に使用することができる。 いくつかの研究は、全ゲノム配列決定に基づくゲノム比較を通じて、血清型決定のための血清特異的遺伝子またはDNA断片を同定している(Zou et al. ら,2 0 1 3,2 0 1 6;Laingら,2 0 1 3,2 0 1 6;Laingら,, 2017). しかし、これらの血清特異的遺伝子またはDNA断片は、少数の血清を区別しただけであった。 本研究では、414候補血清特異的または系統特異的遺伝子マーカー106血清24polyphyletic serovarsとparaphyletic serovar Enteritidisを含むを同定しました。 これらの遺伝子マーカーのサブセットは、独立したゲノムによって検証され、症例の95.3%で血清を正しく割り当てることができた。

上記の分析は、別々の祖先から独立して発生して別々の系統を形成する多系統性血清の存在によって複雑になった。 したがって、系統特異的遺伝子マーカーの組み合わせは、多系統血清の大部分の明確な同定のために必要とされた。 興味深いことに、四つの多系統血清、Bredeney、Kottbus、Livingstone、およびVirchowは、それぞれその血清のすべての分離株に存在していた一つの候補血清特異的遺伝子マーカーを持っていた。 Bredeney血清特異的遺伝子はO抗原変換に関与するトランスロカーゼをコードすると予測され,並行して得られた可能性がある。 他の三つの多系統血清の血清特異的遺伝子は、未知の機能を有する仮説的なタンパク質をコードし、同じ血清の異なる系統におけるそれらの存在の明ら

多系統血清とは異なり、副系統血清腸炎の三つの系統(クレードA、B、およびC)は、最近の共通の祖先を共有しています。 クレードAとCはクレードBの祖先であり、以前の研究では、Enteritidisは”Section Enteritidis”と呼ばれていたserovars Dublin、Berta、Gallinariumとともにクラスター化されていたことが記載されていた(Vernikos et al. ら、2 0 0 7;Achtman e t a l. ら、2 0 1 2;Allard e t a l. ら、2 0 1 3;Timme e t a l., 2013). 別の研究では、全ゲノム系統発生を使用することにより、血清ニトラが腸炎系統内に埋め込まれていることが示された(Deng et al., 2014). また、Ogunremiの研究によれば、EnteritidisとNitraとの間に交差反応性があった(Ogunremi et al., 2017). 我々の研究では、rSTsに基づいて分離株を選択し、この研究が開始されたときにNitraはEnterobase rMLSTデータベースに存在しなかったので、この研究には含まれていなかった。 Gallinariumは、speC遺伝子中の4bp欠失の存在を用いてEnteritidisと区別可能である(Kang et al., 2011). これらの結果は、セロバールが少なくとも一つのユニークな遺伝子によって異なることを十分に発散しなければならないので、アプローチの制限を強調 同様に、遺伝子獲得がほとんどない非常に最近の共有祖先のために区別できなかった他の8つの血清があった。

血清特異的候補遺伝子マーカーまたは系統特異的候補遺伝子マーカー69 106血清のうち、一緒にグループ化された同様の機能を持つゲノム内で連続していた(データ このことは,これらの遺伝子マーカーが水平遺伝子導入によって血清ゲノムに一緒に組み込まれていることを示唆している。 実際に、本研究で同定された7つのチフス菌特異的候補遺伝子マーカー(STM4 4 9 2、STM4 4 9 3、STM4 4 9 4、STM4 4 9 5、STM4 4 9 6、STM4 4 9 7、およびSTM4 4 9 8)は、既知の水平遺伝子導入ホットスポットであるSTM4 4 8 8からSTM4 4 9 8までの遺伝子を含む抱合要素関連領域を統合したチフス菌trnaleuxに位置していた(Bishop e t a l., 2005). 同様に、同定された5つの腸炎特異的候補遺伝子マーカー(SEN1 3 7 9、SEN1 3 8 0、SEN1 3 8 2、SEN1 3 8 3、およびSEN1 3 8 3)は、Sdr i領域に位置していた(Agron e t a l. ら、2 0 0 1)およびプロファージ様GEI/φ se1 4領域(Santiviago e t a l., 2010). これらの領域の両方がprophagesにリンクされている,これらの領域は、グローバルEnteritidisクレードの共通の祖先のゲノムに統合され、水平遺伝子導入に由来したことを示唆している.in silico serovar予測のための他の方法がSeqSeroに実装されている(Zhang et al. ら、2 0 1 5)およびSISTR(Yosida e t a l., 2016). SISTRはまた、全体的な遺伝的関連性を調べるためにcgMLSTスキームを実装しながら、これらの方法の両方が表面抗原の責任ゲノム領域を調べます。 さらに、それに由来する伝統的な7遺伝子MLSTおよびEBURST基も、in silico血清定量に使用することができる(Achtman e t a l. ら、2 0 1 2;Ashton e t a l. ら、2 0 1 6;Robertson e t a l., 2018). SISTRおよびSeqSeroは両方とも従来のserovarの同一証明より高い差別的な力を提供する(Yachison et al., 2017). しかしながら、それらは、同一の抗原式を有する区別できない血清型、または発現されない抗原決定基などの多くの欠点を有する(Robertson e t a l., 2018). 現在の研究では、我々は131serovar特異的遺伝子マーカーのセットに対してゲノムをスクリーニングすることにより、silico serovar予測で検討した。 このアプローチは、個々の血清特異的遺伝子マーカーまたはクエリ分離における遺伝子マーカーの組み合わせの”存在または不在”をもたらすことによって血清 我々は、血清特異的遺伝子マーカーは、最初の同定データセットから91.5%の分離株と正しい血清に割り当てられた検証データセットから84.8%の分離株(ないFNとFP 10.検証データセットからの分離株の5%は、正しい血清血清を含む血清血清の小さなサブセットに割り当てることができます(fpが変化しています)。 Serovar特異的遺伝子マーカーによるin silico serovar予測アプローチの特異性は、我々がテストした同じデータセットでSISTR(95%)とSeqSero(82.8%)よりもわずかに高かった95.3%であった。 この結果は、Yachisonらによって報告されたSISTRおよびSeqSeroの特異性と同様であった。 (2017年)はそれぞれ94.8%、88.2%であった。

私たちの血清特異的遺伝子マーカーベースの方法は、問題のあるO抗原遺伝子クラスターやH抗原遺伝子の配列変動の正確な検査を必要としません。 我々の方法はまた、MLSTまたはCGMLSTベースの方法で必要である全遺伝子またはゲノム配列を組み立てる必要性を軽減する。 したがって、このアプローチは、metagenomicsやculture free typingのような非常に少ない配列が利用可能である場合に有用であり、他の分析を確認するための第三の代替手段を提供する場合に有用である可能性がある。

領域内のすべての流行している血清を一意に識別することができる遺伝子マーカーのセットの同定は、開発分子アッセイにも有用であり得る。

これらのアッセイは、培養物がもはや得られず、伝統的な血清型決定が不可能である血清型決定分離株において有用であろう。 例えば、特定の遺伝子マーカーの高感度な検出を可能にし、したがって臨床試料からの血清の予測を可能にする一組のPCRアッセイを設計することがで さらに、地域で非常にまれに観察されるserovarsを検出する必要性の除去によって地域のすべての主要なserovarsを検出するために必要なこれらの遺伝子のマー

結論

本研究では、in silicoセロタイピングのための潜在的なマーカーとして2258株の代表的な選択のアクセサリーゲノムを特徴付けることにより、106セロ 我々は、ゲノムデータから単離の血清を予測するために、これらの遺伝子マーカーの存在または非存在を使用して、新しい方法を提供するために多系統および ここで同定された遺伝子マーカーはまた、培養独立したメタゲノム法への診断の移動として有用であろう単離された株の非存在下で血清型分析を開発するために使用することができます。

著者の貢献

MPとRLは、研究を設計し、原稿の批判的な改訂を提供しました。 XZおよびMPはバイオインフォマティクス解析を行った。 XZ、MP、およびRLは結果を分析しました。 XZは原稿を起草した。

資金調達

この作業は、国家保健医療研究評議会プロジェクト助成金を支援されました。

利益相反に関する声明

著者らは、この研究は、利益相反の可能性と解釈される可能性のある商業的または財政的関係がない場合に行われたと宣言している。

補足資料

この記事の補足資料はオンラインで見つけることができます: https://www.frontiersin.org/articles/10.3389/fmicb.2019.00835/full#supplementary-material

図S1|ParSNPによって構築されたSNPベースの系統樹は、1344の代表的な分離株を使用して、1258の分離株を含む107の分離株と86の分離株を使用して、5rst未満の分離株を使用して、それ以外の場合は研究から除外された。

表S1|2258の高品質で一貫性のある血清型予測ゲノムの最終データセット107血清型を表します。

表S2|295の血清特異的遺伝子および119の系統特異的遺伝子を含む414の候補血清特異的遺伝子の合計。

表S2/295の血清特異的遺伝子および119の系統特異的遺伝子を含む414の候補血清特異的遺伝子。

表S3|SISTR、SeqSeroおよびserovar特異的遺伝子マーカーによるserovar予測結果を有する追加の1089検証分離株。

表S4|106セロバールの同定のための131個の遺伝子の最小値。

表S5|65の一般的なセロバールの同定のための遺伝子のセット46。

データS1|131serovar特異的遺伝子マーカーの配列。

省略形

FN,偽陰性;FP,偽陽性;FPR,偽陽性率; MLST、マルチローカスシーケンスタイピング;NEPSS、国立腸病原体サーベイランススキーム;PPV、陽性予測値;rsts、リボソームMLST STs;SISTR、サルモネラin silicoタイピングリソース;TN、真陰性;TNR、真陰性率;TP、真陽性;TPR、真陽性率。

Footnotes

  1. ^ https://www.ebi.ac.uk/ena
  2. ^ http://bioinf.spbau.ru/spades
  3. ^ http://bioinf.spbau.ru/quast
  4. ^ http://github.com/marbl/harvest
  5. ^ https://www.ncbi.nlm.nih.gov/
  6. ^ http://rast.theseed.org/FIG/rast.cgi

Achtman, M., Wain, J., Weill, F.-X., Nair, S., Zhou, Z., Sangal, V., et al. (2012). Multilocus sequence typing as a replacement for serotyping in Salmonella enterica. PLoS Pathog. 8:e1002776. doi: 10.1371/journal.ppat.1002776

PubMed Abstract | CrossRef Full Text | Google Scholar

Agron, P. G., Walker, R. L., Kinde, H., Sawyer, S. J., Hayes, D. C., Wollard, J., et al. (2001). Identification by subtractive hybridization of sequences specific for Salmonella enterica serovar Enteritidis. Appl. Environ. Microbiol. 67, 4984–4991. doi: 10.1128/AEM.67.11.4984-4991.2001

PubMed Abstract | CrossRef Full Text | Google Scholar

Alikhan, N.-F., Zhou, Z., Sergeant, M. J., and Achtman, M. (2018). サルモネラ菌の集団構造のゲノムの概要。 プロスジェネ… 14:e1007261. doi:10.1371/ジャーナル。プゲン1007261

PubMed Abstract|CrossRef Full Text|Google Scholar

Allard,M.W.,Luo,Y.,Strain,E.,Pettengill,J.,Timme,R.,Wang,C.,et al. (2013). サルモネラEnteritidis PFGEパターンJEGX01の分離株間の進化の歴史、集団遺伝学と多様性について。 0004. PLoS One8:e55254. doi:10.1371/ジャーナル。ポネ0055254

PubMed Abstract|CrossRef Full Text|Google Scholar

Arndt,D.,Grant,J.R.,Marcu,A.,Sajed,T.,Pon,A.,Liang,Y.,et al. (2016). PHASTER:PHASTファージ検索ツールのより良い、より高速なバージョン。 核酸Res.44,W16-W21. doi:10.1093/nar/gkw387

PubMed Abstract|CrossRef Full Text/Google Scholar

Ashton,P.M.,Nair,S.,Peters,T.M.,Bale,J.A.,Powell,D.G.,Painset,A.,et al. (2016). 全ゲノムシークエンシングを用いた公衆衛生サーベイランスのためのサルモネラの同定。 4:e1752. ドイ:10.7717/peerj.1752

PubMed Abstract|CrossRef Full Text|Google Scholar

Aziz,R.K.,Bartels,D.,Best,A.A.,DeJongh,M.,Disz,T.,Edwards,R.A.,et al. (2008). RASTサーバー:サブシステム技術を使用した迅速な注釈。 BMCゲノミクス9:75. doi:10.1186/1471-2164-9-75

PubMed Abstract|CrossRef Full Text|Google Scholar

Bankevich,A.,Nurk,S.,Antipov,D.,Gurevich,A.A.、Dvorkin、M.、Kulikov、A.S.、et al。 (2012). スペード:新しいゲノムアセンブリアルゴリズムと単一細胞シークエンシングへの応用。 J.Computat. バイオル 19, 455–477. ドイ:10.1089/cmb.2012.0021

PubMed Abstract|CrossRef Full Text|Google Scholar

Bishop,A.L.,Baker,S.,Jenks,S.,Fookes,M.,Gaora,P.Ó,Pickard,D.,et al. (2005). TRNAleuXに関連するsalmonella entericaゲノムの超可変領域の解析。 J.Bacteriol. 187, 2469–2482. 土井:10.1128/JB.187.7.2469-2482.2005

PubMed Abstract | CrossRef Full Text | Google Scholar

Cai, H., Lu, L., Muckle, C., Prescott, J., and Chen, S. (2005). Development of a novel protein microarray method for serotyping Salmonella enterica strains. J. Clin. Microbiol. 43, 3427–3430. doi: 10.1128/JCM.43.7.3427-3430.2005

PubMed Abstract | CrossRef Full Text | Google Scholar

den Bakker, H. C., Switt, A. I. M., Govoni, G., Cummings, C. A., Ranieri, M. L., Degoricija, L., et al. (2011). ゲノムシークエンシングは、病原性因子含量の多様化とサルモネラエンテリカの明確な亜集団におけるホスト適応の可能性を明らかにする。 BMC Genomics12:425. doi:10.1186/1471-2164-12-425

PubMed Abstract|CrossRef Full Text|Google Scholar

Deng,X.,Desai,P.T.,den Bakker,H.C.,Mikoleit,M.,Tolar,B.,Trees,E.,et al. (2014). 一般的な系統の集団構造に基づくSalmonella enterica serotype Enteritidisのゲノム疫学。 エメログ 感染した Dis。 20, 1481–1489. ドイ:10.3201/eid2009.131095

PubMed Abstract | CrossRef Full Text | Google Scholar

Falush, D., Torpdahl, M., Didelot, X., Conrad, D. F., Wilson, D. J., and Achtman, M. (2006). Mismatch induced speciation in Salmonella: model and data. Philos. Trans. R. Soc. Lond. B Biol. Sci. 361, 2045–2053. doi: 10.1098/rstb.2006.1925

PubMed Abstract | CrossRef Full Text | Google Scholar

Fitzgerald, C., Collins, M., van Duyne, S., Mikoleit, M., Brown, T., and Fields, P. (2007). 共通のサルモネラの血清群の分子決定のための多重、ビードベースの懸濁液の配列。 J.Clin. ミクロビオール 45, 3323–3334. 土井:10.1128/JCM.00025-07

PubMed Abstract|CrossRef Full Text/Google Scholar

Graham,R.M.,Hiley,L.,Rathnayake,I.U.,And Jennison,A.V.(2018). 比較ゲノミクスは、クイーンズランド州、オーストラリアからS.Enteritidisの明確な系統を識別します。 PLoS One13:e0191042. doi:10.1371/ジャーナル。ポネ0191042

PubMed Abstract|CrossRef Full Text/Google Scholar

Guo,D.,Liu,B.,Liu,F.,Cao,B.,Chen,M.,Hao,X.,et al. (2013). すべての46サルモネラo血清群の分子同定のためのDNAマイクロアレイの開発。 AEM79、3392-3399。 ドイ:10.1128/AEM。00225-13

PubMed Abstract|CrossRef Full Text/Google Scholar

Gurevich,A.,Saveliev,V.,Vyahhi,N.,And Tesler,G.(2013). QUAST:ゲノムアセンブリのための品質評価ツール。 バイオインフォマティクス29,1072-1075. 土井:10.1093/バイオインフォマティクス/btt086

PubMed Abstract|CrossRef Full Text/Google Scholar

Hendriksen,R.S.,Vieira,A.R.,Karlsmose,S.,Lo,Fo Wong,D.M.,Jensen,A.B.,et al. (2011). 世界保健機関global foodborne infections network country data bankからのサルモネラ菌血清分布のグローバルモニタリング:2001年から2007年までの品質保証研究所の結果。 食性は動物食。 Dis。 8, 887–900. ドイ:10.1089/fpd.2010.0787

PubMed Abstract|CrossRef Full Text/Google Scholar

Kang,M.-S.,Kwon,Y.-K.,Jung,B.-Y.,Kim,A.,Lee,K.-M.,An,B.-K.,et al. (2011). サルモネラエンテリカ亜属の鑑別同定。 enterica serovar Gallinarum biovars GallinarumおよびPullorumは、glgCおよびspeC遺伝子の多型領域に基づいています。 獣医さん ミクロビオール 147, 181–185. ドイ:10.1016/j.vetmic.2010.05.039

PubMed Abstract|CrossRef Full Text|Google Scholar

Kingsley,R.A.,and Bäumler,A.J.(2000). 宿主の適応と感染症の出現:サルモネラパラダイム。 モル ミクロビオール 36, 1006–1014. ドイ:10.1046/j.1365-2958.2000.01907.pubmed Abstract|CrossRef Full Text|Google Scholar

Laing,C.R.,Whiteside,M.D.,and Gannon,V.P.(2017). サルモネラエンテリカ種の汎ゲノム解析、および種、亜種、およびserovarの予測ゲノムマーカーの同定。 フロント ミクロビオール 8:1345. ドイ:10.3389/fmicb.2017.01345

PubMed Abstract/CrossRef Full Text/Google Scholar

Le Minor,L.,and Bockemühl,J.(1984). サプレメントNO XXVII au schéma de Kauffmann-White. アン パスツール-マイクロバイオール研究所 135, 45-51. doi:10.1016/S0769-2609(84)80042-3

CrossRef全文/Google Scholar

Le Minor,L.,Popoff,M.,And Bockemühl,J.(1990). 1989(n°33)をカウフマン=ホワイトスキームに補足する。 マイクロバイオロース社。 141, 1173-1177. 土井:10.1016/0923-2508(90)90090-D

CrossRef全文/Google Scholar

McQuiston,J.,Parrenas,R.,Oriz-Rivera,M.,Gheesling,L.,Brenner,F.,and Fields,P.I.(2004). サルモネラ由来のフラジェリン遺伝子fliC、fljB、およびflpAの配列決定および比較分析。 J.Clin. ミクロビオール 42, 1923–1932. 土井:10.1128/JCM.42.5.1923-1932.2004

PubMed Abstract|CrossRef Full Text|Google Scholar

Ogunremi,D.,Nadin-Davis,S.,Dupras,A.A.,Márquez,I.G.,Omidi,K.,Pope,l.,et al. (2017). 小売りおよび食肉処理場のサンプルを使用してSalmonella serovars enteritidisおよびtyphimuriumの同一証明のための多重PCRの試金の評価。 J.Food Prot. 80, 295–301. doi:10.4315/0362-028X.JFP-16-167

PubMed Abstract|CrossRef Full Text|Google Scholar

Page,A.J.,Cummins,C.A.,Hunt,M.,Wong,V.K.,Reuter,S.,Holden,M.T.,et al. (2015). Roary:迅速な大規模な原核生物panゲノム解析。 バイオインフォマティクス31,3691-3693. 土井:10.1093/bioinformatics/btv421

PubMed Abstract | CrossRef Full Text | Google Scholar

Popoff, M. Y., Bockemühl, J., and Gheesling, L. L. (2004). Supplement 2002 (no. 46) to the Kauffmann–White scheme. Res. Microbiol. 155, 568–570. doi: 10.1016/j.resmic.2004.04.005

PubMed Abstract | CrossRef Full Text | Google Scholar

Robertson, J., Yoshida, C., Kruczkiewicz, P., Nadon, C., Nichani, A., Taboada, E. N., et al. (2018). Salmonella in silico typing resource(SISTR)を使用して、公開配列データベースで利用可能なサルモネラ全ゲノム配列データの品質の包括的な評価。 ミクロブ… ゲノミクスdoi:10.1099/mgen。0.000151 .

PubMed Abstract|CrossRef Full Text/Google Scholar

Santiviago,C.A.,Blondel,C.J.,Quezada,C.P.,Silva,C.A.,Tobar,P.M.,Porwollik,S.,et al. (2010). Salmonella enterica serovar Enteritidis特異的欠陥prophage様要素φse14の自発的切除。 J.Bacteriol. 192, 2246–2254. 土井:10.1128/JB.00270-09

PubMed Abstract | CrossRef Full Text | Google Scholar

Schneider, S., Roessli, D., and Excoffier, L. J. U. (2000). Arlequin: A Software for Population Genetics Data Analysis, Vol. 2. Geneva: Genetic and Biomedical Laboratory, 2496–2497.

Google Scholar

Seemann, T. (2014). Prokka: rapid prokaryotic genome annotation. Bioinformatics 30, 2068–2069. doi: 10.1093/バイオインフォマティクス/btu153

PubMed Abstract|CrossRef Full Text/Google Scholar

Timme,R.E.,Pettengill,J.B.,Allard,M.W.,Strain,E.,Barrangou,R.,Wehnes,C.,et al. (2013). 腸内病原体Salmonella enterica subspの系統発生的多様性。 ゲノムワイドの参照フリー SNP文字から推論されたenterica。 ゲノムバイオール エヴォル 5, 2109–2123. doi:10.1093/gbe/evt159

PubMed Abstract|CrossRef Full Text|Google Scholar

Treangen,T.J.,Ondov,B.D.,Koren,S.,And Phillippy,A.M. (2014). 何千もの種内微生物ゲノムの迅速なコアゲノムアライメントと可視化のためのHarvest suite。 ゲノムバイオール 15:524. ドイ:10.1186/s13059-014-0524-x

Pubmed Abstract|CrossRef Full Text/Google Scholar

Vernikos,G.S.,Thomson,N.R.,And Parkhill,J.(2007). サルモネラ菌の系統における時間の経過に伴う遺伝的フラックス。 ゲノムバイオール 8:R100 doi:10.1186/gb-2007-8-6-r100

PubMed Abstract/CrossRef Full Text/Google Scholar

Wattiau,P.,Boland,C.,And Bertrand,S.(2011). Salmonella enterica ssp enterica subtypingのための方法論:金の標準および代わり。 Appl. エンビロン ミクロビオール 77, 7877–7885. ドイ:10.1128/AEM。05527-11

PubMed Abstract|CrossRef Full Text/Google Scholar

Wattiau,P.,Van Hessche,M.,Schlicker,C.,Vander Veken,H.,And Imberechts,H.J.(2008). 一般的なサルモネラ菌enterica serovarsのルーチン同定のための古典的なセロタイピングとPremiTestアッセイの比較。 J.Clin. ミクロビオール 46, 4037–4040. 土井:10.1128/JCM.01405-08

PubMed Abstract|CrossRef Full Text|Google Scholar

Yachison,C.A.,Yoshida,C.,Robertson,J.,Nash,J.H.,Kruczkiewicz,P.,Taboada,E.N.,et al. (2017). 検証と国立サルモネラレファレンスラボラトリーの伝統的なセロタイピングの代替として全ゲノム配列決定を使用しての意味。 フロント ミクロビオール 8:1044. ドイ:10.3389/fmicb.2017.01044

PubMed Abstract|CrossRef Full Text|Google Scholar

吉田、C.E.、Kruczkiewicz、P.、Laing、C.R.、Lingohr、E.J. ら、gannon,V. (2016). Salmonella in silico typing resource(SISTR):サルモネラゲノムアセンブリを迅速にタイピングし、サブタイピングするためのオープンなwebアクセス可能なツールです。 PLoS One11:e0147101. doi:10.1371/ジャーナル。ポネ0147101

PubMed Abstract|CrossRef Full Text|Google Scholar

Zhang,S.,Yin,Y.,Jones,M.B.,Zhang,Z.,Kaiser,B.L.D.,Dinsmore,B.A.,et al. (2015). ハイスループットゲノムシーケンスデータを利用したサルモネラ血清型決定。 J.Clin. ミクロビオール 53, 1685–1692. 土井:10.1128/JCM.00323-15

PubMed Abstract|CrossRef Full Text/Google Scholar

Zou,Q.-H.,Li,R.-Q.,Liu,G.-R.,And Liu,S.-L.(2016). 系統特異的遺伝子を有するサルモネラのジェノタイピング:血清タイピングとの相関。 Int. J.インフェクトス… Dis。 49, 134–140. 土井:10.1016/j.ijid.2016.05.029

Pubmed Abstract|CrossRef Full Text|Google Scholar

Zou,Q.-H.,Li,R.-Q.,Wang,Y.-J.,Liu,S.-L.(2013). 密接に関連するサルモネラ菌の系統を区別するための遺伝子の同定。 PLoS One8:e55988. 土井:10.1371/journal.pone.0055988

PubMed Abstract | CrossRef Full Text | Google Scholar