Articles

다양성 및 진흥 Pandoraviridae 가족

환경 샘플링 및 분리 pandoravirus 종자

우리는 우리 사용되는 동일 분리 프로토콜의 P.salinus 및 P.dulcis5. 그것은 다른 환경 미생물(특히 박테리아 및 곰팡이)의 성장을 억제하기에 충분히 높은 항생제 농도에 적응 된 아칸 타 메바의 문화와 샘플링 된 물질을 혼합하는 것으로 구성됩니다. 샘플을 항구 아칸 타 메바 세포에 민감한 습한 환경에서 무작위로 채취했습니다. 이것은 세 가지 새로운 판도라 바이러스 균주의 분리로 이어졌다:피.케르 쿠스;피.네오 칼레도니아;및 피.맥 클레오 덴 시스(표 1,방법 참조). 그들은 보존 된 기능 및 신흥 판도 라비 리다과 가족의 다양성을 평가 시작 하는 적절 한 발산을 전시 한다. 적절한 경우,우리의 분석에는 아칸 타 메바 각화염 환자로부터 독일 실험실에서 분리 된 피 이노 피나 텀의 데이터도 포함됩니다 7.본 연구에서 사용된 판도라바이러스 분리물에 대한 표 1 데이터 복제 주기 및 비리온 미세구조물에 대한 연구는 카스텔라니 배양에 접종된 정제된 입자로부터 시작하여 각각의 감염 주기를 분석했다.광선 및 투과 전자 현미경(초박형 섹션)을 사용하여 분리하십시오. 이전에 피 살리 누스와 피 둘 시스에 대해 관찰 된 바와 같이,이 새로운 판도라바이러스의 복제 주기는 평균 12 시간(가장 빠른 피에 대해 8 시간)지속되는 것으로 나타났습니다. 네오 칼레도니아). 감염 과정은 모든 바이러스에 대해 동일하며,아칸 타 메바 세포에 의한 개별 입자의 내면화로 시작됩니다. 그들의 정점 기공이 열린 후,입자(“판도 라비 리온”)는 비리 온 내부 막과 파고솜의 융합을 통해 반투명 한 내용물을 세포질로 전달합니다. 감염의 초기 단계는 모든 격리를 위해 현저하게 유사합니다. 우리는 이전에 세포 핵 감염 사이클 5 의 후반 단계 동안 완전히 중단 되었다 보고,새로운 변종의 철저 한 관찰 밝혀 신 합성 입자 세포의 세포질에 여전히 핵소체는 더 이상 인식할 수 있는 핵 같은 구획을 전시(보충 그림. 1). 감염 후 8 시간 동안 성숙한 비리 온은 액포에서 볼 수있게되었고 엑소 사이토 시스(보충 영화)를 통해 방출됩니다. 모든 분리에 대해 복제 사이클은 세포 용해 및 약 100 개의 입자의 방출로 끝납니다(그림 2). 1).2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 판도라바이러스가 분리되면,판도라바이러스가 분리됩니다. 세포 용해 이전의 환경 샘플로부터 판도라 바이러스 마클레오덴시스 비리온의 카스텔라니 세포에 의한 과잉 생산. 환경 박테리아는 피.맥 클레오 덴 시스 비리 온과 함께 배양 배지에서 볼 수 있습니다. (스케일 바는 10,000,000,000 입니다). 카스텔라니 세포 감염 초기 단계에서 피.네오 칼레도니아. 아메바 의사 포드는 주변의 비리온을 삼킬 준비가되어 있습니다. 10 분 파이,비리 온은 휩싸이고 액포에 있습니다(스케일 바는 500 나노 미터). 2014 년 12 월 15 일(토)~2015 년 12 월 15 일(토)~2015 년 12 월 15 일(일) 디 시스템 초기 피 케르 쿠스 비리 온의 초박형 섹션의 이미지. (스케일 바는 500 나노 미터). 다른 균주에서 성숙한 입자의 구조는 눈에 띄는 차이를 나타내지 않는르커스는 정제된 입자로부터 제조되었고,파비오 또는 일루미나 플랫폼을 사용하여 시퀀싱되었다(방법 참조). 2012 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 12 월 15 일,2013 년 그들의 반투명 양손 잡이 모양의 입자에 추가(그림. 1),평균보다 높은 지+씨 콘텐츠 및 게놈 거만증 따라서 판도 라비 리다과 5,8 에 의해 공유되는 특징적인 특징으로 남아 있습니다. 데이터베이스 호모 로그없이 단백질을 코딩하는 바이러스 유전자의 높은 비율을 감안할 때,순전히 초기 계산 접근법(즉,”오핑”및 코딩 성향 추정치)을 기반으로 한 유전자 예측은 악명 높게 신뢰할 수 없으므로 임의의 매개 변수(예:최소한의 열린 읽기 프레임)의 다른 값을 사용하는 팀 간의 불일치로 이어집니다. 예를 들어,진핵 생물을 감염시키는 큰 유전자 바이러스의 가족 중 평균 단백질 코딩 유전자 밀도는 335 혈압마다 하나의 유전자에서 변한다고합니다.: 이 유전자는 박테리아(예:박테리아)와 같은 모든 유전자에 대해 명확하게 일치합니다. 결과적으로 많은 유전자가 과도하게 예측되는 상황과 많은 실제 유전자가 간과되는 상황 사이에서 진동합니다. 어떤 유전자가”진짜”인지에 대한 이러한 불확실성은 비교 게놈 분석과 진화 가설의 후속 테스트에서 중요한 소음을 소개합니다. 또한,계산 방법은 대부분 비 단백질 코딩 성적 증명서로 표현 하는 유전자에 맹인.위의 한계를 극복 하기 위해,우리는 가닥 특정 유전자-서열 실험 및 입자 프로테옴 분석,게놈 시퀀스에 매핑 된 결과 수행. 실험적 증거(또는 단백질 유사성)에 의해 뒷받침되는 유전자 만이 엄격한 재연 프로토콜에 유지되었습니다(방법,보충 그림 1 참조). 2). 한편,이 새로운 절차는 예측 된 단백질 세트를 감소 시켰고,다른 한편으로는 예기치 않은 많은 수의 비 코딩 성적표를 발견 할 수있었습니다(표 1).검증 된 단백질 코딩 유전자의 새로운 세트는 100 잔기보다 짧은 오프의 강하게 감소 된 비율을 나타내며,대부분은 각 판도라 바이러스 균주에 고유합니다(보충 그림 2). 3). 엄격한 주석 절차는 또한 코돈 적응 지수(카이)값(보충도. 3).일관성을 위해,우리는 엄격한 주석 프로토콜을 피.이노 피나 툼 과 피.맥 클레오 덴 시스,추가 비교에서 고려 된 예측 단백질 수를 줄입니다(방법,표 1 참조). 예상대로,표준 대 엄격한 유전자 예측 사이의 불일치는 단지 작은 오프(길이=300 뉴클레오티드)의 과잉 예측 때문입니다. 이러한 임의의 유전자는 무작위로 발생하는 경향이 있습니다 지+씨-풍부한 시퀀스 내에서 정지 코돈(타아,태그,및 티가)의 비 코딩 영역에서보다 우연히 발생할 가능성이 적습니다. 실제로,위의 표준 및 엄격한 주석 프로토콜은+티 리치(74.8%)메가 바이러스 칠레 시스 게놈 3 은 예측 대 검증 된 단백질 코딩 유전자(1120 대 1108)의 두 가지 매우 유사한 세트를 초래했습니다. 이 컨트롤은 우리의 엄격한 주석 단순히 포기 결국 올바른 유전자 예측 임의 상승 신뢰 임계값,하지만 구체적으로 지+씨 풍부한 구성에 의해 유도 된 오류를 수정 하 여 나타냅니다. 그러나 생물 과학과 같은 다른 분야에 대한 어플리케이션도 있습니다.. 그러나,우리의 엄격한 재연 후에도 판도 라비 리다과 가족 이외의 중요한 서열 유사성이없는 예측 단백질의 분율이 상당히 높다는 것을 알아 차릴 가치가 있습니다(67 에서 73%,보충 그림. 4).판도라 바이러스 게놈의 정확한 주석에 대한 추가 과제는 인트론의 존재입니다(오르 팬을 방해 할 때 계산 방법으로 거의 감지 할 수 없음). 이 서열은 1980 년대 초반부터 1980 년대 초반부터 1980 년대 초반부터 1980 년대 초반부터 1980 년대 초반부터 1980 년대 초반부터 1980 년대 초반부터 1980 년대 초반까지 계속되었다. 네오 칼레도니아는 검증 된 단백질 코딩 유전자의 7.5–13%에서 스플 리세 오솜 인트론을 검출 할 수있었습니다. 이 인트론은 입자에서 검출 된 200 개의 가장 풍부한 단백질을 코딩하는 유전자 중 평균 14 개의 유전자를 포함하여 코딩 서열뿐만 아니라 번역되지 않은 영역에서 발견되었습니다(아래 참조). 스플 리세 오솜 인트론은 클로로 바이러스 9 와 같은 핵상을 가진 다른 바이러스에서 발견되지만,판도라바이러스는 스플 리세 오솜 인트론이 유전자의 10%이상에 대해 검증 된 유일한 바이러스입니다. 이러한 결과는 판도라 바이러스 성질의 적어도 일부가 숙주 핵 기계에 의해 합성되고 처리된다는 우리의 이전 제안을 뒷받침합니다. 그러나 바이러스 유전자 당 인트론 수는 숙주 유전자(평균 10 에서 6.2)보다 훨씬 낮습니다(평균 약 1.2). Pandoravirus 유전자는 또한 전시 Utr 두 배 긴(보조 표 1)으로 사람들의 Mimiviridae11.157-268)긴 비 코딩 성적 증명서(표 1,자세한 통계를위한 보충 표 1)의 예기치 않은 발견으로 이어졌다. 이 꼬리는 다발 꼬리를 나타내며 그 중 약 4%는 스플 라이스 솜 인트론을 포함합니다. 단백질 코딩 유전자의 역 가닥에서 가장 자주 전사 하는 동안 작은 분획 간(즉,간-오 르 프)영역(보충 그림 2)에서 표현 됩니다. 5). 이러한 비 코딩 성적표는 판도라 바이러스 유전자 발현의 조절에 역할을 할 수 있습니다.판도라 바이러스 게놈의 전체 82.7–87%가 전사되었지만 62-68.2%만이 단백질로 변환됩니다. 이러한 값은 다른 가족의 거대 바이러스(예:미미 바이러스 11 게놈의 90%가 번역 됨)보다 훨씬 낮으며,부분적으로 판도라 바이러스 유전자의 측면에있는 더 큰 유타로 인해 발생합니다.위의 엄격한 주석에서 얻은 6 개의 단백질 코딩 유전자 세트 다음 판도 라비 리다과 가족의 특정 기능을 식별 하는 것을 목표로 전체 게놈 비교에 대 한 참조로 사용 되었다. 시퀀스 유사성 기반 클러스터링(방법 참조)에 따라 다양한 균주의 유전자 내용의 상대적 겹침이 계산되었습니다(그림 1). 2 에이),우리는”단백질 클러스터”로 참조 무엇을 생산.2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 판도라바이러스 유전자내용의 비교. 공유 단백질 클러스터의 모든 조합의 분포가 표시됩니다. 삽입 집합은 다음에 의해 공유되는 클러스터 및 유전자의 수를 요약합니다 6, 5, 4, 3, 2, 그리고 1 판도 라 바이러스. 비 코어 게놈 과 팬-게놈 6 개의 사용 가능한 판도라 바이러스에서 추정. 추정 힙 법칙(1)는 개방형 팬 유전체 50 의 특징이며 고유 유전자 51 의 많은 부분의 유동성 매개 변수 값 특성입니다. 상자 그림에는 중앙값,25 번째 및 75 번째 백분위수가 표시됩니다. 그런 다음 공유(즉,공유)의 수를 계산했습니다.,”코어”)및 총 유전자 우리가 점진적으로 가족 핵심 유전자 세트의 크기와 액세서리/유연한 유전자 세트의 크기를 추정하기 위해 위의 분석에 다양한 분리 물의 게놈을 통합했습니다. 6 개의 사용 가능한 분리 물이 455 개의 다른 단백질 클러스터를 코딩하는 핵심 게놈을 묘사하기에 충분하게 나타난다면,전체 유전자 세트로 이어지는”포화 곡선”은 판도 라비 리다과 팬 게놈이 열려 있음을 시사하며,각각의 추가 분리 물은 50 개 이상의 추가 유전자를 기여할 것으로 예측됩니다(그림 2). 2 비). 이것은 추가적인 판도 라비 리다과 분리 물의 분석에 의해 확인되어야한다.그런 다음 단백질 서열 유사성과 게놈 위치 측면에서 공유 유전자 내용을 분석하여 6 개의 판도라 바이러스 분리의 글로벌 유사성을 조사했습니다. 서로 다른 판도라 바이러스 분리 물 사이의 쌍별 유사성은 직교 유전자의 단백질 생성물의 수퍼 정렬로 계산 된 바와 같이 54~88%범위입니다(보충 표 2). 동일한 데이터로 계산 된 계통 발생 트리는 판도 라 바이러스를 두 개의 분리 된 클래드로 클러스터링합니다(그림 1). 3).2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 본 발명은 판도라비리다과 계열의 계통발생학적 구조에 관한 것이다. 리샘플링에서 추정된 부트스트랩 값은 모두 1 과 같으므로 보고되지 않았습니다. 두 개의 분리 된 클래드에 대해 동의어가 아닌 동의어 대체율 비율(0)을 계산했으며 크게 다릅니다(스케일 바는 0 입니다.지리적 맥락에서 해석,이 클러스터링 패턴은 신흥 가족의 두 가지 중요한 특성을 전달한다. 한편,가장 발산 균주는 가장 먼 위치에서 분리 된 균주가 아닙니다(예:칠레 피 살리누스 대 프랑스 피 케르 쿠스;네오 칼레도니아 피 네오 칼레도니아 대 호주 피 맥 클레오 덴 시스). 반면에 두 개의 분리 물(예:피 둘시스 대 피. 동일한 환경(700 미터 떨어져 있고 작은 물 흐름으로 연결된 두 개의 연못)의 맥 클레오 덴 시스)는 상당히 다릅니다. 판도라비리다과의 대규모 인벤토리를 기다리는 동안,이 결과는 이미이 가족의 구성원이 비슷한 지역 및 글로벌 다양성으로 전세계에 분포되어 있음을 시사합니다.다양한 게놈에서 상동 유전자의 위치를 분석 한 결과,서열 발산(보충 표 2)에도 불구하고 직교 유전자의 80%가 동일 선상에 남아 있음이 밝혀졌습니다. 도에 도시 된 바와 같이. 4,판도라 바이러스 게놈의 장거리 아키텍처(즉,,직교 유전자의 위치에 따라)는 크기(1.83–2.47 메가 바이트)의 차이에도 불구하고 전 세계적으로 보존됩니다. 그러나 판도라 바이러스 염색체의 절반(그림 1 에서 가장 왼쪽 영역)은 2011 년에 발견되었습니다. 4)호기심이 아닌 상동 세그먼트의 대부분이 발생하는 다른 절반보다 진화 더 안정적인 나타납니다. 이러한 세그먼트 변형 특정 유전자를 포함 하 고 비 직교 안 키 린,아침,및 에프 박스 모티브 포함 단백질의 탠덤 중복에서 농축 됩니다. 반대로,게놈의 안정한 절반은 판도 라비 리다과 코어 게놈을 구성하는 대부분의 유전자를 집중시킵니다(그림 1 의 상단). 4). 흥미롭게도,다른 균주에서 네오 칼레도니아의 염색체를 구별하는 국소 반전은 안정된 영역과 불안정한 영역 사이의 경계 근처에 위치하고 있으며,이 전환과 연결될 수 있습니다(우연 일 수도 있음). 마지막으로,모든 게놈은 양쪽 사지에서 변형 특이 적 유전자(및/또는 중복)도 풍부합니다.2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 판도라바이러스 게놈의 공선성. 핵심 유전자의 누적 주파수는 상단에 표시됩니다. 보존 동일 선상 블록은 모든 바이러스에서 같은 색으로 착색된다. 그런 다음 표준 광범위한 기능 범주(그림 1)중에서 예측 된 단백질의 분포를 분석했습니다. 5). 그것은 지금 크고 거 대 한 진 핵 생물 유전자 바이러스에 대 한 재발,지배적인 범주는 지금까지 인식할 수 있는 기능 서명 부족 하는 단백질. 6 개의 균주에 걸쳐 예측 된 단백질의 평균 70%가”알려지지 않은 기능”에 해당합니다. 이러한 높은 비율은 신중하게 검증 된 유전자 세트에 적용되므로 더욱 주목할 만합니다. 따라서 이러한 바이러스 단백질의 대다수가 이전에 특성화 된 경로와 연결될 수 없다는 것은 생물학적 현실입니다. 놀랍게도,그러한 익명 단백질의 비율은 판도라 바이러스 코어 게놈의 생성물 중에서 상당히 높은(65%),즉 6 개의 이용 가능한 균주(그리고 아마도 미래의 모든 가족 구성원)가 공유하는 필수 유전자 중 하나입니다. 2 비). 흥미롭게도,이 비율은 바이러스 입자를 구성하는 것으로 검출 된 단백질 중에서 매우 높습니다(80%). 또한 익명 단백질의 비율은 각 균주에 고유 한 유전자의 분류를 95%이상으로 완전히 지배합니다. 가장 일반적인 기능 범주 인”단백질–단백질 상호 작용”은 매우 빈번하고 정보가없는 모티프(예:안 키린 반복)의 검출에 해당하는 다음으로 큰(11.7~18.9%)입니다. 전반적으로,진정으로 유익한 기능이 기인 할 수있는 판도라 바이러스 단백질의 비율은 20%입니다.2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 5

figure5

기능성 주석.

우리는 다음 두 가지 조사 진화하는 프로세스 가능한 원산지의 여분 큰 크기의 pandoravirus 유전자:수평한 유전자의 전송(하이츠)및 유전자 중복. “일반”바이러스에 비해 아메바 감염 바이러스의 게놈 크기를 설명 하기 위해 자주 호출 했다 12,13. 우리는 판도라 바이러스 단백질의 최대 1/3 이 3 개의 세포 도메인(유카리아,고세균 및 유 박테리아)또는 기타 바이러스(보충 그림 1)의 단백질과 판도라 바이러스 유사성(판도라 바이러스 계열 외부)을 나타냄을 계산했습니다. 4). 그러나 이러한 유사성은 이들 유전자가 수평 적으로 획득되었다는 것을 의미하지는 않습니다. 그들은 또한 공통 조상 기원 또는 판도라 바이러스에서 다른 미생물로의 전이를 나타낼 수 있습니다. 우리는 개별적으로 그들의 가능성이 기원을 추론하기 위해 이러한 경우의 각각의 계통 발생 위치를 분석: 조상-세포 또는 바이러스 동족체의 클러스터 외부에서 발견 된 경우;수평 적으로 획득 된—위의 클러스터에 깊이 포함 된 것으로 발견 된 경우;또는 반대 상황에서 세포 유기체 또는 관련없는 바이러스로 수평으로 옮겨졌습니다(즉,판도라 바이러스 단백질 클러스터 내에 놓여있는 세포 단백질). 보충 그림. 도 6 은 이 분석의 결과를 요약한다.우리는 39%의 사례에 대해 명확한 진단을 내릴 수 있었고,나머지는 결정 불가능하거나 조상의 기원과 호환 될 수 있습니다. 이 중 49%는 판도라바이러스에 의한 수평적 이득을,51%는 판도라바이러스로부터의 유전자 전달을 제안했다. 흥미롭게도,호스트 유전자,일반적으로 바이러스의 진화에 중요 한 호출 하는 프로세스의 인수만 대표 작은 비율(13%),따라서 호스트에 바이러스 보다 적은(18%). 위의 통계를 전체 게놈에서 시작한 유전자 비율(1/3)과 결합하면 판도라 바이러스 유전자 함량의 최대 15%(및 최소 6%)가 세포 유기체(현대 아칸 타 메바 숙주의 5-2%포함)또는 다른 바이러스에서 얻을 수 있음을 시사합니다. 이러한 값의 범위는 이전에 미미 바이러스 14 에 대해 추정 된 것과 유사합니다. 따라서 거대 판도라 바이러스 게놈의 기원은 독특한 과정이 아닙니다.그런 다음 판도라 바이러스 유전자 중 중복의 유병률을 조사했습니다. 그림 6 은 6 개의 이용 가능한 판도라바이러스의 단일 대 중복(또는 그 이상)단백질 코딩 유전자의 비율을 아칸 타모바를 감염시키는 거대 유전자 바이러스의 다른 알려진 세 계열의 대표자에 대해 계산한 비율과 비교한다. 그것은 명확하게(55 에서 44%까지 배열하는)다수 사본 유전자의 비율이 판도라바이러스에서 다른 바이러스 가족을 위해 보다는 더 높다는 것을,그들의 각각 게놈 크기와 완벽하게 상관하지 않더라도 보여줍니다. 다른 판도라 바이러스 균주 간의 클러스터 크기 분포는 유사합니다. 대부분의 다중 복사 유전자는 크기 2(중복)또는 3(삼중)의 클러스터에서 발견됩니다. 그런 다음 더 큰 클러스터의 수는 크기에 따라 감소합니다(보충 그림 1). 7).2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 6

figure6

의 분석에 유전자 중복에 다양한 거대한 바이러스는 가족입니다. 거대 바이러스의 단일 사본 대 다중 사본 유전자의 분포. 단백질–단백질 상호 작용 모티프를 공유하는 단백질에 해당하며,안키린,아침 및 에프박스 반복과 같은 단백질-단백질 상호 작용 모티프를 공유하는 단백질에 해당한다. 놀랍게도,판도라바이러스에서 단일 복사 유전자의 절대 수는 유사하고,때로는 더 작다(예를 들면,피.네오 칼레도니아,2 메가바이트)미미 바이러스에 비해,게놈(1.18 메가바이트)절반 크기. 전반적으로,별개의 유전자 클러스터의 수(그림. 607 에서 775 까지)와 미미 바이러스(687)사이에 겹치며,이는 게놈과 입자 크기의 차이에도 불구하고 이들 바이러스가 유사한 유전 적 복잡성을 공유한다는 것을 시사한다.유전자 복제 판도라 바이러스 게놈의 두드러진 특징이기 때문에,우리는 그 메커니즘에 대한 더 많은 통찰력을 찾고 그것을 조사했습니다. 첫째,우리는 가장 가까운 패러로그 쌍 사이의 게놈 거리를 계산했으며,가장 최근의 중복 이벤트로 인한 것일 가능성이 큽니다. 각 판도라 바이러스에 대해 유사한 이러한 거리의 분포는 가장 가까운 패러로그가 서로 옆에 위치하거나(거리=1)단일 유전자(거리=2)로 분리된다는 것을 나타냅니다(보충 그림 2). 8).우리는 복제 된 유전자를 분리하는 물리적 거리를 그들의 진화 거리의(거친)추정치로서 그들의 서열 발산과 연관 시키려고 시도했다. 우리는 중복 이벤트의 추정 된”나이”와 두 개의 가장 가까운 패러로 그(보충 그림 2)의 게놈 거리 사이에 유의 한 상관 관계를 얻었습니다. 9). 이러한 결과 그것에 의하여 대부분의 중복 첫 번째 발생 하는 탠덤에서 후속 게놈 변경(삽입,반전,및 유전자 손실)점진적으로이 신호를 흐리게 진화 시나리오를 제안 합니다.우리의 이전 질량 분석법 피 살리 누스 입자의 프로테오믹 분석은 210 개의 바이러스 유전자 산물을 확인했으며,대부분 또는 예측 가능한 기능이없는 것으로 나타났습니다. 또한,우리는 56 호스트(아 칸 타 메 바)단백질 검출. 중요 한 것은,바이러스 인코딩된 전사 장치의 구성 요소 중 어느 것도 미 립 자 5 에서 검출 되었다. 이 연구에서 우리는 피 살리누스,피 둘시스,그리고 두 개의 새로운 분리체(피 케르쿠스와 피 네오 칼레도니아)에 대해 동일한 분석을 수행하여 다양한 수준의 발산을 가진 판도라비리다과 가족의 구성원에 대해 위의 특징이 어느 정도까지 보존되었는지 확인하고 일반적인 판도라비리온의 액세서리 구성 요소와 코어를 식별합니다.질량 분석법의 지속적인 감도 향상으로 인해 정제 된 비리 온에 대한 우리의 새로운 분석은 피 살리누스에 대한 424 개의 단백질,피 케르 쿠스에 대한 357 개의 단백질,피 둘 시스에 대한 387 개의 단백질 및 피 네오 칼레도니아에 대한 337 개의 신뢰할 수있는 식별을 이끌어 냈습니다(방법 참조). 그러나,식별이 증가 수 풍부 값(강도 기반 절대 정량화,아이바크)5 개 이상의 주문에 걸쳐 해당 합니다. 낮은 풍부 꼬리에서 확인 된 단백질의 많은 따라서 선의의 입자 구성 요소에 해당 하지 않을 수 있습니다 하지만 무작위로 로드 된 구경꾼,”끈 적”단백질,또는 감염 된 세포에서 잔여 오염 물질. 이 신중한 해석은 몇 가지 관찰에 의해 제안됩니다:낮은 풍부 꼬리는 단일 판도라 바이러스 균주의 입자에서 확인 된 바이러스 단백질에 점진적으로 풍부 해지고(다른 균주가 상동 유전자를 가지고 있음에도 불구하고),입자와 관련된 숙주 인코딩 된 단백질의 비율은 가장 낮은 풍부도에서 증가하고,이들 숙주 단백질의 대부분은 이전에 판도라 바이러스와 관련이 없지만 동일한 숙주를 감염시키는 바이러스 입자에서 검출되었다.이러한 단백질은 아칸 타 메바 프로테옴에 풍부합니다(예:,액틴,퍼 옥시 다제 등)정화 오염 물질로 유지 될 가능성이 더 높습니다.불행 하 게도,판도 라비 리온 프로테옴에 관련 된 이바크 값 분포는 모호한 것 들에서 선의의 입자 구성 요소를 구별 하기 위해 객관적인 풍부 임계값으로 봉사할 수 있는 불연속성을 전시 하지 않았다. 그러나,확인 된 아칸 타 메바 단백질의 수는 전체 프로테옴에서 200 등급 이후에 급격히 증가합니다(보충 그림 1). 10). 게놈 재연에 대 한 동일한 보수적인 태도에 따라 우리 가능성이 구경꾼으로 서이 순위 아래 확인 된 단백질을 무시 하기로 결정 하 고 입자 프로테옴의 우리의 추가 분석에 200 가장 풍부한 단백질(보충 데이터 1,보충 표 3)포함. 4 개의 다른 판도 라비 리온 각각에 대 한이 엄격한 프로테옴 정의를 사용 하 여,우리는 먼저 그들의 구성 단백질의 다양성과 해당 판도 라 바이러스 게놈의 글로벌 유전자 내용에 비해 보존의 그들의 수준을 조사 했다.그림 7 은 입자 프로테옴이 194 개의 별개의 클러스터에 속하는 단백질을 포함하며,그 중 102 개는 4 개의 균주에 의해 공유된다는 것을 보여줍니다. 따라서 핵심 프로테옴은 구조적으로나 기능적으로 다양합니다. 그것은 전 세계적으로 모든 판도 라비 리온에서 확인 된 총 단백질 클러스터의 52.6%에 해당합니다. 이에 비해 코어 게놈에 의해 암호화 된 467 개의 단백질 클러스터는 판도라 바이러스 인코딩 된 단백질 클러스터의 전체 수의 41.6%(즉,467/1122)만을 나타냅니다. 따라서 다른 균주의 게놈을 전파하는 데 사용되는 판도라 바이러스”상자”는 유전자 내용물보다 훨씬 더 보존됩니다(“10-3,카이 제곱 테스트). 코어 프로테옴을 코딩하는 유전자는 또한 모든 판도라 바이러스 유전자 중에서 가장 강력한 정화 선택을 나타낸다(보충 그림 2). 11).2018 년 10 월 1 일(토)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일)~2018 년 10 월 15 일(일) 우리의 프로테옴 분석의 신뢰도를 평가하기 위해,우리는 프로테옴 분석에 대해 결정된 풍부도(이바크)값을 비교했다.동일한 판도라 바이러스 균주에서 수행 된 두 가지 기술적 복제 및 두 가지 생물학적 복제에 대해 가장 풍부한 200 개의 단백질 각각입니다(보충 그림 2). 2018 년 12 월 12 일 이것은 매우 좋은 상관 관계입니다.97)는 두 경우 모두 3 배 이상의 풍요 로움 값에 대해 획득되었습니다. 그런 다음 서로 다른 분리체의 비리 온 프로테옴이 공유하는 직교 단백질에 대해 얻은 이바크 값을 비교했습니다. 위의 복제실험(보충 그림 2)보다 작은 것으로 예상된 바와 같이,좋은 상관관계가 관찰되었다. 2018 년 12 월 12 일 이러한 결과는 서로 다른 균주의 입자가 형태 학적으로 동일하게 나타나지만(보충 그림 1). 1),그들은 그들이 만들어진 단백질 세트(평균 89%의 쌍 방향 직교)와 정확한 화학 양론 모두에서 확실한 유연성을 인정합니다.그런 다음 우리는 입자를 구성하는 단백질의 예측 기능을 가장 풍부한 것부터 가장 풍부한 것까지 조사하여 초기 감염 과정에 대한 통찰력을 얻기를 희망했습니다. 불행히도,핵심 입자 프로테옴을 정의하는 102 개의 서로 다른 클러스터 중 19 개의 단백질 클러스터 만이 기능적/구조적 모티브와 관련 될 수 있습니다(보충 데이터 1,보충 표 3). 이 비율은 전체 게놈보다 적습니다(그림 1). 5),독특한 형태 및 조립 과정에 의해 이미 제안 된 판도라 바이러스 입자의 외계인 특성을 확인 5. 판도라비리온은 대부분 판도라비리과 가족 외부에 상동체가 없는 단백질로 만들어진다. 또한,대부분의 진핵생물성 대형 유전자 바이러스의 특징인 유전자결합 핵심 단백질 또는 유전자결합 패키징 페이즈와 유사한 단백질도 검출되지 않는다. 특히,피. 또한,신클레어 외에도에 의해 최근에 제안된 샐리누스 가설적인 단백질(이전 시편은 현재 시편의 450 편을 재검토했다)이 있다.피 살리누스 비리온에서는 15 개의 강력한 단핵 생물권 후보가 검출되지 않았고,다른 균주 프로테옴에서는 그 동족체가 검출되지 않았다. 이 부정적인 결과는 시퀀스 유사성의”황혼 지대”에서 만든 컴퓨터 예측의 실험적 검증의 필요성을 강조합니다. 감염의 초기 단계는 핵에 있는 호스트 전사 기계 필요 확인 중 하나 감지 됩니다. 스플 리세 오솜 인트론은 판도 라비 리온에서 발견 된 56 개의 판도라 바이러스 유전자에 대해 검증되었다(보충 데이터 1). 이것은 깨지지 않은 핵의 관찰에서 예상 한 바와 같이 감염성 사이클이 끝날 때까지 기능적 스플 라이스 좀의 보존을 나타냅니다(보충 그림 2). 1).19 개의 비 익명 단백질 클러스터 중 4 개는 특정 기능적 단서가없는 일반적인 모티프를 나타냅니다:단백질-단백질 상호 작용에 관여하는 2 개의 콜라겐 유사 도메인 및 1 개의 팬/사과 유사 도메인,1 개의 쿠핀 유사 도메인 일반 배럴 폴드에 해당합니다. 가장 풍부한 10 개의 핵심 단백질 중 9 개는 예측 기능이 없습니다. 22 개의 아미노산(85-107)의 예측 된 막 스패닝 세그먼트가 모든 판도라 바이러스 균주에서 보존된다는 것을 알아 차릴 가치가 있습니다. 이 유전자는 유전자뿐만 아니라 유전자뿐만 아니라 유전자에도 영향을 미칩니다. 티 오레 독신은 활성 중심의 가역적 산화를 통해 디티 올-디설파이드 교환 반응을 촉매한다. 이 단백질은 같은 계열의 다른 단백질(수용성으로 예측 됨)과 함께 감염의 초기 단계 이전에 바이러스 단백질에 대한 식세포 유발 산화 손상을 복구/예방하는 데 관여 할 수 있습니다. 이 입자는 또한 또 다른 풍부한 산화 환원 효소를 공유합니다.이 효소는 철 단백질의 성숙에 관여 할 수있는 에르 브와 같은 티올 산화 환원 효소입니다. 티 오레 독신 환원 효소와 원격 유사성을 갖는 또 다른 핵심 단백질(시편은 상기 효소의 산화 된 활성 부위의 재생에 참여할 수있다. 가장 풍부한 핵심 단백질 중,시편은 유전자 결합으로 예측되고,게놈 포장에 관여 할 수있다. 1 개의 추정적인 나드 의존성 아민 산화 효소(시편 _628)및 1 개의 일시적 유행 결합 탈수소 효소(시편 _1132)는 보존 된 추정 산화 환원 효소 패널을 완성합니다. 다른 예측 된 핵심 단백질에는 전형적인 규제 기능 인 세르/세르 키나아제 및 포스파타제가 포함됩니다. 하나의 세린 프로테아제,하나의 리파아제,하나의 파타틴 유사 포스 포 리파아제 및 뉴 클레오 포린의 하나의 원격 동족체는 판도라 바이러스 게놈을 세포질로 연결 한 다음 핵으로 연결하는 데 사용되는 도구 상자의 일부일 수 있습니다(보충 표 3). 마지막으로,두 개의 핵심 단백질(시편 _118 및 시편 _874)은 엔도르리보뉴클레아제 모티프를 공유하며 세포질 핵분열기를 표적으로 하는 전사 조절제로서 기능할 수 있다.모든 판도 라비 리온에 의해 공유 하는 코어 단백질의 집합을 정의 하는 반대,우리는 또한 변형 특정 구성 요소를 조사 했다. 불행히도,주어진 균주(평균 약 10 개)에 고유 한 대부분의 비리 온 단백질은 익명이며 풍부도가 낮습니다. 입자에 있는 그들의 존재의 기능적인 결과에 관하여 예측은 할 수 있지 않았습니다.