본문으로 바로가기

기술동향

국내 원숭이 바이러스 전장유전체분석: 메타지노믹 시퀀싱과 액상 혼성화 시퀀싱 방법 비교

  • 등록일2024-05-31
  • 조회수1474
  • 분류기술동향
  • 자료발간일
    2024-05-23
  • 출처
    질병관리청
  • 원문링크
  • 키워드
    #원숭이두창 바이러스#엠폭스#바이러스
  • 첨부파일

 

 

국내 원숭이 바이러스 전장유전체분석: 메타지노믹 시퀀싱과 액상 혼성화 시퀀싱 방법 비교


 


 

◈본문


Abstract

본 연구에서는 2022년 5월부터 2023년 11월까지 국내에서 발생한 엠폭스 양성환자의 검체를 통해 원숭이두창 바이러스(monkeypox virus, MPXV)의 전장유전체 정보를 분석했다. 엠폭스는 아프리카 지역에서 발생하는 감염병으로, 2022년 5월에 영국에서 최초의 감염 사례가 확인된 이후 전 세계로 확산하였다. 국내에서는 23년 11월 24일 기준, 155건의 감염 사례가 발생하였고, 주된 감염경로는 유증상자와의 밀접한 접촉으로 확인되었다. 엠폭스의 원인 병원체인 MPXV는 약 197,000 bp 크기의 이중 가닥 DNA로 이루어져 있으며, 약 191개의 유전자와 양쪽 말단의 역위말단반복 부위, 그리고 중심보존부위를 포함하고 있다. 유전형은 클레이드 I (중앙아프리카형)과 클레이드 II (서아프리카형)으로 나뉘며, 클레이드 I는 1–10% 이하의 치명률을, 클레이드 II는 1% 미만의 치명률로 보고되었다. 연구에서는 두 가지 시퀀싱 방법, 메타지노믹 시퀀싱과 액상 혼성화 시퀀싱을 통해 전장유전체 분석을 수행하였다. 액상 혼성화 시퀀싱은 MPXV 리드 서열을 메타지노믹 시퀀싱에 비해 효과적으로 생산하는 데 우수함을 나타냈다. 검체 종류에 따라 생산되는 바이러스 리드의 비율이 다르며, 이를 고려하여 전장유전체 분석에 활용할 검체 종류를 선택하였다. 유전체 계통분석 결과, 국내에서 발생한 엠폭스 바이러스는 해외에서 유입된 리니지 C.1에 속하는 것으로 확인되었다. 이는 국내에서의 지속적인 전파를 시사하며, 국내 및 국제적인 MPXV 변이에 대한 대응을 위한 중요한 단서를 제공한다. 또한 감염 경로를 파악하고 감염병 대응 및 예방 전략을 개선하는 데 기여할 것으로 기대된다.



서 론

원숭이두창 바이러스(monkeypox virus, MPXV)에 의해 감염되는 엠폭스는 1958년 원숭이에서 처음 발견된 이후 1970년 인체감염이 확인되었다. 엠폭스는 중앙아프리카와 서부 아프리카 지역의 풍토병이었으나 2022년 5월 6일 영국인의 나이지리아 여행 후 감염이 확인되었고, 이후 유럽과 북미를 중심으로 비풍토병 지역에서 이례적으로 유행하는 감염병이다[1]. 이 바이러스는 2019년 Sars-Cov-2 바이러스(코로나바이러스감염증-19의 원인 바이러스) 이후 전 세계 유행을 일으킨 또 하나의 위험한 바이러스로 분류되어, 세계보건기구(World Health Organization, WHO)의 2022년 7월부터 2023년 5월까지 약 10개월간 국제공중보건상황(Public Health Emergency of International Concern)을 이끈 원인이기도 하다[2]. 질병관리청 검사보고에 따르면 2022년 6월부터 2023년 11월까지 155건이 발생하였고[3], 사망보고는 없으며, 감염경로는 의료노출 1건을 제외하고 유증상자와의 밀접한 접촉에 의한 것으로 보고되었다[4]. MPXV는 약 197,000 bp의 이중 가닥 DNA로 191개의 유전자로 이루어지며 유전체 서열 양쪽 말단에 역위말단반복(inverted terminal repeat) 부위가 존재한다[5]. 유전형은 중앙아프리카형과 서아프리카형으로 나뉜다. 2022년 8월 WHO에 의해 전자는 클레이드 I, 후자는 클레이드 II (서브클레이드 a, b)로 재명명되었고[6], 유전형에 따른 치명률은 클레이드 I의 경우 1-10% 이하, 클레이드 II의 경우 1% 미만으로 보고된다[7]. 같은 종의 바이러스라도 클레이드에 따라 인체에 더욱 치명적이므로 엠폭스 진단 이후 유전체분석을 통해 국내에서 유행하는 바이러스의 클레이드를 확인하는 과정을 간과할 수 없다. 2023년 11월 공공 유전체 데이터베이스(Genbank)에 등재된 바이러스 유전체는 약 6,900건이며, 이 중 2022년 5월 이후 등록된 유전체가 6,354건을 차지한다[8]. 차세대 염기서열 분석(next generation sequencing, NGS)의 기술 발전과 보급으로 전 세계 국가가 엠폭스 양성환자의 검체에서 빠르게 바이러스 유전체를 분석하여 바이러스 특성과 유행양상을 확인 및 공유하면서 지속적으로 유전체 감시(genomic surveillance)에 힘쓰고 있다. 본 원고에서는 국내에서 발생한 엠폭스 양성 환자의 검체로부터 얻어진 바이러스를 NGS 기술을 이용하여 전장유전체 분석을 수행하는 방법과 결과를 기술하고, 국내에서 유행하는 바이러스 분류와 변이 등을 지속적으로 모니터링하기 위한 유전체 감시 방법을 소개한다.


방 법

국내 바이러스 전장 유전체 분석은 ‘메타지노믹 시퀀싱(metagenomic sequencing)’과 ‘액상 혼성화(hybridization capture)를 이용한 시퀀싱’ 두 가지 방법으로 수행되었다. 일반적으로는 NGS 수행을 위해 다음과 같은 단계를 거친다. 검체에서 DNA를 추출한 후 시퀀싱을 위해 DNA나 RNA 모음 형태인 라이브러리로 제작하고, 이를 이용하여 NGS 기기에서 유전체 리드를 생산하게 된다. 단, 라이브러리 제작은 환자의 검체 내에 있는 모든 DNA를 생산하는 메타지노믹 시퀀싱과 특정 바이러스 유전체만을 목표로 시퀀싱하는 액상 혼성화를 이용한 시퀀싱 방법에 따라 준비하였으며, MiSeq NGS 기기(Illumina, Inc.)에서 생산하였다. 2022년에 생산된 유전체의 경우는 환자의 검체에서 바이러스를 분리·배양 후 메타지노믹 시퀀싱을 적용하여 생산하였으며, 2023년도부터는 환자가 급증함에 따라 그에 대응하기 위해 참조유전체로부터 고안된 프로브를 활용한 액상 혼성화 방식을 이용하여 MPXV만을 증폭하는 두 번째 시퀀싱 방법으로 생산하였다. 여기에서 프로브는 DNA나 RNA와 상호작용하여 특정 유전자나 염기 서열을 찾아내는 작은 조각이다.


1. 메타지노믹 시퀀싱을 위한 라이브러리 제작 방법

환자의 검체 또는 세포 배양을 통해 분리·배양한 바이러스로부터 핵산을 추출하기 위하여 컬럼 방식의 QIAamp DNA blood minikit (Qiagen)를 사용하였으며, 추출한 핵산은 Qubit 4 형광측정기(Invitrogen)를 이용하여 정량 및 표준화하였다. 메타지노믹 시퀀싱을 위해서 Illumina Inc.의 Miseq NGS 기기을 이용하였다. 약 100-500 ng의 추출 DNA를 이용하여 Miseq NGS 기기에 적합한 라이브러리를 제작하였다. 라이브러리 제작을 위해 먼저 bead-linked transposomes를 이용하여 DNA를 조각냄과 동시에 시퀀싱 기기에서 읽을 수 있는 어댑터 시퀀스를 도입하는 태그멘테이션(tagmentation) 단계를 거치고, 이어서 태그된 DNA만을 획득하는 정제 단계를 거쳤다. 이렇게 태그된 DNA를 활용하여 인덱스 어댑터(Illumina, 20091654)와 함께 중합효소연쇄반응을 활용한 증폭 단계를 거쳐 시퀀싱 기기를 위한 라이브러리를 제작하였다. 제작된 라이브러리는 비드(bead)를 이용한 정제 단계를 거치고, Qubit 4 형광측정기(Invitrogen)와 전자포토메트릭 감지 기술을 활용한 TapeStation (Agilent Technologies) 장비를 통하여 형성된 라이브러리의 농도와 크기를 정확하게 측정하고 제작된 라이브러리의 품질을 평가하였다. 최종 약 10 pM의 라이브러리를 이용하여 시퀀싱하였다. 라이브러리 제작을 위한 모든 과정은 Illumina DNA prep (M) Tagmentation (20060060) 시약을 이용하였으며, 제조사에서 제공하는 프로토콜에 따라 정밀하게 수행하였다.


2. 액상 혼성화 시퀀싱을 위한 라이브러리 제작 방법

검체의 모든 DNA를 생산하는 메타지노믹 시퀀싱은 편향되지 않은 결과를 생산할 수 있다는 장점이 있으나 우리가 얻고자 하는 MPXV 리드 서열의 비율이 높지 않아 시퀀싱 효율이 떨어지므로 이를 보완하기 위해 액상 혼성화 시퀀싱 분석 방법을 도입하였다. 액상 혼성화 시퀀싱 방법을 위한 라이브러리 제작은 농축(enrichment) 단계를 추가적으로 거친다. 라이브러리 제작을 위해 필요한 핵산은 동일하게 QIAamp DNA blood minikit (Qiagen)를 사용하여 추출하였으며, Qubit 4 형광측정기(Invitrogen)를 이용하여 정량 및 표준화하였다. 메타지노믹 시퀀싱 분석 방법에서 사용한 것보다 적은 양인 약 10-100 ng의 추출된 DNA를 이용하여 라이브러리를 제작하였으며 초기 단계는 위와 동일하다. Bead-linked transposomes를 이용하여 조각낸 DNA를 어댑터 시퀀스 도입을 위한 태그 단계를 거치고, 정제하여 태그된 DNA만을 인덱스 어댑터(Illumina, 20091654)와 함께 증폭하였다. 증폭된 라이브러리를 정제하고 정량 및 표준화한 후 액상 혼성화 시퀀싱을 위한 농축 단계를 거쳤다. 이때 Illumina Inc.의 Viral Surveillance Panel (VSP)을 활용하였는데, 이는 우리가 얻고자 하는 MPXV를 포함한 60여 개의 바이러스를 타깃으로 하는 프로브 조합으로 고안된 패널이다. VSP 패널을 활용하여 MPXV를 포획하기 위하여 증폭된 라이브러리를 VSP 패널을 포함한 반응 시약과 함께 Thermo Cycler (Applied Biosystems)에 두고 정확한 온도 제어를 통하여 액상 혼성화하였다. 이 과정은 58℃에서 최소 16시간 정치하여야 하므로 메타지노믹 시퀀싱을 위한 라이브러리 제작 과정보다 하루 정도의 시간이 더 소모되었다. 이렇게 포획된 라이브러리는 마그네틱 비드를 활용하여 정제한 후 액상 혼성화된 라이브러리만을 추출하였다. 이렇게 액상 혼성화를 통하여 MPXV를 포획한 라이브러리는 증폭 단계와 정제 단계를 거치고 Qubit 4 형광측정기(Invitrogen)와 전자포토메트릭 감지 기술을 활용한 TapeStation (Agilent Technologies) 장비를 이용하여 품질을 평가하였다. 최종 약 9 pM의 제작된 라이브러리를 이용하여 시퀀싱하였다. 라이브러리 제작을 위한 모든 과정은 Illumina RNA Prep with Enrichment Tagmentation (20040536) 시약을 이용하였으며, 제조사에서 제공하는 프로토콜에 따라 정밀하게 수행하였다.


3. 전장유전체 분석 및 평가

MiSeq NGS 기기에서 생산된 paired-end 형식의 리드서열은 Kraken2 [9]를 이용하여 호스트 게놈(hg19)을 제거한다. CLC Genomics Workbench 20 (CGW) 도구를 사용하여 유전체 분석을 진행하며, 입력 파라미터를 명시하지 않는 경우는 기본값으로 수행한다. 제거된 리드서열은 trimming threshold 0.001 파라미터를 사용하여 어댑터 서열과 Q30 이하의 낮은 품질의 리드를 필터링한다. CGW의 resequencing 기능을 통해 참조유전체(NC_063383.1)를 이용하여 리드를 매핑하고, de novo assembly 기능을 이용하여 컨티그로 조립 후 리드매핑된 서열과 컨티그를 비교 분석하여 최종적으로 유전체의 구조 변형의 유무를 분석하고 최종서열을 완성한다. 완성된 서열은 QUAST [10]를 통해 전장유전체의 완성도를 평가하며, NextClade [11]를 사용하여 최종 클레이드와 변이를 확인한다.


이렇게 완성된 유전체는 Nextstrain 분석 파이프라인[12]을 통해 전 세계 공공 유전체 데이터베이스에 등록된 유전체를 대상으로 유연관계를 확인하였다. Nextstrain의 분석 파이프라인은 워크플로 프로그램인 Snakemake [13]를 사용하여 Augur [14] 등의 분석도구와 방법을 정의한 규칙에 따라 분석을 수행하며, 최종 결과를 auspice를 통해 시각화한다. 추가적으로 Apobec3에 의한 변이(TC→TT, GA→AA)를 분석하기 위해 mutation profile [15]을 사용하여 확인하였다.

 

 결 과

메타지노믹 시퀀싱 방법, 액상 혼성화 시퀀싱 방법으로 생산된 NGS 리드의 서열은 표 1과 같이 도출되었다. 메타지노믹 시퀀싱 방법을 이용한 경우, MPXV 리드서열은 10% 미만으로 생산되는 반면 액상 혼성화 시퀀싱 방법의 경우, MPXV 리드 서열이 90% 이상 생산됨을 확인하였다. 액상 혼성화 시퀀싱은 시퀀싱 효율을 높인다는 장점이 있으나 메타지노믹 시퀀싱 방법과 비교했을 때 라이브러리 제작을 위한 농축 단계를 거쳐야 하므로 시간과 비용이 추가적으로 소요되었다. 검체의 종류에 따라 생산되는 바이러스 NGS 리드는 투입되는 검체 수에 따라 감소하므로, 전체 생산량 대비 바이러스 리드 비율로 환산할 경우 가피, 피부병변, 구인두도말, 혈액 순으로 생산비율의 차이를 보였다. 생산되는 바이러스 NGS 리드는 검체의 바이러스 양에 따라 달라질 수 있다. 이전 결과에 따르면 같은 환자의 여러 부위에서 채취된 검체의 바이러스 양은 다양하며, 이러한 점을 고려하였을 때 정확한 진단과 분석을 위하여 다양한 부위에서 여러 종류의 검체를 채취하는 것이 필요하다[16]


검체별 메타지노믹 시퀀싱과 액상 혼성화 시퀀싱 분석 방법에 따른 바이러스 리드 비교

ID

검체(CT값a))

메타지노믹 시퀀싱


액상 혼성화 시퀀싱

바이러스 리드 비율b)

유전체 커버리지c)/커버리지 정도d)

바이러스 리드 비율b)

유전체 커버리지c)/커버리지 정도d)

MPXV-ROK-P002-2022

구인두도말(34.81)

0.5% (123,258/21,578,224)

65%/12X

83% (248,504/297,732)

100%/166X

MPXV-ROK-P003-2022

피부병변(23.11)

5% (241,032/4,282,341)

100%/225X

98% (13,562,486/13,826,110)

100%/8,860X

MPXV-ROK-P003-2022

가피(26.35)

11% (602,146/5,616,046)

100%/600X

N/A

N/A

MPXV-ROK-P003-2022

구인두도말(27.53)

0.7% (34,894/4,919,884)

99%/10X

N/A

N/A












...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용