BioINpro
(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공바이오인포매틱스를 기반한 감염병예측기술
- 등록일2017-05-29
- 조회수15283
- 분류레드바이오 > 보건・간호기술, 플랫폼바이오 > 바이오융합기술
-
저자/소속
안인성 책임연구원/한국과학기술정보연구원 생명의료예측기술연구실
-
발간일
2017-05-29
-
키워드
#바이오인포매틱스#감염병예측기술
- 첨부파일
-
차트+
?
차트+ 도움말
1. 개요
바이오인포매틱스(Bioinformatics)란 생명을 뜻하는 영어단어인 ‘바이오(bio)’와 정보학을 뜻하는 단어인 ‘인포매틱스(informatics)’의 합성어로써, 일반 실험실과 비교하자면 실험을 위한 시료는 다양한 형태의 데이터 또는 정보가 되며, 실험기기 또는 실험도구는 고성능 컴퓨팅 인프라와 대용량 저장소(storage), 그리고 초고속 네트워크 등으로 생각하면 이해가 쉬울 것이다. 2000년대 초반 우리나라에 바이오인포매틱스란 분야가 처음으로 소개된 이래, 초고속 네트워킹과 컴퓨팅 인프라 기술의 급속한 발전에 힘입어 바이오인포매틱스 시장도 많은 발전을 거듭하고 있다.
초기에는 해외의 유명 생물정보 데이터베이스 또는 해외에서 개발해 놓은 분석도구들에 대한 단순 미러링으로부터 시작하였지만, 이제는 다양한 분야에서 목적에 맞는 분석 도구들을 직접 개발하고 사용한다. 미생물 수준의 서열분석이 이제는 단시간 내에 인간을 포함한 고등생물의 전체 유전체 서열정보(whole genome sequencing)를 생성하게 되었으며, 신약개발을 위한 분자도킹 모의실험도 가상의 컴퓨팅 공간 내에서 수행이 된다. 지금까지 생명공학 분야 연구능력 향상에 초점을 맞추어 발전되어 온 바이오인포매틱스 기술은 이제 ‘사회 현안문제 해결’이라는 새로운 목표를 향해 첫걸음을 내딛고 있다. 특히 2009년 신종플루, 2015년 메르스와 같은 신종 감염병의 갑작스런 대유행을 경험하면서, 빅데이터를 이용한 질병 예측기술에 대한 필요성이 크게 증대되고 있다.
감염병(infectious disease)이란 병원체라 부르는 세균(bacteria), 바이러스(virus), 곰팡이균(fungus), 기생충(parasite) 등에 우리 몸이 감염되어 발생하는 질환으로서, 이 중에서도 빠른 변이와 자가 복제가 가능한 바이러스 종은 전 세계적인 감염병 대유행을 발생시키기에 매우 유리한 조건을 가지고 있다(1). 2009년 멕시코와 북미대륙으로부터 시작하여 전 세계적으로 전파된 H1N1 타입의 A형 인플루엔자 바이러스의 경우, 기존의 바이러스와는 다른 전혀 새로운 종류의 변종으로 인구집단이 매년 접종하는 독감백신을 통한 충분한 면역력 획득에 실패함으로 대규모 대유행을 야기시킨 바 있으며, 2012년에 사우디아라비아와 아랍에미레이트를 중심으로 발병하여 2016년 10월 말까지 약 705명의 사망자를 발생시킨 신종 바이러스성 질병인 메르스(MERS, Middle East Respiratory Syndrome), 일명 중동호흡기증후군도 2015년 중동지역을 여행하고 돌아온 68세의 남자를 통하여 국내로 최초 유입된 이후 아시아 국가에서는 유일하게 우리나라에서 186건이 발생하여 38명의 사망자가 발생했다 (2-5).
일반적으로 바이러스에 의한 감염병 대유행은 다음의 3가지 특성을 가지고 있는데, 첫 번째는 기존의 병원체와 다른 변이의 발생, 두 번째는 인체 내에서의 빠른 증식, 그리고 마지막으로는 다양한 전파매체를 통한 사람 대 사람 간 빠른 전파이다. 이 중에서 특히 바이오인포매틱스 기술을 활용하여 감염병 예측에 주요 타겟이 되는 요소는 첫 번째 변이패턴과 세 번째 확산양상 예측이다. 이 글에서는 최근 주요 선진국들을 중심으로 진행되고 있는 빅데이터, 고성능 컴퓨팅, 인공지능 기반의 예측기술 현황과 앞으로의 전망을 감염병 전파예측 중심으로 기술하고자 한다.
2. 국내외 연구동향
가. 국외 연구동향
감염병에 대한 예측기술의 발달은 크게 3가지 단계로 나누어서 설명할 수 있는데, 첫 번째는 수학적인 알고리즘 중심의 기술, 두 번째는 슈퍼컴퓨터와 같은 고성능 컴퓨팅 인프라 중심의 예측기술, 그리고 세 번째는 예측의 대상이 되는 지역의 유동인구 패턴을 설명할 수 있는 빅데이터와의 연계를 통한 시뮬레이션 기반의 기술 등이 포함된다.
수식 기반의 이론역학의 기원으로는 1760년 네덜란드의 물리학자이자 수학자였던 다니엘 베르누이(Daniel Bernoulli)의 천연두 발생관련 수학모델이 대표적으로 손꼽히며, 이 후 1906년 영국의 수학자인 하머(W. H. Hamer)에 의하여 홍역의 질병발생 수가 아직 질병에 노출된 적이 없는 인구집단(susceptibles)와 이미 감염된 인구집단(infectives)의 밀도와 곱과 높은 상관도가 있다는 가정이 발표되면서 감염병 예측에 있어서 인구사회학적 지표의 중요성이 처음으로 대두되었다(6). 1927년 영국의 커맥과 맥캔드릭 (Kermack & McKendrick)이 제안한 질병구획(compartment) 중심의 미분방정식은 이후 질병확산 모델의 기본모델인 SIR(Susceptible, Infected & Recover)모델의 모체가 되어 지금까지도 다양한 질병확산 모델링에 사용이 되고 있다(7).
이상과 같은 수리방정식 기반의 질병확산 노력은 2009년 전 세계적인 독감 대유행을 발생시켰던 H1N1 아형인 일명 ‘신종플루’ 발생 이후에 미국의 질병통제예방센터(CDC, Centers for Disease Control and Prevention)를 중심으로 독감의 미국 내 확산을 그래프 형식으로 나타낼 수 있는 초창기 시뮬레이션 프로그램 개발로 이어지는데, 그 대표적인 사례가 ‘CommunityFlu’ 프로그램이다. C++ 컴퓨팅 언어로 개발된 이 프로그램은 마이크로소프트사의 엑셀 프로그램을 통하여 메크로 연동으로 실제 사용자가 사용할 수 있는데, 변수입력 창에 사용자가 직접 연령별 인구수, 가구 사이즈 당 연령별 인구 수, 초기 감염자 수, 잠복기, 지역사회 내에서의 유동인구 패턴, 주당 근로일 수, 마스크의 사용률, 백신 접종률과 효과 등의 시뮬레이션에 필요한 다양한 입력 값들을 수기로 입력하면 예방접종, 휴교, 마스크, 확자 격리 등과 같은 대응방법 시행에 따르는 감염병 확진 환자수의 예측 결과 값을 그래프 형식으로 제공한다. 이와 유사한 초창기 예측 프로그램으로는 미국 CDC에서 개발한 FluAid나 FluSurge 등이 존재한다(8). 이들 초창기 질병예측 프로그램들은 기존의 수식에만 의존해오던 질병대응 실무자들이 대입한 변수값에 따른 환자수의 변화를 그래프 형식으로 손쉽게 뽑아볼 수 있다는 점에서는 가치를 인정받았으나, 예측에 필요한 모든 변수들을 직접 수치로 직접 입력해야 하고 간단한 수준에서의 계산만이 가능하여 질병이 발생한 지역사회의 인구학적, 지리학적 특성을 제대로 반영하기에는 다수 무리가 있는 방법이었다. [표1]은 감염병 확산 예측을 위해서 개발된 분석도구들을 정리한 것으로, 프로그램 명, 프로그램 개발 국가 및 연도, 감염병 예측에 사용되는 주요 파라미터 및 논문정보 등을 나타낸다.
[표 1. 감염병 역학 시뮬레이션 도구 소개]
프로그램 명 | 개발국 (연도) | 주요 변수 | 문헌 정보 |
STEM | 미국 (2010) | 발병기간, 인구밀도, 전염률, 회복률, 사망률, 잠복기 등 | Edlund et al., 2010 (9) |
GLEaMviz | 이탈리아, 미국 (2009) | 도로교통망, 항공기 운항경로, 인구구조, 출퇴근 정보 등 | Broeck et al., 2011 (10) |
CommunityFlu | 미국 (2009) | 백신접종률, 휴교율, 마스크 보급률, 환자 격리 등 | - |
FluSurge | 미국 (2005) | 연령그룹별 인구수, 독감 유행기간, 바이러스 공격속도, 인공호흡기 개수 및 이용 가능률(%), 병상수, 간호사 및 의사 수 등 | Zhang et al., 2006 (8) |
FluAid | 미국 (2000) | 3개 연령그룹 (0-18세, 19-64세, 65세 이상), 2개 위험그룹 (고위험, 비고위험), 의료인력, 병상수 등 | Meltzer et al., 1999 (11) |
Epigrass | 브라질 (2008) | 지리적 정보, 교통수단의 이동경로, 숙주 간 전염률, 감염자 방문 수, 집단수, 회복률 등 | Coelho et al., 2008 (12) |
influSim | 독일 (2006) | 누적 감염자수, 외래 환자수, 항바이러스제 투여량, 병상수 등 | Eichner et al., 2007 (13) |
2007년 미국의 IBM사는 Eclipse사와 손잡고 ‘시공간 감염병 모델러(STEM, Spatiotemporal Epidemiological Modeler)’를 개발하여 무료로 배포하였다. STEM은 기존의 엑셀 또는 수리방정식 기반의 질병 확산 모델에 해당 지역의 지리적 위치정보와 인구집단에서의 상호작용 정보를 추가하여 질병의 확산위협을 시간적, 공간적으로 모델링할 수 있는 프로그램으로 전 세계 224개국의 지리정보, 인구구조, 인구이동을 위한 운송시스템, 확산 시뮬레이션을 위한 다양한 모델 등을 독립적인 플러그인(plugin) 형식으로 제공한다. STEM은 특히 시뮬레이션의 결과를 기존의 시계열 상의 그래프 형식으로 뿐 아니라 지도 상에서 시각적으로 결과를 확인할 수 있어서 활용도면에서 높은 평가를 받고 있다 (14).
...................(계속)
* 로그인 하셔야 자세한 정보를 모두 보실 수 있습니다.
-
이전글
- 바이오 엑셀러레이터 동향
-
다음글
- 연속식 혈당측정기술