본문으로 바로가기

기술동향

유전체 빅데이터의 임상 적용의 현재와 미래

  • 등록일2020-03-18
  • 조회수7214
  • 분류기술동향


유전체 빅데이터의 임상 적용의 현재와 미래


 김경철

강남메이저클리닉 경영원장

국가생명윤리위원회 유전자 전문위원



유전체 의학의 발달은 현대 의학의 패러다임을 바꾸고 있으며 정밀 의학 빅데이터를 통한 개인 맞춤 치료의 고도화가 이루어지고 있다. 의료계 뿐만 아니라, 유전체 산업 현장에서 먼저 경험한 변화들을 통해 미래 의료가 어떻게 다가오고 있는 지를 살펴보고자 한다.



유전체 빅데이터 시대의 도래

지금은 바야흐로 빅데이터의 시대이다. 빅데이터 중에 가장 발전하고 있는 분야 중 하나가 보건의료 빅데이터이며 이 중 가장 큰 빅데이터는 유전체 데이터이다. 한 사람의 DNA를 구성하는 염기는 약 30억 쌍인데 이 염기 전체를 읽는 것을 홀게놈 시퀀싱 (Whole Genome Sequencing)이라고 부른다. 정확도를 높이기 위해 최소 30번 정도 반복해서 시퀀싱을 하는데 이 과정에서 생기는 데이터의 양은 약 100 Gb 정도이다. 단백질을 전사하는 엑솜만 분석하는 엑솜 시퀀싱의 경우 생성되는 양은 약 8Gb이다.
2003년 완성된 휴먼게놈프로젝트에서는 한 사람의 홀게놈 시퀀싱을 분석하는데 걸린 시간이 무려 13년이 걸렸었고 그 비용은 3조원이 들었다. 이 당시는 생어시 퀀싱 방식으로 염기 하나 하나를 분석했기 때문에 그만큼 시간과 비용이 많이 든 것이다. 2008년에는 생어 시퀀싱이 아닌, 차세대염기서열분석(Next-Generation Sequencing, NGS)가 등장하면서 홀게놈 시퀀싱을 무려 6개월만에 약 10억 정도의 비용으로 분석을 하게 되었고 이 NGS는 발전을 거듭하면서 2019년 현재는 100만원 미만의 가격으로 2일 정도 만에 분석이 가능하게 되었다. 옥스퍼드 나노포어 (Nanopore)라는 새로운 NGS는 무려 15분만에 시퀀싱을 하기도 하니, 더 이상 유전체 분석을 하는 데는 시간과 비용은 문제가 아닌 시대가 된 것이다.

리서치 분야에서도 놀라운 데이터들을 쏟아 내고 있다. 2015년 한 해 리서치 연구에 1년 동안 전 세계적으로 약 2,600조원의 연구 기금이 마련되었고, 무려 1.5조의 염기 데이터가 미국의 공인 데이터베이스에 축적되었다고 한다. 같은 기간 2,600만개의 연구 논문이 발표가 되었고 23만건의 임상연구가 수행되는 가히 메가트렌드의 분야가 유전체 분야인 것이다. 이 숫자는 매년 2배씩 증가하고 있으니 유전체 연구가 얼마나 광대하고 유전체 데이터가 얼마나 많이 쌓이고 있는지는 상상을 초월하는 것이다.

이런 광대한 규모의 데이터를 주도하는 것은 개인이나 연구소, 회사를 뛰어 넘어 국가 차원에서 경쟁을 하고 있다. 이 경쟁에서 가장 모범적인 국가는 영국이다. 영국은 이미 50만명의 건강한 사람을 대상으로 유전체, 라이프로그 (Lifelog) 등의 데이터를 체계적으로 모아 놓은 UK 바이오 뱅크를 전세계에 공개하고 모든 연구자들이 자유롭게 사용하도록 했다. 최근에는 지놈잉글랜드가 500만명 대상의 홀게놈 프로젝트 계획을 발표했다. 미국 또한 암환자 대상의 토탈오믹스 (유전체 뿐 아니라 전사체, 단백체, 후성유전체, 임상 정보 등)을 잘 갖추어 놓은 TCGA 데이터 등을 전세계에 공개해 놓았다. 우리나라도 지난 1 0여 년 동안 꾸준히 유전체 데이터를 국가 차원에서 모아 놓았는데 대표적인 것이 한국인칩으로 약 20만 명의 유전체 데이터를 확보해서 작년부터 질병관리본부 홈페이지를 통해 데이터를 공개하여 연구자 누구나 사용할 수 있도록 해왔으며 문재인 정부 들어 가장 큰 과학 국책 과제인 K-DNA 프로젝트를 통해 100만 명의 홀게놈 데이터를 생성하려고 하고 있다.

산업계에서는 홀게놈 시퀀싱을 분석한 인구수가 2017년 전세계적으로 약 200만 명에서 2025년 약 10억 명으로 크게 늘 것을 예상하고 있다. 즉 지금부터 불과 5년 뒤이면 전 세계의 1/6, 아마도 대한민국의 성인 대부분이 홀게놈 시퀀싱을 해 놓은 시대가 온다고 하면 이를 통한 의료, 산업의 변화는 대단할 것으로 보인다.



암 정밀 의학 분야에서의 임상 적용

유전체 정밀 의학 임상 적용의 상당 부분은 암의 진단과 치료에 집중되고 있다. 암의 생성은 체세포 변이를 통해 암 종양 억제 유전자가 기능을 제대로 못할 때 생겨나는 분자생물학적 기전이 잘 밝혀져 있어서 이 분야의 발전이 제일 앞서 있다.

가장 먼저 임상 현장에 적용된 분야는 맞춤 항암 표적 치료 (Target Therapy)이다. 
폐선암의 경우를 예로 들면, 같은 폐선암이라고 다 동일한 병리적 소견과 임상적 양상을 보일까? 최근 연구는 그렇지 않다고 말하고 있다. 폐선암이라 하더라도 폐선암에 걸린 동양사람의 40퍼센트는 EGFR 돌연변이를 가지고 있고 또 다른 15퍼센트는 K-RAS 돌연변이를 가지고 있으며 또 다른 5퍼센트는 ALK 돌연변이를 가지고 있다고 조사되고 있다. 폐선암의 표적 치료에 있어 가장 유명한 연구 중 하나인 IPSS(Iressa Pan-Asia Study) 연구를 살펴보면 1,217명의 폐선암 환자 중 261명이 EGFR 변이를 가지고 있었는데, 변이가 있는 그룹에서는 전통적인 항암제인 Carboplatin/Paclitaxel(CP)에 비해 이레사 게피티닙의 경우 무진행 생존기간(Progression Free Survival, PFS)가 9.5개월로 더 길었다 [1]. 보건복지부는 전세계에서 제일 먼저 차세대염기서열분석 (NGS) 기반의 동반 진단 (Companion Diagnosis)에 대하여 2017년부터 급여 정책을 시행했다. 이 정책에 힘입어 전국의 거의 모든 의과대학 병원과 암 센터 들이 앞다투어 NGS 장비를 들여오고 유전체 기반의 암 진단 서비스를 수행하고 있다. 

조직 단위의 유전체 분석은 최근에는 단일 세포 단위 유전체 분석(Single Cell Analysis)으로 발전하고 있다. 일반 조직의 시퀀싱이 시료 내의 모든 세포의 평균값을 분석하는 것이라면, 단일 세포 시퀀싱을 시료 내의 세포를 각각 개략적으로 들여다보고, 몇 종류의 다른 세포 타입이 존재하는 지를 파악한 뒤, 각각의 세포 타입에 대한 평균 값을 따로 만들어 분석한다는 것이 차이점이다. 당연히 비용은 일반 RNA 분석에 비해 세포 종류 수만큼 많이 들어가나, 그 데이터의 풍부함으로 인해 향후 암 진단의 상당 분야가 단일 세포 분석 방식으로 바뀔 가능성이 있다.

암 진단에서 이미 임상에서 활용하고 있는 또 하나의 중요한 발전 분야는 액체 생검 (Liquid Biopsy) 이다. 기존의 조직검사의 경우 접근이 어렵고 수술 등으로 암 병소가 제거되면 다시는 조직검사를 못하는데 비해 혈액이나 대변 등에서 DNA 분석으로 통해 조직검사처럼 비침슴적으로, 그리고 치료 후에도 지속적으로 정밀검사를 할 수 있다는 장점을 가진다. 암의 초기 단계에서부터 혈액 내에 암에서 유리된 암세포 혹은 DNA 조각들이 떠다니는데 전자를 CTC (Circulating Tumor Cell)이라 부르고 후자를 cfDNA (Circulating Cell free DNA)라 부른다 [2].
특히 cfDNA를 캡쳐해서 NGS 방식으로 분석하는 기술들이 속속 소개되면서 미국의 FDA에서는 이미 임상에서 조직검사를 대체하여 승인 중에 있다. 특히 암의 초기 단계에서 영상의학 진단 전에 분자생물학적 진단을 통한 암의 조기 발견을 위해 대규모 연구가 진행되고 있는데 대표적인 연구가 일루미나의 자회사인 그레일 (Grail)의 경우 1조원의 투자를 통해 유방암 환자 10만명의 혈액내 DNA를 모아 순차적으로 임상 결과를 발표 중에 있다. 조만간 혈액을 통한 암 진단과 유전자에 따른 맞춤 처방이 현실화 될 것으로 보인다. 

이외에도 암 치료에 있어서 획기적인 발전을 이룬 암면역항암제 치료의 고도화를 위해 암 바이오 마커 개발을 위해 유전체 변이 정보를 활용하는데 이를 종양변이부담(Tumor Mutation Burden, TMB)이라고 하며 다양한 방식의 암 바이오 마커 발굴을 통해 개인맞춤면역항암제 시대가 도래될 것이다. 나아가 암의 유전 변이 뿐만 아니라 환자의 면역 세포 유전 분석까지 고려하여 맞춤 암 백신 (Cancer Vaccine)을 조제하여 암을 치료하는 시대도 올 것으로 보인다. 
암을 영상으로, 조직검사로 진단하던 시대에서 유전체 데이터 특히 토탈오믹스(Totla-Omics)로 불리는 빅데이터 기반의 암 진단과 치료의 정밀 의학 시대가 열리고 있는 것이다.



헬스케어 분야에서의 임상 적용

유전체 지식의 임상 적용은 암 분야 뿐만 아니다. 심근경색이나 치매, 당뇨병 같은 주요 질환에 대해 유전자전장연관분석(Genome-Wide Association Study, GWAS)가 대부분 마쳐졌고 핵심 마커 들이 발표되고 다시 메타분석 등을 거쳐서 유전자 변이 (SNP) 정보를 통한 질병 예측이 어느 정도 가능해 졌다. 대표적인 예가 치매 유전자로 알려진 APOE이다. 즉 APOE 유전자의 Haplotype인 ε4/ε4 경우 치매의 상대 위험도는 7~20배까지 증가하는 것으로 알려졌다. 심근경색과 관련된 대표적인 유전자인 CDKN2A/2B 유전자 경우 여러 개의 GWAS 연구에서 유의 확률이 무려 10-30 정도나 될 정도로 질병과의 상관성이 높은 유전자 마커로 알려져 있다 [3]. 이처럼 잘 알려진 유전자 변이 정보를 가지고 여러 회사에서 질병 예측 서비스를 경쟁적으로 내 놓고 있는데 이는 얼마나 정확할까? 크레이 벤터는 미국의 대표적 유전체 질병 예측 서비스 업체인 23앤드미(23&me)와 네비제닉스 (Navigenics)의 질병 예측 결과를 비교해 2009년 네이처에 발표했다 [4]. 그 결과 두 회사의 결과가 일치하는 경우도 있었지만 정반대로 예측하는 경우도 있었다. 이는 각 회사들이 선택한 마커가 다르고, 그 마커들의 조합을 하는 과정에서 회사마다 다른 기법을 사용하기 때문이다. 과학을 근거로 만들었다는 예측 서비스가 같은 사람을 대상으로 다른 결과를 보여 준다면 소비자들의 혼란은 당연할 수밖에 없어 한동안 질병 예측 서비스는 과학자들의 비판의 대상이 된 것도 사실이다. 

최근 들어 영국 UK 바이오 뱅크 같은 대규모 유전자 코호트가 공개되고 딥러닝 기술이 발전되면서 수 개의 유전자가 아니라 적게는 수백 개, 많게는 수 천개의 유전자 마커를 대상으로 빅데이터 AI 기반의 질병 예측 모형이 소개되기 시작했다. UK 바이오 뱅크의 데이터를 활용한 연구에서, 22,242명의 심혈관 질환 환자와 460,387명의 일반 대조군에서 비교 분석을 위해 사용된 170만 개 유전자 마커에서 202개의 마커를 추출하여 이를 메타GRS (metaGRS)라는 방식의 유전적 위험도를 계산하여 심혈관 질환 예측 모형을 만들었다. 기존의 흡연, 당뇨, 가족력, 체중, 혈압, 고콜레스테롤 등의 위험인자와 메타GRS를 같이 넣고 모형을 만들었더니 정확도를 의미하는 C-index가 최대 70%까지 올라가는 것을 보여주었다 [5]. 앞으로 질병 예측 모형은 이처럼 대규모 코호트 기반의 유전체 다중 마커와, 라이프로그 데이터 등이 결합되는 방식으로 고도화가 될 전망이다. 

또한 개인마다 다른 유전자 변이에 근거한 맞춤 건강관리 (Personalized Health Care)도 중요한 임상 적용의 분야가 될 것이다. 예를 들어 비만과 관련해 가장 유명한 유전자인 FTO 유전자는 가장 많은 전장유전체연관분석(GWAS)에서 최종 비만 유전자로 선정되곤 하는 유전자이다. 유전자에 따른 영양 가이드가 가장 많이 연구가 된 유전자이기도 하다. FTO 유전자의 대표적인 마커인 rs99390609의 AA 유전형은 비록 쉽게 살이 찌는 유전형이나 저지방식이를 했을 때는 체지방이 비례해서 줄어든다. 반면 변이가 없는 TT 유전형의 경우에는 저지방식이를 해도 체지방엔 큰 영향을 주지 않는다 [6]. 즉 누구나 같은 식단을 추천 받는 것이 아니라, 사람마다 다르게 식단을 추천 받는 것을 영양유전학 (Nutrigenomics)라고 한다. 영양 뿐 아니라, 운동, 탈모, 피부 특성, 알코올 분해, 아침형 인간, 와인 선호도 및 조상 찾기 등 질병과 무관한 개인의 특성 및 웰니스 분야에 대해 전세계적으로 의사의 처방 없이 검사할 수 있는 직접소비자검사 (Direct to Customer, DTC)가 점차 확산되고 있다. 

이 분야의 선두 주자는 23andme(23&me)로서 한때 미국 FDA로부터 서비스 중단을 권고 받기도 했지만, 꾸준히 데이터를 모으고 연구 활동을 지속적으로 한 결과 2015년에 블룸 증후군(Bloom Syndrome) 등 36개 유전 질환에 대해, 2017년에는 알츠하이머 치매, 파킨슨병 등의 비교적 흔한 질환 및 셀리악병 등 8개의 유전질환에 대해 추가적인 서비스 승인을 얻었다. 2018년 8월부터는 8개 33개 변이에 대한 약물 유전체 서비스를 시행했고 2019년에는 딥러닝 방식의 다유전자위험점수(polygenic risk scores, PRS)를 이용한 당뇨의 예측 모형에 대해 DTC 판매를 허가 받기도 했다. 국내에서는 보건복지부가 2016년 12개 항목에 이어 2020년에 56개 항목에 대해 추가적인 DTC 서비스를 확대하고 있는 중이다. 점점 소비자가 알 권리 향상과 데이터주체가 병원이 아닌 소비자로 넘어오면서 더욱 게놈 분석은 대중화될 전망이고 또한 데이터의 클라우드 저장 및 블록체인화 등 다양한 연계 산업들이 일어날 전망이다.



정밀 의학 시대의 새로운 윤리적 문제

이처럼 날로 고도화 되어가는 정밀 의료 시대에 예상치도 못한 새로운 윤리 문제가 대두되고 있다. 전통적으로 유전자 검사에 대한 두려움은 유전자가 개인의 운명을 결정한다고 하는 유전자 결정론과 유전자에 의해 우성 사회가 도래할 것이라는 생각 때문이다. 물론 안젤리나 졸리가 검사해서 유명해진 BRCA 유전자나, 배아.태아 단계에서 시행되는 희귀질환 유전자 등에 변이가 뱔견 되면 질병이 일어날 확률이 매우 높은 것은 사실이나 이런 경우는 전체 유전자 검사 중 일부에 지나지 않으며, 질병이 일어날 확률이 높은 경우에도 회피하거나 예방할 수 있는 다양한 솔루션 등이 제시되고 있기에 유전자 결정론은 지나친 기우인 것이다. 대부분의 질병은 유전자 만 가지고 설명할 수 없으며 오히려 환경적인 요인을 개선함으로 예방적 목적으로 활용할 수 있기 때문이다. 

보다 현장에서 느끼는 윤리적 문제는, 아직 미완성의 연구를 바탕으로 지나치게 상업적으로 활용을 하면서 불필요한 소비자들의 공포감을 이용한 마케팅 등이다. 변화하는 시대에 새로운 윤리적, 법적 문제를 잘 대응하면서 궁극적으로 건강을 증진시켜 건강 100세 인류의 꿈을 앞당기는데 유전체 지식들이 활용되기를 기대한다.



참고문헌

[1] Phillips CM etc. J Nutr. 2012 May; 142(5): 824-31
[2] Schwarzenbach H, Hoon DS, Pantel K. Nat Rev Cancer. 2011 Jun; 11(6): 426-37
[3] NJ Samani 등, N Engl J Med. 2007 Aug 2;357(5): 443-53
[4] Ng PC, Murray SS, Levy S, Venter JC. Nature. 2009 Oct 8; 461(7265):724-6
[5] Payne A, Cahill F, Sun G, Loredo-Osti JC, Abarin T. Genet Epigenet. 2014 Jun 11; 6: 21-30.
[6] Xiang L etc. Am J Clin Nutr. 2016 Apr; 103(4): 1162-70


저자약력

1989-1995  연세대학교 의학과
2003-2005  연세대학교 보건대학 석사
2005-2009  연세대학교 노화 과학 이학 박사
2006-2008  Tufts University, Boston, USA Genomics & Epigenetics LAB (박사후)
2013-2016  차의과대학 가정의학과 조교수
2017-2019  테라젠이텍스 바이오연구소 부사장
2019- 현재  강남메이저 (구,미즈메디) 경영원장
2018- 현재  국가생명윤리위원회 유전자 전문위원


저서

유전체, 다가온 미래의학 (메디게이트 뉴스 2018) 등

 


☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다. 

 

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용