전체 메뉴 사이트맵

닫기

본문 바로가기

BioINpro

(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공

홈 > 지식IN > BioINpro

scrap print facebook twitter naverBand url
글 읽기

국내외 바이오 빅데이터 현황 및 활용 방안

저자 이세민 교수 소속 UNIST 생명과학부
발간일 2019-01-31 조회수 2838
발행호 2019년 Vol.59
첨부파일

국내외 바이오 빅데이터 현황 및 활용방안.pdf(1148.537 KB)

평점 5점만점에 5.0점입니다. (참여자 2명)

1. 4차 산업혁명과 바이오 빅데이터  

. 개요

4차 산업혁명에 대비하여 어떻게 국가적 경쟁력을 확보해야 할 것인지에 대한 논의가 한창 뜨겁다. 빅데이터 분석, 인공지능, 로봇공학, 사물인터넷, 무인 운송 수단, 3차원 인쇄, 나노 기술 등이 4차 산업혁명의 핵심 분야로 언급되고 있는데, 바이오 분야 역시 이러한 인공지능과 빅데이터 분석 등이 융합된 대표적인 4차 산업혁명의 대상이 될 것으로 보인다. 특히 탈중앙화와, 공유, 개방, 개인 맞춤을 화두로 하는 4차 산업혁명은 인공지능 기반의 바이오 빅데이터 분석을 통한 개인 맞춤형 헬스케어와 궤를 같이한다고 볼 수 있다.

바이오 분야에서의 빅데이터는 생활 습관 데이터, 임상정보, 건강보험정보, 약물반응성 데이터, 유전체 정보 등 매우 다양한 형태로 나뉘며 이렇듯 복잡한 이질성을 갖는 바이오 빅데이터를 어떻게 생산, 수집, 관리, 통합 분석하여 새로운 가치를 창출할 것인가가 4차 산업혁명 시대를 맞이한 바이오 분야의 숙제라고 할 수 있다. 특히, 빅데이터 분석기술이 보건의료에 접목되면서 보건의료 정책, 보건의료기술 개발, 보건의료 비용 절감 등 다양한 보건의료 영역에서의 혁신이 기대되고 있는 만큼 산···병은 물론이고 국가 차원의 대응 역시 절실한 상황이다.

      

나. 바이오 빅데이터 활용 내용


 1)  학계

 


  미국에서는 2005년부터 국립 암 연구소(National Cancer Institute)와 국립 인간유전체 연구소(National Human Genome Research Institute)의 공동연구로 대규모 암유전체지도 프로젝트(The Cancer Genome Atlas, TCGA)를 통해 30여 가지의 다양한 암종에 걸친 10,000명 이상의 암환자들의 암 원조직과 동일 환자에게서 얻어진 정상조직 샘플을 확보하여 유전체 데이터뿐만 아니라 전사체, 후성유전체, 단백체 등의 다중오믹스 분석을 통해 다양한 형태의 체세포 돌연변이들을 검출하여 데이터베이스화하였다. TCGA 프로젝트를 통해 생산된 데이터는 데이터의 성격에 따라 차등적 접근 권한을 부여하는 데이터 분양 시스템을 통해 관리되고 있으며 최종 가공 데이터인 유전변이 데이터, 유전자 발현량 데이터 등은 별도의 접근 권한 없이 누구나 자유롭게 웹을 통해 다운로드하여 활용할 수 있게 하였다. 이렇게 확보된 암유전체 빅데이터 분석을 통해 암종별로 암을 유발하는 유전체 돌연변이(driver mutation) 및 임상에서 잠재적으로 활용할 수 있는 돌연변이(potentially actionable mutation)들을 다수 밝혀내었으며, 암 기전 연구뿐만 아니라 암의 진단과 예후 예측에 활용될 수 있는 다양한 분자마커들을 확보하는 성과를 얻을 수 있었다(그림1).

 

그림 1. TCGA 프로젝트를 통해 생산된 데이터의 규모와 암종, 참여자 및 데이터 타입의 수 [출처: https://cancergenome.nih.gov/abouttcga]

2018년 종료된 TCGA 프로젝트를 통해서 확보된 암유전체 빅데이터는 다양한 암 연구에 활용되어오고 있으며 AI를 활용한 암종 및 암 아형 예측, 암 진단 및 예후 예측을 위한 기계학습 모델, 항암제 반응성 예측 모델 개발 등에 매우 중요한 데이터로 활용되어오고 있다(그림2). 이러한 TCGA 프로젝트는 2007년부터 시작된 국제공동협력연구인 International Cancer Genome Consortium으로 연계·확대되어 보다 대규모의 암유전체 빅데이터 구축이 진행되고 있다(그림3). ICGC 역시 대부분의 연구결과를 데이터 포털 사이트를 통해 공개하고 있어 많은 연구자들이 이를 이용한 응용 연구를 진행하고 있으며 관련 업계에서도 암유전체의 표준 데이터로 적극 활용하고 있다.

 

 

...................(계속)

 

* 로그인 하셔야 자세한 정보를 모두 보실 수 있습니다.


 

관련기사
"빅데이터 플랫폼 활용, 의료산업 발전으로 귀결" 2019-09-16
제 2회 빅데이터 헬스케어 심포지엄 2019-09-11
정부, 22개 빅데이터 센터 추가 선정…94개소 선정 완료 2019-09-06
"英 500만명 vs 韓 2만명"…뒤처지는 바이오 빅데이터 구축사업 2019-09-05
의료빅데이터, 활용에 한계‥제약산업 발전에도 손실 2019-08-26
"법 1년 늦어지면 10년 뒤처지는데..." 손도 못 댄 빅데이터 신산업 2019-08-22
보건의료 빅데이터 플랫폼사업, 여전히 법적근거 미비 2019-08-21
썩고 있는 의료 빅데이터-개인정보보호에 묶여 R&D 활용 유명무실 2019-08-19
"신약개발 위한 빅데이터 구축, 사회적 합의 우선돼야" 2019-08-14
AI신약개발 용두사미?!…4차산업혁명 정책 개선 필요 2019-08-14