주 메뉴 바로가기 본문으로 바로가기

전체 메뉴 사이트맵

닫기

본문 바로가기

BioINpro

(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공

홈 > 지식IN > BioINpro

scrap print facebook twitter naverBand url
글 읽기

바이오 연구데이터 현황과 활용방안

저자 이병욱 소속 한국생명공학연구원
발간일 2020-04-06 조회수 5056
발행호 제74호
첨부파일

BioINPro_74호_바이오연구데이터_이병욱_최종.pdf(969.869 KB)

평점 평점이 없습니다.

 

바이오 연구데이터 현황과 활용방안


한국생명공학연구원 국가생명연구자원정보센터 이병욱

 

 

1. 바이오 데이터 개요


가. 개요


전 세계에서 한 해 동안 생산되는 데이터의 양은 대략 얼마나 될까요? 한 조사 기관에 따르면 2017년 기준 전 세계에서 하루 생성되는 데이터양은 2.5엑사바이트(1 엑사바이트 = 약 10억 기가바이트)에 달한다고 한다. 이는 해리포터 책 6,500억 권에 육박하는 데이터 규모로 이와 같이 기존의 데이터 용량을 넘어서는 거대한  규모의 다양한 정형·비정형 데이터를 ‘빅 데이터(Big Data)’라고 한다.

 

“빅 데이터는 21세기의 원유”라고 정의하고, 원유는 어떻게 가공하느냐에 따라 나오는 제품이 천차만별이듯이, 빅 데이터도 어떻게 저장하고, 관리하고, 처리하고, 분석하느냐에 따라 이전에는 알지 못했던 새로운 가치를 창조할 수 있게 되었다


생물학 분야에서 생산되는 빅데이터는 생물에서 생산되는 다양한 데이터로서 전통적인 방식으로 생산된 데이터가 아니라, 최신의 기술로 생산된 대용량의 데이터를 의미한다. 

 

2010년 새로운 NGS 기술의 발전에 힘입어 1인의 유전체를 5만 달러의 비용으로 한 달 만에 해독할 수 있게 되었으며, 새로운 3세대 NGS 기술이 개발되었다. 특히 Illumina에서는 2014년 초 인간 유전체를 1,000 달러에 해독할 수 있는 초고용량 장비인 HiSeq X10을 출시하여 본격적인 개인 유전체 시대를 열어가고 있으며, 이와 같은 기술발전은 생명의 다양한 유전체 정보가 빅데이터로 자리 잡게 되는 계기가 되었다. 


예를 들면, 2007년 구글의 ‘플루 트렌드’는 일정 기간 검색 분석을 통하여 독감 유형의 패턴과 독감발생 가능성이 높은 지역을 예측하는 독감예보서비스를 실시하였으며, 독감 환자 발생 현황을 빠르고, 정확하게 파악하였다.

 

이렇듯이 바이오 연구데이터는 바이오연구를 하면서 필수적으로 생산되는 데이터를  나타내며 무궁한 가능성이 있다. 연구데이터는 연구 결과에 대한 검증 도구로 활용, 재사용을 통한 노력과 비용 절감 등의 장점을 가지고 있다. 

 

따라서 연구자들이 생산한 데이터가 사장되지 않고 공유될 수 있도록 제도 및 절차를  마련하고 연구데이터를 공개할 수 있는 ‘Open Access Repository’ 구축 등의 재활용 체계 마련이 시급하다. 


나. 바이오 연구데이터의 중요성


바이오 연구데이터는 국가 바이오 과학기술 경쟁력을 좌우하는 원천이며, 최근 바이오 연구개발 방식도 데이터 기반으로 전환됨에 따라서 바이오 데이터의 중요성이 증가되고 있다. 

 

첫 번째, 데이터의 활용이 과학기술 경쟁격의 핵심으로 대두됨에 따라 바이오 데이터 가치가 증대하고 있다. 4차 산업혁명은 인공지능과 더불어 빅데이터가 중요한 변화의 동인임과 동시에 핵심 데이터의 확보와 데이터 분석활용의 중요성이 강조되고 있다.

 

두 번째, 바이오 분야 디지털 기술의 발전에 따라 데이터 기반의 연구개발(R&D)로 연구개발 패러다임의 변화하고 있으며, 바이오 분야 기술의 발전은 대규모 데이터 생산, 생산 데이터 종류의 다양화 등으로 바이오 분야 연구 환경을 변화시키고 있으며, 연구 방식도 기존의 생물실험 중심에서 데이터 중심으로 연구개발 패러  다임이 변화하고 있다.


마지막으로 공적 자금으로 생산된 연구성과물(데이터, 출판물 등)에 대한 쉬운   접근과 재활용을 강조하는 오픈사이언스 요구 증가하고 있으며, 전 과학 분야에서 오픈 엑세스 저널, 온라인 논문 공개 증가 등 개발, 공유 사례 증가와 연구개발 과정 및 성과의 개발공유를 국가적인 차원에서 추진하고 있다. 

 

         그림 1. 유전체 데이터의 증가속도(PLOS Biology, 2015)

 

...................(계속)

 

 

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

관련기사
사업공고 2021년도 국가 바이오 빅데이터 구축 시범사업 2차년도 유전체 보유 선도사업 공모 2021-11-25
정책동향 빅데이터 생물학-유전체 및 후성유전체 기초연구_기초연구본부 선정 R&D 이슈 연구동향(7) 2021-11-18
부처별정책 아시아-태평양 농생명 유전체 전문가 모여 최신 연구 성과 나눈다 2021-11-05
국내뉴스 마크로젠 "유전체 정보로 무병장수의 꿈 도울 것" 2021-11-04
기술동향 글로벌 유전체 이니셔티브 현황과 동의 모델 특징 2021-11-04
기술동향 [KHIDI 디지털 헬스케어 리포트] 빅데이터 기반 응급·중환자실 관리 시스템 2021-11-02
행사/교육 [한국바이오협회] “임상유전체 분석과 NGS Application”(재직자 과정) 교육생 모집 안내 2021-10-28
국내뉴스 폐암 면역항암제 반응 예측 가능해져...정밀 유전체 분석 활용 2021-10-20
국내뉴스 정밀의료 유전체 진단 기업 지니너스, 내달 코스닥시장 상장 2021-10-20
행사/교육 전사체-단일세포 유전체 분석 교육 (제43회 차세대 생명정보학 교육 워크샵) 2021-10-18