본문으로 바로가기

산업동향

바이오 빅데이터 시대의 [차세대] 생명정보학

  • 등록일2021-12-02
  • 조회수1006
  • 분류산업동향 > 종합 > 종합


바이오 빅데이터 시대의 [차세대] 생명정보학


◈목차


1 차세대 생명정보학
2 왜 중요한가?
3 최근 많은 연구가 이루어지고 있나?
4 최근 국내·외 연구 동향은?
5 기초연구사업 지원 현황은?



◈본문


1 차세대 생명정보학
ㅇ 최근 폭발적으로 증가하고 있는 오믹스, 임상의료, 단일세포 유전체 등 다양한 종류의 이질적 데이터를 수집, 정제, 통합, 분석하기 위한 제반 정보분석에 관련된 학문으로, 기존 서열 중심의 생명정보학 기술에 데이터 해석과 가설 제안 및 검증을 위한 다양한 빅데이터 및 인공지능 기술이 융합된 형태로, 디지털 바이오의료시대를 구현하는데 필수적인 요인임.
 
☞ 차세대 생명정보학은 유전체, 전사체 등의 다양한 오믹스 데이터를 효율적으로 수집, 가공, 표준화하고 이들 이질적 데이터의 통합 분석을 위한 알고리즘 및 소프트웨어 개발 기술을 의미함.
☞ 수십만 명 이상 대규모 인구에 대한 유전체 및 임상 정보의 통합적 분석, 그리고 이를 위한 첨단 IT 기술의 접목을 포괄적으로 포함하는 개념임.
☞ 단일세포 유전체란 다양한 세포로 구성된 조직에서 단일세포를 분리하여 각 세포 별로 오믹스 데이터를 분석하는 방법으로, 기존의 방법이 조직을 구성하는 세포 혼합물의 평균치를 측정한 것에 비하여 직접적으로 세포의 종류와 조성을 파악할 수 있다는 장점이 있음.
☞ 기술적으로는 클라우드 컴퓨팅, 머신러닝, 인공지능 등의 첨단 IT 기술을 바이오 빅데이터에 접목하여 데이터의 분석/해석을 시도하는 융합 연구가 중요함.
☞ 생명정보 데이터가 대형화되고, 다양한 종류 데이터 사이에 존재하는 복잡한 관계를 유추하는 고도의 분석이 필요하기 때문에 빅데이터 마이닝 기술 및 첨단 인공지능 기술의 적용이 요구됨.
 
2 왜 중요한가?
ㅇ 유전체 시퀀싱 비용이 1,000달러 이내로 내려오면서 선진국 중심으로 전체 인구 대상의 유전체/오믹스 데이터를 만들고 임상의료 정보 및 생활습관 정보를 통합하여 디지털 바이오의료 시대를 앞당길 정보 인프라를 구축하고 관련 기술을 선점하려는 경쟁이 치열함.
ㅇ 차세대 생명정보학은 유전체 의약, 정밀의료, 디지털 헬스케어 등 바이오의료시대의 핵심적인 기술일 뿐만 아니라, 단일세포 분석과 같이 생명과학의 패러다임 변혁을 가져올 기술의 근간이기도 함.
ㅇ 딥러닝과 같은 고급 인공지능 기술을 바이오의료 빅데이터에 적용하기 위해서 바이오의료 분야와 IT 기술의 접목이 필수적이며, 차세대 생명정보학이 그 가교 역할을 할 것임.
 
☞ 전 세계적으로 수백만 명 이상의 개인 유전체 정보와 임상정보를 생산 공개하는 대규모 프로젝트가 지난 5년이래 다수 진행되고 있음. (예: 영국의 Genomics England는 50만 명 데이터를 공개하였고, 미국과 중국은 각각 100만 명의 데이터 취합을 목표로 진행 중임. 우리나라도 100만 명 목표의 국가바이오빅데이터사업을 기획하여 시범사업을 진행 중임.)
☞ 스마트워치 등 휴대용 진단기기의 보급과 함께 개인의 생활습관, 건강 및 임상 정보 또한 빠르게 축적되고 있으며, 이런 정보를 헬스케어에 활용하기 위한 제도적 기반 구축에 많은 진전이 있음.
※ 최신동향은 KISTEP 기술동향브리프 2020-13호 ‘스마트 헬스케어’를 참조.
☞ 지난 10년간 단일세포 분석기술의 발전, 보급은 세포의 기능에 대한 새로운 이해를 가능케 하는 혁신적 기술임. 가까운 시일 내에 살아있는 조직에서 위치정보를 포함하는 단일세포 분석이 가능할 것으로 예상되며 이는 임상 의료에서 큰 파급효과를 가져올 것으로 예상됨.
※ 2021년 1월호 Nature Methods에서는 ‘공간 분해능 단일세포 전사체(spatially resolved transcriptomics’를 “Method of the Year 2020”으로 선정하였음
※ 단일세포 시퀀싱 관련 최신동향은 NRF R&D Brief 2020-41호의 내용을 참조
☞ 또한 단일세포 오믹스 데이터와 같이 새로운 오믹스 기술로 얻어지는 데이터는 해석을 위한 참조용 공개 데이터와 분석 알고리즘이 아직 개발 초기 단계에 있어 새로운 데이터 및 분석 기술의 개발이 시급한 상황임.
☞ 최근 빅데이터 및 인공지능 기술을 적용한 단백질 구조 예측에 획기적인 성과가 창출되고 있으며 이는 신약개발 및 생명과학 연구에 지대한 영향을 미칠 것으로 예상됨. 따라서 국내 생명정보학 연구도 인공지능 기술을 접목한 연구 기반 확립이 시급함.
※ DeepMind사는 딥러닝 방법으로 단백질 구조를 계산한 AlphaFold2 논문에서 20종의 모델생물에 존재하는 36만 5천 개의 단백질 구조를 공개함. (2021.7. Nature)
 

...................(계속)

 

 

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

 

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용