본문으로 바로가기

제도동향

[S&T DATA] 산업 데이터 패권 경쟁-민감 정보 보호와 규제 완화가 바이오 혁신의 Key

  • 등록일2024-05-08
  • 조회수1593
  • 분류제도동향 > 종합 > 종합
  • 자료발간일
    2024-03-29
  • 출처
    한국과학기술정보연구원
  • 원문링크
  • 키워드
    #바이오 데이터#화합물 데이터#헬스케어#약물 개발#임상 설계
  • 첨부파일

 

 

[S&T DATA] 산업 데이터 패권 경쟁-민감 정보 보호와 규제 완화가 바이오 혁신의 Key


 

 

 

◈본문


  • 1.바이오 데이터 활용으로 산업 혁신 도모

 최근 눈부시게 발전한 인공지능(AI) 기술에 힘입어 바이오 데이터의 산업적 활용은 차세대 바이오 기술의 혁신과 유관 산업 발전의 핵심 요소로 주목받고 있다. 바이오 데이터는 저분자 화합물부터 복잡한 오믹스 데이터, 개인화된 헬스케어 데이터에 이르기까지 다양한 형태로 구성되며, 약물 개발, 임상 설계, 개인 맞춤 의료 및 환자 관리 등 산업적 활용도가 무궁무진할 것이다. 특히 방대한 데이터에 최신 딥러닝 기술을 적용함으로써 약물의 직접적인 설계에서부터 질병의 원인이 되는 복잡한 생물학적 과정을 해독하거나 타겟 발굴, 치료법과 진단법 개발을 촉진하는 통찰력을 얻을 수 있다. 이 사례 연구는 바이오 및 제약 분야에서 바이오 데이터의 중요한 역할을 탐구하며, 이를 전략적으로 활용하는 것이 어떻게 바이오 산업의 혁신적인 발전을 촉진하고 건강 관리의 미래를 만들어 가는지 살펴보고자 한다.


  • 2.바이오 데이터 유형별 활용 사례

<표 1>은 바이오 및 제약 산업 및 연구분야에서 주로 활용되는 데이터를 요약하고 있다. 각 데이터 유형은 고유한 속성과 응용성을 내재하고 있으며, 바이오 및 제약 산업의 디지털 전환에 중요한 역할을 한다. 이러한 데이터의 전략적 활용은 타겟 발굴, 신약 개발 가속화, 질병 진단, 개인 맞춤 의료 및 건강 관리까지 광범위한 분야에서 혁신을 가져올 수 있어, 각 데이터 유형에 따른 활용 사례를 보다 구체적으

로 살펴보고자 한다.


2.1 화합물 데이터

화합물 데이터는 제약 연구의 축적된 결과물임과 동시에 신약개발 가속화에 직접적으로 활용된다. ChEMBL, ZINC, PubChem과 같은 데이터베이스를 통해 접근할 수 있는 화합물 데이터는 화학물의 구조에 따른 물성, 활성, 독성, 약동학 및 약력학에 대한 귀중한 정보를 제공한다. 연구자들은 이 데이터를 활용하여 새로운 약물 후보를 식별 및 설계하고, 효능과 독성을 예측하기 위해 다양한 데이터 기반 계산 모델을 개발 중에 있다. 이들 데이터로 학습된 딥러닝 기술을 통해 약물 발견 과정을 가속화할 수 있었으며, 잠재적 치료법의 신속한 스크리닝 및 최적화 또한 가능해졌다. 2012년 이후 전 세계적으로 수백 개의 AI 신약개발 스타트업이 등장하였고, 이들 기업들은 화합물 데이터를 활용하여 신약개발 가속화 연구를 수행 중이다. 이러한 노력의 결실로 COVID-19 팬데믹 위기 때 약물재창출을 통해 람데 시비르와 같은 치료약을 발굴하기도 하였다. 2021년 이후에는 AI를 통해 개발된 약물 다수가 임상에 진입함으로써 성과를 이어가고 있다. 국내에서는 한국화학연구원의 화합물 은행에서 약물 개발과 관련된 화합물 데이터베이스를 구축 중에 있다.


<표 1> 바이오 데이터 유형별 현황

<표 1> 바이오 데이터 유형별 현황


2.2 단백질 구조 데이터

단백질 구조 분석은 질병 메커니즘의 이해 및 구조 기반 약물 설계의 핵심 정보를 제공한다. Protein Data Bank (PDB) 및 UniProt과 같은 데이터베이스는 단백질 서열과 3차원 구조에 대한 종합적인 데이터를 담고 있다. 딥러닝 기반의 단백질 3차원 구조 예측 모델 AlphaFold는 PDB 데이터를 기반으로 학습되었고, 전례 없는 정확성으로 단백질의 3차원 구조를 예측할 수 있게 발전했다. 이를 바탕으로 실험적으로 밝혀지지 않은 단백질을 포함해 현재까지 UniProt에 등록된 2억 개 이상의 단백질 서열에 대한 구조를 예측하고, 누구나 쉽게 활용할 수 있도록 데이터베이스를 제공하고 있다. 이러한 데이터는 질병의 타겟을 식별하고, 체계적인 약물 설계를 가능하게 함으로써 제약바이오 산업의 발전에 크게 기여할 것으로 기대를 모은다. 예를 들어, SARS-CoV-2, 즉 COVID-19를 일으키는 바이러스의 스파이크 단백질 구조를 예측하기 위해 AI를 적용함으로써 백신 개발을 가속화할 수 있으며, 면역치료제 개발에도 적극 활용되고 있다.


2.3 오믹스 데이터

오믹스 데이터는 유전체학, 단백질체학, 전사체학, 대사체학을 포함하며, 생물체 내에서 일어나는 생물학적 과정에 대한 전체적인 관점을 제공하고, 나아가 인간의 다양성, 질병에 대한 취약성, 그리고 치료에 대한 반응에 대한 깊은 통찰을 제시한다. 영국에서는 UK Biobank 사업을 통해 2006년부터 영국 40~70세 인구 중 약 50만 명의 일반인에 대한 바이오 메디컬 데이터 허브를 구축한 바 있고, Genomes Project 사업을 통해 10만 명의 암 및 희귀질환자의 데이터를 구축하였다.

유사한 사업으로 미국에서는 All of US 사업을 통해 100만의 데이터를 수집하고 있다. 이러한 유전체 데이터에 지식 그래프, 딥러닝, 데이터 마이닝을 적용함으로써, 유전자-질병 연관성 발견과 개인 맞춤 의학 전략 개발이 용이해졌다. 질병에 영향을 미치는 유전적 변이를 이해함으로써, 개인 맞춤형 치료법을 통해 효과를 개선하고 부작용을 줄일 수 있는 것. 실례로 화이자, BMS, 아스트라제네카 등 다수의 글로벌 제약사가 이 데이터를 바탕으로 타겟 발굴 700건, 바이오마커 발굴 400건 등 3,000건 이상의 연구 과제를 수행한 바 있다. 나아가 오믹스 데이터 분석은 바이오 마커를 통해 임상 시험에서 환자를 계층화함으로써 치료가 가장 유익할 가능성이 있는 환자군 분류를 가능하게 한다. 이러한 계층화는 임상 시험의 효과와 안전성을 향상시키고 새 로운 약물의 승인 역시 가속화시킨다.

국내에서는 K-BDS를 통해 정부과제의 지원으로 수행된 바이오 연구 데이터를 수집하여 데이터베이스화하고 있으며, 2024년에는 국가 통합 바이오 빅데이터 구축사업(총 연구기간 9년)을 추진하고, 1단계 사업으로 향후 5년간 6,000억 원의 지원을 통해 77만 명의 바이오 데이터를 구축할 계획이다.



...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용