본문으로 바로가기

기술동향

단백질 입체구조 연구에 인공지능이 가져온 새로운 변화와 미래

  • 등록일2024-11-05
  • 조회수58
  • 분류기술동향 > 생명 > 생명과학
  • 자료발간일
    2024-11-05
  • 출처
    한국경제
  • 원문링크

 

 

단백질 입체구조 연구에 인공지능이 가져온 새로운 변화와 미래

 

 

◈본문

생명과학은 육안으로 보이는 세상과 보이지 않는 미시의 세상을 연계하여 다양한 생명현상을 규명하고, 환경과 의료를 포함한 다양한 분야에 활용되어 인류의 안전과 복지에 기여한다. 또한, 생명과학은 문명의 발전과 함께 봉착하는 다양한 난제들을 해결하기 위해 지속적인 발전과 함께 쉽게 해결하지 못하는 문제점들을 극복하고자 다양한 돌파구를 만들어 간다. 최근 코로나19 팬데믹으로 인한 원격의료, 원격교육, 원격화상회의 등의 비대면 정책은 정보, 통신 및 인공지능 분야의 급속한 기술 진보를 촉발하였는데, 생명을 다루는 과학자들 또한 봉착한 난제들을 해결하고자 인공지능(AI)을 도입하는 시도가 증가하고 있다.

인공지능은 대규모 데이터가 가지는 정보를 학습시켜 인간의 지능을 시뮬레이션하는 컴퓨터 과학의 한 분야이다. 일례로, 2016년 구글의 알파고 프로그램은 바둑 기보와 수많은 바둑대결의 대규모 데이터 학습을 통해 이세돌 프로 바둑기사를 상대로 승리했다. 이와 같이 인공지능은 목적에 맞는 다양한 분야의 대규모 데이터를 학습함으로써 여러 분야에 활용될 수 있는데, 실제 생명과학 분야에서도 적극적으로 응용되고 있다. 인공지능은 대규모 생물학적 데이터를 목적에 맞게 빠른 시간 안에 처리할 수 있고, 암과 같은 다양한 질병을 조기에 발견할 수 있어 환자의 진단과 예후 예측을 돕는다. 또한, 인공지능은 신약을 개발하는데 보다 빠르게 인간의 특정 질환에 맞는 약물을 설계해서 신약개발 속도를 현저히 단축시키고 있다.

생명과학과 인공지능의 만남이 만들어낸 역대 최고의 발명 중 하나를 꼽자면 단백질 구조를 분석하고 설계 및 예측할 수 있는 인공지능의 개발이다. 실제 올해의 노벨화학상은 계산적 방법의 단백질 설계법을 개발하고, 이를 응용하여 새로운 단백질을 설계하는 ‘로제타’를 만든 데이비드 베이커 교수와 단백질 삼차원 구조와 기능을 예측하는 ‘알파폴드’를 개발한 구글 딥마인트 최고경영자 데미스 하사비스와 존 점퍼 구글 딥마인드 선임 연구원 두 사람에게 수여되었다.

단백질은 살아있는 모든 생명체를 형성하고, 생명 현상을 조절하는 화학적 도구로, 20개의 아미노산이라고 하는 기본 단위로 구성된다. 단백질은 수십 개에서 수천 개의 아미노산들이 긴 사슬 형태로 연속적으로 연결되고, 아미노산의 특성에 기반하여 서로 꼬이고 접히면서 기능을 갖는 삼차원 구조를 형성한다. 각 아미노산들은 물에 친화력이 높은 아미노산과 물과 친하지 않은 아미노산들로 그 화학적 특성이 구분되는데, 단백질 입체 구조에서 물과 친한 아미노산들은 단백질 표면에 위치하여 물과 접촉할 수 있는 확률이 높고, 물과 친하지 않은 특성을 갖는 아미노산들은 단백질 입체 구조의 내부에 위치하여 물과의 결합을 최소화한다. 이러한 개별적인 아미노산의 화학적 특성과 반복적인 아미노산 배열의 특성은 결국 단백질 구조 예측을 위한 학습 정보로 활용될 수 있다.

또한, 실험적으로 규명된 단백질 입체 구조 정보도 인공지능의 학습에 중요한 데이터로 활용된다. 단백질 입체 구조의 분석은 고순도의 단백질을 결정화하고 엑스선을 이용하여 구조를 규명하는 엑스선결정학, 용액에 녹아있는 작은 크기의 단백질의 구조를 분석하는 핵자기공명법, 그리고 단백질을 본연의 상태를 유지하면서 초저온으로 급속하게 얼리고, 전자빔을 이용하여 단백질 구조를 규명하는 초저온 전자현미경 방법이 있다. 이러한 방법들로 현재까지 해석된 단백질 입체 구조는 약 19.5만개로 단백질 데이터 뱅크에 등록되어 있다. 동일한 아미노산 서열일지라도 주변에 인접한 아미노산들이 무엇인지, 그리고 세포 내에서 세포질 혹은 세포막에 위치하는지에 따라서 다른 단백질 구조를 형성할 수 있기에, 생체 내 기능을 수행하는 실제 단백질들의 입체 구조 정보는 단백질 구조를 설계하고 예측하는 인공지능의 학습에 중요한 데이터로 활용되고, 이를 통해 단백질 구조 예측 정확도를 높일 수 있다.

단백질 입체 구조와 기능을 예측하는 ‘알파폴드’는 현재 인간이 가지고 있는 약 2만 여개의 단백질 구조를 예측함과 더불어 자연계에 존재하는 약 2억개의 단백질 모델 구조를 생성하고, 알파폴드 단백질 구조 데이터베이스에 접속하여 단백질 예측 구조에 이용할 수 있도록 제공하고 있다. 알파폴드가 예측하여 제공하는 모든 단백질 구조는 높은 정확도 단백질 구조를 예측한다는 점에서 혁명적인 일이다. 하지만, 실제 알파폴드로 예측된 단백질 예측 구조가 실험적으로 해석된 생체 내 단백질 구조와 다른 경우도 발견되기 때문에, 알파폴드의 단백질 모델 구조를 활용함에 있어 실험적 증명도 함께 병행되어야 한다.

인공지능을 활용한 단백질의 구조 예측은 자연계에 존재하는 단백질에 국한되지 않고, 기존에 존재하지 않았던 새로운 단백질을 설계할 수 있는 길을 마련했다. 베이커 교수 그룹이 개발한 ‘로제타’는 원하는 단백질 구조를 제시하고, 제공한 단백질 입체구조에 맞는 아미노산 서열을 결과로 얻는 새로운 방법을 적용할 수 있었고, 실제 2021년 인플루엔자 바이러스를 모방한 단백질을 활용해 새로운 백신을 개발하여 이를 증명하였다. 인간이 새롭게 디자인해서 만들어내는 인공단백질 설계 분야의 활성화는 앞으로 산업에 필요한 효소 단백질, 치료제와 백신개발 등 여러 분야에 활용될 것이다.

그동안 단백질의 입체 구조를 해석하는 전문가들은 거대복합체와 세포막에 존재하는 막단백질들의 생산 및 결정화가 매우 어려워 입체 구조를 규명하는데 많은 한계점을 가져왔다. 최근 초저온 전자현미경을 이용한 입체구조 해석 방법은 이러한 문제점을 극복하고, 실험적으로 확보된 단백질 입자의 구조 데이터, 인공지능을 활용한 데이터 처리, 그리고 알파폴드의 입체 구조 모델을 활용하여 보다 빠르고 정확하게 단백질의 입체 구조를 해석하는 길이 마련되었다. 최근에는 세포를 실험 샘플로 하여 세포 안에 존재하는 생체 단백질 자체의 입체 구조를 초저온-전자 단층 촬영법을 이용해서 규명하는 연구도 진행되고 있어, 단백질 입체 구조 연구와 인공지능의 융합은 세포 내에서 일어나는 역동적인 생명현상을 고해상도로 분자 수준에서 해석하는데 활용될 것이다.


이영진 한국생명공학연구원 박사가 실험실에서 단백질 입체구조 규명 연구를 수행하고 있다.




 

...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

자료 추천하기

받는 사람 이메일
@
메일 내용