본문으로 바로가기

BioINpro

(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공

[KRIBB 워킹그룹] de novo 단백질 디자인 기술의 발전 현황

  • 등록일2023-01-30
  • 조회수3063
  • 분류플랫폼바이오 > 바이오기반기술,  플랫폼바이오 > 바이오융합기술


de novo 단백질 디자인 기술의 발전 현황

2022년도 KRIBB 워킹그룹 이슈페이퍼 제8호


 

저자 한국생명공학연구원 중대질환진단융합연구단 안우찬, 박광현 박사 외 7명





개요


▉︎ 무한한 가능성의 인공 단백질


● 원하는 기능과 특성을 가진 단백질을 창조해내는 일은 생명공학, 의약학, 나노기술 분야에서 추구하는 미래형 신기술 목표 중 하나


● 인공 단백질 디자인은, 자연적으로 발생한 경우의 수의 범위를 넘어서 무한한 아미노산 서열 조합을 통해 자연계에 존재하지 않지만, 인류에게 필요한 기능을 갖는 단백질을 인공적으로 설계하여 만들어내고, 이를 광범위한 분야에 활용하고자 하는 미래형 기술

- 자연계 단백질의 아미노산 중 일부만 변경시키는 기존의 단백질 공학과 차별성을 가짐


▉︎ 단백질 디자인과 단백질 구조 예측


● 단백질 구조 예측 연구는 1차원의 아미노산 서열 정보를 이용해서 단백질의 3차 구조를 예측하는 연구 분야임


● 단백질 디자인은 단백질 구조 예측의 역순으로, 특정한 3차원 구조를 형성하기 위해서 어떤 아미노산 서열이 필요한지 추적하는 연구임


● 단백질 디자인 연구는 컴퓨팅 기술 발전과 구조생물학 데이터베이스 축적으로 비약적인 성장을 이루어 세계적 주목을 받고 있음

- 2021년, 미국의 노벨상이라고 하는 혁신상(Breakthrough prize)을 단백질 디자인 분야 선두 주자인 워싱턴대학교 데이비드 베이커(David Baker) 교수가 수상


▉︎ 인공지능 구조 예측 기술의 등장과 단백질 디자인과의 시너지


● 단백질 구조 예측과 단백질 디자인의 관계는 상호보완적으로, 단백질 구조 예측 기술의 성장은 단백질 디자인 기술의 성장과 비례함

- 단백질 구조 예측과 단백질 디자인은 실제로 역장(Force field)나 스코어 함수(Score function)를 공유. 단백질 디자인 원리 중 하나가 서열을 변이시키면서 반복적으로 구조 예측을 하는 것

de novo 단백질 디자인 기술의 발전 현황

● 2020~21년 알파폴드의 등장으로 단백질 구조 예측 분야를 넘어, 과학계 전체에 충격을 안김

- 2021년 사이언스지는 ‘올해의 혁신(Breakthrough of the year)’으로 인공지능을 이용한 단백질 구조 예측으로 선정(“Protein structures for all”)

- 2022년 MIT technology review에서 해마다 선정하는 10대 혁신(breakthrough) 중 하나로 ‘AI for protein folding’을 선정.

- 인공지능을 이용해서 과학계의 난제 중 하나였던 단백질 접힘 예측 문제를 해결하여, 암, 항생제 내성과 코로나 바이러스까지 다양한 의약학 분야에 영향을 주고 있다고 보고

- 선두 주자로 구글 딥마인드(DeepMind), 아이소모르픽 랩(isomorphic Labs), 워싱턴 대학교 베이커 교수 실험실(Baker Lab)을 지목


● 2021년 7월 알파폴드의 소스 코드가 공개되어 전세계 연구자들이 활용, 추가 개발할 수 있게 됨

- 공개 버전은 간소화된 알고리즘을 사용하여, 보다 많은 연구자들이 사용 가능하도록 함

- 인간을 포함하는 21개 모델 종에서 36만 개의 예측 구조 데이터베이스도 함께 공개. 현재는 2억 개 이상의 예측 구조를 제공하고 있음

- 알파폴드의 소스코드 공개 이후, 알파폴드를 인용하는 학술논문과 사전출판물(preprint)이 기하급수적으로 증가


● 단백질 구조 예측 기술의 비약적인 발전으로 새로운 단백질 디자인 기법들이 개발 및 보고되는 중

- 단백질 구조 예측 인공지능의 발전 또한 현재진행형이므로, 두 기술의 혁신적인 발전을 기대

de novo 단백질 디자인 기술의 발전 현황


● 2021년 미국 워싱턴대학교 베이커(David Baker) 교수 연구팀에서는 알파폴드보다 적은 양의 하드웨어를 이용하여 알파폴드와 유사한 성능 혹은 정확도를 가진 로제타폴드(RoseTTAfold)를 개발 및 공개.

- 초거대 기업의 연구 성과를 대학의 연구팀에서 인공지능 전문가 없이 재현했다는 점에서 주목

- 기존에 알파폴드의 소스코드가 공개되지 않은 상황에서, 다른 연구자들이 알파폴드와 같은 기술 혜택을 누릴 수 있도록 함


de novo 단백질 디자인 기술의 발전 현황


● 메타(Meta, 구 페이스북)에서도 2022년 11월 단백질 구조 예측 인공지능 모델 ESM폴드를 공개. 기존의 알파폴드와는 다른 방법론을 사용인 대형 언어 모델(LLM)을 사용한 모델

- 일반적인 하드웨어로 수 분이 걸리는 알파폴드의 구조 예측과 달리, 검색하듯이 매우 빠른 속도로 예측할 수 있다는 장점이 있지만, 정확도는 상대적으로 낮다는 평가

- ESM폴드가 예측한 6억 개 이상의 metagenomic 단백질 구조 예측 데이터베이스를 동시에 공개


de novo 단백질 디자인 기술의 발전 현황


● 2022년 단백질 구조 예측 대회 CASP15에서 알파폴드 기반의 예측 모델이 상위권을 차지

- CASP15에는 DeepMind의 알파폴드는 참가하지 않았지만, 상위권을 차지한 대부분의 예측 모델이 알파폴드를 기반으로 함

- 28위의 베이커 교수 연구팀 예측 모델이 알파폴드를 사용하지 않은 모델 중 최상위를 차지


de novo 단백질 디자인 기술의 발전 현황

...................(계속)

 

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

 

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용