본문으로 바로가기

BioINwatch

(BioIN + Issue + watch) : 바이오 이슈를 빠르게 포착하여 정보 제공

단백질 구조 예측 AI 기술의 가능성과 과제

  • 등록일2022-03-30
  • 조회수4821
  • 분류플랫폼바이오 > 바이오기반기술,  플랫폼바이오 > 바이오융합기술
  • 발간일
    2022-03-30
  • 키워드
    #단백질#구조예측#AI
  • 첨부파일
    • pdf BioINwatch22-22(3.29)●단백질 구조 예측 AI 기술의 가능성과 과... (다운로드 308회) 다운로드 바로보기
  • 차트+ ? 차트+ 도움말

 

BioINwatch(BioIN+Issue+Watch): 22-22

단백질 구조 예측 AI 기술의 가능성과 과제 

 

◇ 알파폴드2, 로제타폴드와 같은 AI 기반 단백질 구조 예측 프로그램은 수십만 개의 인체 단백질 기능에 대한 통찰력을 제공하여 신약개발 가속화 및 인공 단백질 제작에 활용될 것으로 기대하고 있으나, 다양한 생체분자와의 복합체 구조 예측에 대한 기술 발전이 필요할 것으로 전망

▸주요 출처 : Science, 2021 breakthrough of the year_Protein structures for all, 2021.12.16., Science, Computed structures of core eukaryotic protein complexes, 2021.11.11.

 

▣ Science는 인공지능 기반 단백질 구조 예측 프로그램 알파폴드2와 로제타폴드를 2021년 가장 혁신적인 연구성과로 선정

 ○ 지난 50년 동안 과학자들은 자연에서 가장 복잡한 문제 중 하나인 단백질접힘에 의한 단백질 3차 구조를 예측하기 위해 노력

   - X-ray, cryo-EM과 같은 고비용과 긴 시간이 소요되는 실험적 구조 결정 방법의 한계를 극복하기 위해 컴퓨터 기반의 구조예측 기술 개발이 시도

   - 2018년 이전까지 대부분의 구조 예측 프로그램은 CASP*기준으로 70점대 중반을 득점

* CASP : 1994년부터 2년마다 개최되는 단백질 구조 예측 학술대회(Critical Assessment of Structure Prediction)로 단백질 구조 예측 정확도 따라 점수를 배점. 현재 CASP14 (2020년)까지 개최

   - 실험적 구조 결정이 90점 이상의 정확도를 보이는 것을 볼 때, 컴퓨터 기반 구조 예측은 신뢰성이 부족했던 상황

 ○ 구글 딥마인드에서 개발한 최초의 AI 프로그램인 ‘알파폴드(Alphafold)’는 2018년 CASP13에 등장하여 평균 80점 내외로 90개 경기 중 43개 경기에서 승리

   - 2020년 CASP14에는 기계학습에 최적화된 182개의 프로세서 네트워크를탑재한 ‘알파폴드2(Alphafold2)’가 실험적 기술과 동등한 평균 92.4점을 기록하며 커다란 반향을 일으킴

 ○ 미국 워싱턴대의 단백질 디자인 연구소는 알파폴드의 인공 신경망을 기반으로3개의 추가적인 통합 신경망을 재설계한 ‘로제타폴드(RoseTTAFold)’를개발

   - 로제타폴드는 신경망 알고리즘은 간소화하면서도, 알파폴드와 유사한 결과를 도출.2020년에 개최된 CASP14에서 로제타폴드는 알파폴드2에 이어 2위를 차지. 80점 내외의 평균 점수를 획득

 
[CASP14에서의 인공지능 기반 구조 예측 프로그램의 점수]

noname01.png

 출처 : Science. Accurate prediction of protein structures and interactions using a three-track neural network. 2021.8.19.

 

▣  ‘AlphaFold2’와 ‘RoseTTAFold’ 프로그램 소스 코드를 Gib Hub*에 공개하며, 과학자들이 편리하게 활용할 수 있도록 지원

* 분산 버전 관리 툴인 깃(Git) 저장소 호스팅을 지원하는 웹 서비스, 영리적인 서비스와 오픈소스를 위한 무상 서비스를 모두 제공(출처 : 위키백과)

 ○ 비전문가들의 접근을 용이하도록 로제타폴드는 아미노산 서열만으로AI 구조 예측이 가능하도록 자체 서버를 구축

 ○ 구글 딥마인드는 유럽생물정보학연구소(EMBL-EBI)와 협력, 알파폴드2를 기반으로 21개 생물종의 360,000개 정도의 단백질 구조 예측 데이터를 공개

   - 데이터에는 인간 단백질 구조 23,391개가 등록되었으며 이는 모든 인간 단백질의 44%에 해당. 앞으로 다양한 생물종을 포함한 1억 개 이상의 구조 데이터를 제공할 예정

 

대표.png

알파폴드 구조 예측 데이터베이스(https://alphafold.ebi.ac.uk/)

 

 

...................(계속)

 

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.


관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용