BioINwatch
(BioIN + Issue + watch) : 바이오 이슈를 빠르게 포착하여 정보 제공예측을 넘어 새로운 구조를 디자인하는 AI 모델
- 등록일2024-05-16
- 조회수3368
- 분류플랫폼바이오 > 바이오융합기술
-
발간일
2024-05-16
-
키워드
#단백질 구조 생성 AI#로제타폴드 디퓨전#항체 약물 디자인
- 첨부파일
-
차트+
?
차트+ 도움말
예측을 넘어 새로운 구조를 디자인하는 AI 모델
BioINwatch(BioIN+Issue+Watch): 24-32
◇ 그간 AI를 활용한 단백질 구조 예측은 정확도가 매우 높아 생명현상에 중요한 단백질의 기능을 이해하는데 크게 기여하였지만, 앞으로 원하는 기능을 가진 완전히 새로운 단백질을 디자인할 수 있는 AI가 신약 개발에 큰 영향을 끼칠 것으로 전망 ▸주요 출처 : Nature News, ‘A landmark moment’: scientists use AI to design antibodies from scrach, 2024.3.19 |
■단백질 구조에 관한 AI는 기존의 구조 예측을 넘어 새로운 단백질 구조를 디자인하는 모델로 진화 중
○ AI 기반 단백질 구조 예측 성공(2020~2021년) 이후, 새로운 구조를 디자인하는 AI 모델이 개발되어 공개되기 시작
- 미국 워싱턴대학의 데이비드 베이커 교수 연구팀은 지난해 단백질 구조 생성 AI 모델, ‘로제타폴드 디퓨전(Rossettafold diffusion, RFdiffusion)’을 발표
관련 논문 : Nature, De novo design of protein structure and function with RFdiffusion, 2023.7.11
○ 해당 연구팀은 단백질 구조 예측 AI인 로제타폴드(Rossettafold, RF)*에 관한 논문을 2021년 발표
* 2021년 사이언스는 단백질 구조 예측 AI, 로제타폴드를 가장 혁신적 연구성과로 선정
- RF는 단백질 구조를 예측하는 정확도는 높지만 단백질 구조를 디자인 하는데에는 한계*가 있었던 상황
* RF는 주어진 아미노산 서열로부터 에너지가 가장 낮은(안정한) 구조를 계산하기 때문에 다양한 단백질 구조를 디자인하는데 오랜 시간이 걸린다고 설명
- 단백질 구조 분석은 아미노산 서열정보를 기반으로 3차 구조를 예측하는 연구라면, 단백질 디자인은 특정한 3차 구조를 형성하기 위해 어떤 아미노산 서열이 필요한지 추적하는 연구라고 설명
○ 연구팀은 Cryo-EM 등 실험으로 분석된 구조 데이터*를 RF에 학습시켜 단백질 구조를 디자인할 수 있는 생성형 AI 모델인 RFdiffusion을 개발
* 하나의 표적 단백질에 결합하는 다양한 항체에 대한 구조 데이터
- 생성형 AI 모델 중 노이즈가 많거나 불완전한 단백질 구조를 단계적으로 디노이즈(denoise) 하는 방식의 디퓨전 모델을 이용한 학습 체계를 채택
○ 또한 연구팀은 RF diffusion을 이용하여 세균과 바이러스 단백질의 특정 영역을 인식하는 수 천개의 항체를 디자인하고 실험실에서 합성한 후 표적 단백질과 결합하는지 확인하였는데,
- RF diffusion 모델로 디자인된 단백질의 결합 성공률은 10%* 이상으로, 기존 RF로 디자인된 단백질(1% 미만) 대비 결합 성공률에서 크게 향상
* 상대적으로 단백질 크기가 작고 2차 helix 구조가 명확한 단백질의 경우는 10% 내외이나 그 외는 아직까지 현저히 낮은 성공률을 보임
< 바이러스 단백질과 결합하여 숙주세포의 감염을 차단하는 항체 >
▶항체(pink)가 인플루엔자 바이러스 단백질인 헤마글루티닌*(yellow)과 결합하여 숙주세포 내 침투를 차단
* 인플루엔자 바이러스의 헤마글루티닌(hemagglutinin) 당단백질은 숙주세포 표면의 시알산(sialic acid)과 결합하여 바이러스가 숙주세포 내로 침입하는 데에 역할
출처 : Nature News, ‘A landmark moment’: scientists use AI to design antibodies from scratch, 2024.3.19.
■향후 10년 이내에 RFdiffusion과 같은 AI 모델이 항체 약물을 개발하는 방식으로 자리매김할 것으로 예측
○ 거의 모든 생명현상에 관여하는 단백질에 대해서 원하는 기능을 가진 최적화된 구조로 설계가 가능
- RFdiffusion 모델은 항체 외 단백질이 관여하는 모든 분야로 적용되어 단백질 기능 개선 및 최적화로 신약개발에 크게 기여할 것으로 전망
※ 현재는 소수의 기업만 RFdiffusion AI 모델을 이용해 항체 의약품을 개발 중이나, 핵산 결합 단백질(CRISPR, 전사인자 등), 백신, 세포치료제, 바이오센서, 나노구조체 등으로 적용 분야를 확장해 나갈 것으로 예상
- 또한 표적화가 어려운 G-단백질 결합 수용체*와 같은 단백질을 제어하는 신약 개발에도 기여할 수 있을 것으로 기대
* 생체 내 신호전달에 관여하는 막 단백질로 세포 외 노출 부분이 제한적이라 표적화가 어려움
○ 단백질 구조 디자인 AI 모델이 신약개발에 크게 기여할 것으로 전망되나, 실제 합성이 불가능한 경우 등 향후 해결되어야 할 문제들도 존재
- 자연에 존재하는 단백질 구조는 유동적이나, RFdiffusion 모델은 열역학적으로 가장 안정된 구조를 설계하기 때문에 유연한 구조를 반영하기 어려움
- 동역학적 문제를 반영하거나 합성 경로를 디자인하기 위해 다양하고 많은 실험적 데이터가 필요