BioINwatch
(BioIN + Issue + watch) : 바이오 이슈를 빠르게 포착하여 정보 제공어떻게 하면 단백질 구조 만큼 RNA 구조도 정확히 예측할 수 있을까?
- 등록일2025-04-03
- 조회수1624
- 분류생명 > 생명과학, 플랫폼바이오 > 바이오융합기술
- 원문링크
-
발간일
2025-04-03
-
키워드
#다양한 AI와 물리학 기반#RNA 3D 구조 예측#RNA 서열 생성(설계)
- 첨부파일
-
차트+
?
차트+ 도움말
어떻게 하면 단백질 구조 만큼 RNA 구조도 정확히 예측할 수 있을까?
BioINwatch(BioIN+Issue+Watch): 25-22
◇ RNA는 구조적 유연성이 큰 반면에 실험적으로 밝혀진 RNA 구조 데이터(2,000개 미만)는 단백질(20만개 이상)에 비해 매우 부족한 상황. 해당 자료에서는 RNA 구조 예측 연구의 최신 동향과 성과를 정리하면서 새로운 AI 기반 모델을 개발하거나 기존 모델을 개선하여 실험 수준의 정확도로 RNA 3D 구조 예측이 가능할지에 대해 검토 ▸주요 출처 : Nature, RNA function follows form – why is it so hard to predict?, 2025.3.24 |
◆︎ 어떻게 하면 단백질 구조 예측만큼 RNA 구조도 정확히 예측할 수 있을까?
○ 단백질 구조 예측 분야에서 AlphaFold가 2020년 CASP* 대회에서 혁신적인 성과를 거두면서 단백질 3D 구조 예측의 새로운 전기를 마련했으나, RNA 구조 예측은 여전히 난제로 남아 있는 상황
* Critical Assessment of Protein Structure Prediction
- RNA는 세포 내에서 DNA와 단백질의 중간체로만 여겨져 충분한 연구가 부족했고, 이로 인해 실험적으로 밝혀진 RNA 구조 데이터도 매우 제한적
- 또한 RNA는 구조적 유연성이 크고, 다양한 상호작용(이온, 비정형 염기쌍 등)으로 인해 기존의 AI 및 물리학 기반 모델로는 예측 정확도가 떨어짐
※ 20개의 아미노산으로 구성되는 단백질에 비해 RNA는 4개의 염기로 구성되어 정보량이 제한적이며, 학습할 수 있는 실험 구조 데이터도 20만 개 이상의 구조가 알려진 단백질에 비해 2,000개 미만으로 매우 적음
○ 이에 해당 자료에서는 RNA 구조 예측 연구의 최신 동향과 성과를 정리하면서 새로운 AI 기반 모델을 개발하거나 기존 모델을 개선하여 실험 수준의 정확도로 RNA 3D 구조 예측이 가능할지에 대해 검토
- 대형 언어 모델(LLM)과 물리학 기반 접근의 결합을 통해 RNA 구조 예측 정확도를 개선하고, RNA의 2차 구조를 적극 활용하면 3차 구조 예측 성능을 높일 수 있을 것으로 기대
◆︎ 여러 연구팀의 RNA 구조 예측 연구는 다양한 AI 및 하이브리드 기반 구조 예측 툴 개발로 추진
○ (trRosettaRNA) Deep Learning 기반 contact prediction + Rosetta 물리 기반 folding을 결합한 하이브리드 방법을 활용
- RNA 1차 서열로부터 2차 구조(hairpin, stem-loop 등)를 deep learning으로 예측한 후 2차 구조를 기반으로 Rosetta 물리 모델을 이용하여 3차 구조를 재구성
※ 학습 데이터로 CASP15, CASP16 등에서 공개된 실험 RNA 구조 데이터를 사용
- 기존의 물리 기반 모델이나 단순 AI 기반보다 더 우수한 정확도 확보. 특히, 중간 구조(2차 구조)를 적극 활용한 전략이 성공의 핵심
※ 2024년 CASP16에서 자동화 툴 중 4위를 기록, 기존 방법 대비 높은 정확도를 보임
○ (RhoFold) RNA 서열 내 공진화 정보(co-evolutionary information)를 추출할 수 있도록 LLM 기반으로 설계
- 약 2,300만 개의 RNA 서열로 사전 학습시킨 후 MLM(Masked Language Modeling) 방식으로 RNA 염기들의 패턴, 상호작용 학습
- 실험 구조 없이도 서열만으로 3D 구조 예측을 시도하며, 실험적으로 알려진 RNA 구조 데이터가 매우 부족한 상황을 극복
※ CASP15, CASP16에서 인간 전문가가 개입한 팀보다도 우수한 성능을 보이며, RNA-단백질 상호작용 예측 및 약물 설계에도 활용 가능성을 입증
< AI 툴(붉은색)과 실제 실험(회색)으로 분석한 RNA 구조 비교 >
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.