기술동향
인공지능(AI) 기반의 심층 생성모델을 이용한 다중 타깃 신약 디자인 연구 동향
- 등록일2025-09-29
- 조회수340
- 분류기술동향 > 레드바이오 > 의약기술
-
자료발간일
2025-09-05
-
출처
BRIC
- 원문링크
-
키워드
#인공지능#심층 생성모델#다중 타깃 신약 디자인#연구 동향
인공지능(AI) 기반의 심층 생성모델을 이용한 다중 타깃 신약 디자인 연구 동향
◈본문
요약문
최근 빅데이터 생산기술의 발전과 다중 오믹스 데이터(Multi-omics Data) 그리고 인공지능(AI) 알고리즘의 확대적용으로 다중 오믹스 데이터를 이용한 인공지능 기반의 다중 타깃 신약 디자인(Multi-target Drug Design)은 암을 포함한 다양한 질병의 복잡한 경로와 생물학적인 특성들을 고려한 신약개발이라는 ‘패러다임 전환’의 한 예라고 할 수 있다. 전통적인 단일 타깃을 이용한 치료는 단일경로의 차단이라는 단순 치료로 복잡한 질병 네트워크의 중복성 간과로 인해 약물에 대한 내성을 유발하는 경우가 많았다. 현재 인공지능 기술이 강화된 심층 생성 모델(DGM, Deep Generative Model)들을 이용하여 다양한 타깃을 한 번에 공략하여 약물에 대한 내성을 줄이고 질병치료의 효과는 크게 높일 수 있는 방향으로 신약개발이 이루어지고 있으며 AI 기술을 이용한 신약 디자인방식 전환에도 큰 기여를 하였다. 다중 타깃에 최적화(Multi-target Optimization)된 신약 탐색방식은 새로운 약물 후보물질을 생성할 수 있는 확장 가능하고 유연한 플랫폼으로 각광을 받고 있다. 이번 동향보고에서는 심층 생성모델의 종류와 장단점, 이들 모델들을 이용한 플랫폼들 그리고 연구 사례와 더불어 현재 인공지능(AI)을 이용한 신약 디자인의 한계와 미래 방향성에 대해서 살펴보고자 한다.
키워드
#심층 생성모델(DGM #Deep Generative Model) #인공지능(AI) #다중 타깃 신약 디자인(Multi-target Drug Design) #강화학습(RL #Reinforcement Learning) #다중 타깃 약리학(Polypharmacology) #De novo 신약 디자인(DNDD) #다중 타깃-다중 약물(Multi-target Multi-drug)모델
분야
바이오·의료융합 > 바이오·의료융합 기타
목 차
1. 서론
2. 본문
2.1. 다중 타깃 신약 디자인의 대두
2.1.1. 단일 타깃과 다중 타깃 신약 디자인의 비교
2.1.2. 다중 타깃 신약개발의 필요성
2.2. 최근 신약개발에 이용되는 심층 생성모델
2.2.1. 심층 생성모델에 이용되는 분자표현방식
2.2.2. 심층 생성모델의 종류와 장단점
2.3. 심층 생성모델을 이용한 다중 타깃 신약 디자인 적용
2.3.1. 다중 타깃 신약 디자인 연구사례
2.3.2. 인공지능 기반 신약 디자인의 한계와 미래 방향성
3. 결론
4. 참고문헌
1. 서론
현재 제약산업은 인공지능이 신약개발 과정과 헬스케어 비즈니스에 통합되면서 획기적인 변화를 겪고 있다. 최근 AI 기술의 발전으로 전통적인 신약개발 방식의 한계를 극복할 수 있는 새로운 패러다임으로, 딥러닝 기반의 생성 모델은 방대한 화합물 공간을 탐색하고, 약물-표적 구조예측, 약물-표적 상호작용, 그리고 결합 친화도 예측을 통해, 다중 목적 최적화(Multi-Objective Optimization)는 새로운 약물 후보물질들을 보다 효율적으로 설계하는 데 이용되고 있다 [1, 2].
인공지능 기반 모델들은 혁신적으로 발전하였고, AI 기술의 의학발전에 기여한 공로를 인정받아 작년 2024년 물리학, 화학 분야에서 세계 최초로 인공지능 원리의 정립 기술과 인공지능의 활용으로 단백질 구조분석에 공헌한 연구자들에게 노벨상을 수여하였다 [3]. 인공지능은 이제 물리학에서 생명과학 분야 및 바이오 헬스케어 전체에 영향을 미치며 연구의 중심축을 변화시키고 있다. 더불어 인간의 삶에 직간접적으로 영향을 미치는 분야로 발전하면서 앞으로도 노벨상 중심에 인공지능이 서게 될 것이라는 예상이 나온다. 기존의 신약개발 과정은 복잡하고 비용이 많이 들며 시간이 오래 걸리는 이유로, 새로운 치료제 개발에 10년 이상의 기간과 몇 조원이 소모된다 [4].
전통적인 방식은 광범위한 실험이 단계별로 진행되면서 이로 인해 제약회사들은 막대한 비용과 시간과의 싸움이 초래된다. 이처럼 오랜 시간과 막대한 재정적 투자가 들어 감에도 불구하고, 암치료제의 미국 FDA의 승인은 4% 미만으로 [5], 이는 약물이 암의 생물학적 기전과 어떻게 상호작용하는지에 대한 이해의 부족이 주요 원인이다. 이러한 한계는 신약개발의 효율성과 성공률을 저해하며, 궁극적으로는 환자에게 도달하는 치료제의 수를 제한하게 된다. 현재까지 뉴욕과 홍콩에 기반을 둔 인실리코메디신(Insilico Medicine)이 2019년 인공지능 기반 생성모델을 이용한 신약 디자인 및 약물 스크리닝을 통해 46일 만에 폐섬유종 치료약물 후보물질을 확보하는 데 성공하였다. 이후로 회사 내 자체 생성모델을 이용하여 세계 최초로 인공지능 기반 약물후보물질의 발굴에서 디자인까지 완료(End to End target discovery and design)하여 얻은 폐섬유종 치료약물 후보물질인 INS018_055는 임상 1상과 임상 2a를 마치고 임상 2b(2a 비해 더 많은 환자군을 확보해서 진행되는 임상)가 미국과 중국에서 진행 중에 있다 [6, 7].
이후로, 인실리코메디신의 뒤를 이어 꾸준히 생성모델들을 이용한 새로운 인공지능 기반 약물개발모델들이 소개되고 있으며, 앞으로도 여러 기업과 학계를 통해 개선된 인공지능 기반의 신약 디자인모델들이 선보일 것으로 예상된다. 전통적인 방식으로 찾아낸 신약후보 물질의 임상 1상 시험의 성공확률이 40-65%인데 반해, 인공지능을 통해 발견한 신약후보 물질의 임상 1상 시험 성공확률은 80- 90%에 달하는 것으로 집계되었다. 인공지능으로 디자인한 신약후보물질이 임상에서도 유의미한 성공률을 보여주고 있는 것을 확인할 수 있었고, 신약개발의 속도와 성공확률을 인공지능이 크게 높일 수 있다는 기대감이 높아지고 있다 [25]. 본문에서는 현재까지 AI 기반의 신약 디자인에 이용되고 있는 심층 생성모델(DGM, Deep Generative Model)의 종류와 이들 모델들의 장단점에 대해서 알아보고 자 한다. 또한, 이들 모델을 이용하여 개발된 플랫폼들과 연구 사례 그리고 현재 인공지능을 이용한 신약 디자인의 한계와 미래 방향성에 대해서도 함께 소개하고자 한다.
2. 본문
신약개발에서 기초단계인 표적 단백질의 발굴과 후보물질 선별(Drug Discovery) 단계에서 인공지능 모델링 기술을 이용함으로써 신약개발에서 높은 성능을 나타내고 있지만 [8] 타깃 분자에 따라 데이터의 부족은 모델의 성능을 떨어뜨릴 수 있고, 사용 가능한 데이터가 특정 화합물이나 생물학적 활성에 편향(Bias)될 수 있으며, 심층 생성모델은 ‘블랙박스’ 형태로 작동하기 때문에 모델이 어떻게 새로운 약물후보를 결정하는지 알 수 없고, 기존 데이터를 통해서 예측과 수행이 이루어지므로 신규성(Novelty)에 영향을 줄 수도 있다. 이런 이유로 심층 생성모델의 경우, 학습 데이터의 부족은 과 적합(Overfit)을 유발하기도 하고 기대하는 결과에 미치지 못하는 경우도 있다.
이렇게 여러 가지 인공지능 기반 모델들의 장단점들이 있음에도 불구하고 전통적인 신약 디자인 방식의 급속한 전환을 가져왔으며 신약개발의 초기단계부터 전반적인 응용단계까지 다양하게 활용되고 있으며, 빅데이터와 AI알고리즘의 활용은 신약개발의 신속한 발전에 커다란 영향을 주었다.
2.1. 다중 타깃 신약 디자인의 대두
이제 인공지능의 기술발전을 거듭한 결과, 단일 타깃 중심의 접근 방식에서 벗어나, 다중 타깃 약물 디자인(Multi-target Drug Design)의 적용이 가능하게 되었다. 1개 이상의 단백질과 상호작용하는 화합물을 예측함으로 서 암을 포함한 다양하고 복잡한 질병 네트워크를 파악함으로써 효과적이고 부작용이 적은 치료제의 개발에 응용되고 있다. 특히나 심층 생성모델을 이용함으로써 다중 타깃 신약 디자인을 이용한 신약개발의 가능성에 한 층 더 근접하게 되었다. 이런 일이 가능하게 된 배후에는 컴퓨터 성능의 급속한 발전, 빅데이터 분석, 그리고 고도화된 알고리즘의 등장이라고 할 수 있다. 머신 러닝(ML)과 딥러닝(DL)을 이용한 알고리즘은 방대한 생물학적 데이터를 처리하고 복잡한 패턴을 해석하며, 잠재적인 약물후보들을 예측하는 데 강력한 도구로 작용하였다. 이런 기술적인 진보는 약물-표적 결합 친화도 예측, ADMET 특성 평가, 구조기반 후보물질 생성 등 다양한 단계에서 신약 개발 프로세스가 정확하게 이루어질 수 있도록 기여하고 있다. 신약 디자인과 개발분야는 이러한 AI와 ML 기술을 활용하여 신약개발과정을 가속화하고 있으며 [4, 9, 15], 심층 생성모델은 기존에 존재하지 않는 새로운 타깃 약물을 생성하는 데 중요한 역할을 담당하고 있다.
2.1.1. 단일 타깃과 다중 타깃 신약 디자인의 비교
예전부터 단일 타깃을 이용한 질병치료는 단일경로 차단이라는 단순 치료로 복잡한 질병 네트워크의 중복성 간과로 약물에 대한 내성을 유발하는 경우가 많아 오래전부터 다중 타깃 신약 디자인에 대해서 거론되어 왔으며, 이미 전통적인 신약개발방식으로 다중 타깃 신약개발 파이프라인 플랫폼이 임상테스트 진행 중이거나 FDA 승인된 실례(Clozapine, Sorafenib, and Imatinib)들이 존재한다 (그림 1) [16].
그림 1. 단일 타깃 단일 약물과 다중 타깃 다중 약물 적용 경로 및 장단점
이러한 약물들은 대부분 전통적인 스크리닝 방식과 질병의 기전규명, 그리고 임상평가방식으로 개발되었으며, 초기에는 단일표적을 가정하고 개발했지만 지속적인 후속연구를 통해서 다중 타깃이 가능하게 되었다. 일반적으로 단일 타깃 기반 치료제(Single-target Therapy)의 경우, 초기에는 효과적일 수 있지만 시간이 지남에 따라 내성기전과 약물작용 경로의 중복 등이 나타나므로 치료경로가 막혀 치료효과가 급격히 떨어지는 경향이 있다는 결과가 이미 많이 보고되었다 [17, 18].
이러한 한계를 최근에는 AI 기반 모델을 이용하여 극복하고 자하는 연구들이 진행되면서 심층 생성모델을 이용한 다중 타깃 약물 디자인이 점점 관심을 받게 되었다. 방대한 화학 공간, 표적들 간의 상호작용 그리고 효능과 안전성 간의 균형을 동시에 고려해야 하는 점은 신약 개발에 있어 어려운 도전과제일 수 있지만 최근 심층 생성모델을 중심으로 한 인공지능 기술의 발전은 이러한 한계를 극복할 수 있도록 새로운 가능성을 열어 주었다 [2].
심층 생성모델은 생물활성, 분자 구조, 약동학(Pharmacokinetics) 정보가 축적된 대규모 데이터를 학습함으로써, 이들 특성들을 다 갖춘 맞춤형 특성의 새로운 분자 구조를 생성할 수 있는 강력한 수단이다. 1개 이상의 단백질과 상호작용하는 화합물을 예측함으로 써 타깃을 벗어날 가능성(Off-target Effect)을 사전에 평가하여 억제하고 이를 통해 신약개발 초기단계의 위험요소를 감소시킬 뿐만 아니라 새로운 화합물의 생성가능성을 높일 수 있다 [17]. 다중 타깃 약물 디자인은 단순한 단일 타깃 기반 치료제개발 보다 훨씬 복잡하고 어렵다. 이런 어려움에도 불구하고 심층 생성모델과 더불어 인공지능은 다중 오믹스 데이터, 화학적 특성정보, 환자 데이터를 통합하여 보다 정밀하고 예측능력이 뛰어난 약물반응 모델구축을 지원할 수 있게 되었다. 이러한 기술적 진보는 전통적인 약물 디자인의 한계를 넘어, 정밀하고 반복가능한 약물디자인의 자동화 가능성을 열어 주었다.
2.1.2. 다중 타깃 신약개발의 필요성
앞에서 이미 언급한 것처럼 암을 포함한 복잡한 질병들에 대한 이해의 폭이 넓어질수록 신약개발은 ‘단일 타깃-단일 약물(One-target One-drug) 모델에서 다중 타깃-다중 약물(Multi-target Multi-drug) 모델로 전환되고 있는 추세다 [2]. 이러한 경향은 여러 질병들이 복수의 생물학적 경로와 기전을 동시에 포함하고 있으므로 근본적인 접근방식의 변화가 요구되어 진다. 그러나 전통적인 방식의 실체적인 약물-타깃 상호작용을 예측하는 실험 과정은 많은 시간과 비용이 들어가기 때문에 실험 데이터를 보완하고 지원할 수 있는 정보제공이 가능한 인실리코(In silico) 기반의 실험예측(컴퓨터 내에서의 가상실험)을 효율적인 대안으로 주목하고 있다. 또한, 약물과 타깃 단백질 간 상호작용의 규명은 기존 약물의 새로운 표적을 발견하거나 신약을 탐색하는 다중 오믹스 기반 신약개발에서 핵심적인 역할을 한다 [20].
1.2.최근 신약개발에 이용되는 심층 생성모델
인공지능의 발전은 신약개발에 심층 생성모델의 도입을 통해 약물 탐색의 변화를 부여한다. 이러한 모델들의 경우, 약물후보물질 발굴단계를 수십 배 이상 가속화할 수 있으며, 효능, 안전성, ADMET 등 다양한 특성예측 등에 활용되고 있다. 이들 데이터를 이용한 새로운 약물 디자인이 가능하며, 다중 타깃을 동시에 만족하는 분자 디자인을 하고 실험 혹은 예측결과를 바탕으로 반복적인 학습수행이 가능하다. 심층 생성모델은 기존의 탐색기반 신약 개발을 넘어서, 데이터 기반 분자 디자인, 빠른 탐색, 다중 목적 최적화(Multi-Objective Optimization)를 가능케 하며 시간과 비용을 절감하면서도 정밀한 약물 개발을 가능하게 하는 핵심 기술로 급부상하고 있다. 특히, 심층 생성모델들은 de novo 분자 생성, 다중 타깃 약물(multi-targeted drugs) 디자인, 약물-타깃 상호작용 예측, ADMET 필터링 등 신약 개발의 다양한 단계에 적용되고 있으며, 이들 심층 생성모델들은 암, 신경질환 그리고 마약중독 등과 같은 복합적인 기전이 얽혀 있는 질환 들에서 좋은 결과를 얻을 수 있었으므로 더욱 주목받고 있다.
1.2.1.심층 생성모델에 이용되는 분자표현방식
그림 2. 3가지 유형별 분자표현 접근방식의 예
생성모델에서 화합물을 효과적으로 다룰 수 있기 위해서는 분자의 표현방식(Molecular Representation)이 연구자들에게 직관적인 해석을 가능하게 해야 한다. 일반적으로 사용되는 분자 표현방식은 크게 세 가지 유형으로 나눌 수 있는 데, 1) SMILE (Simplified Molecular Input Line Entry System), 2) 분자 그래프(Molecular Graph), 3) 3차원 분자 구조(3D structure)이다 (그림 2).
소분자에서 거대분자에 이르기까지 SMILES는 화합물의 구조를 성형 문자열로 나타내는 가장 보편적인 표현방식으로, 현재 대부분의 생성모델은 신약 후보물질의 de novo 디자인에서 SMILE을 기반으로 한다. SMILE 보다 더 직관적인 대안으로는 분자 그래프가 있다. 이는 원자를 노드(Node)로, 결합을 엣지(Edge)로 표현한 그래프 이론 기반의 수학적 모델이다. 하지만 SMILES와 분자 그래프 모두 단백질-리간드 상호작용과 같은 생물학적으로 중요한 기전 이해에 필수적인 3차원 정보를 반영하지 못한다는 한계가 있다. 반면, 3차원분자 구조는 분자의 공간적 배열, 결합 각(Bond Angle), 비틀림 각(Torsion Angle), 입체적 형태(Conformation)등을 포함하여 약물의 복잡한 물리화학적 특성들을 보다 정밀하게 표현할 수 있는 장점이 있다 [2, 13]. 따라서 생성모델이 다루는 분자표현방식의 선택은 모델의 디자인목적에 따라 달라질 수 있다. 특히, 약물-표적 결합친화도(Binding Affinity) 예측 및 도킹(Docking) 기반 최적화에 있어서는 3차원 구조 기반표현방식이 필수적이다 (Table 1).
Table 1. 심층 생성모델에 이용되는 분자 표현방식 간의 비교
2.2.2. 심층 생성모델의 종류와 장단점
심층 생성모델은 대규모 생물학적·화학적 데이터로부터 학습하여, 새로운 분자 구조를 자동으로 생성하고, 약리학적 특성이나 표적-선택성 등을 다중 목적 기준(multi-objective criteria)에 따라 최적화할 수 있는 모델이다. 특히, VAE (Variational Autoencoder), GAN (Generative Adversarial Network), RNN (Recurrent Neural Network) 기반 시퀀스 생성 모델, 그리고 최근 주목받는 Diffusion 모델과 Transformer 계열 모델(GPT, ChemGPT 등)은 다양한 표적 특성에 맞춰 새로운 분자 생성성능을 획기적으로 개선하고 있으며, 신약 디자인에 이용되는 딥러닝 기반의 강화학습(DRL, Deep Reinforcement Learning)은 인공신경망과 강화학습을 결합시켜 놓은 방법으로 다양한 인공 신경망들 (Table 2)을 활용하여 De novo 신약 디자인(DNDD)에 이용하고 있다 [9, 10]. 심층 생성모델을 이용한 DNDD의 장점은 더 넓은 화학 공간의 탐색, 전통적인 신약개발 방식에서는 발견하기 어려운 새로운 화합물 디자인을 통해서 개선된 신약 후보물질을 스크리닝 할 수 있으므로 신약개발에서 발생하는 많은 시간소모를 줄이고 막대한 비용절감의 효과를 가져올 수 있다.
한 걸음 더 나아가, 안전성, ADMET 특성 등 여러 가지 특성들을 동시에 최적화할 수 있는 기능을 갖추고 있으며, 복잡한 패턴을 스스로 학습하고 활용할 수 있는 많은 장점이 있는 심층 생성모델이다. 하지만 단점으로는 효과적인 학습을 위해 대량의 고품질 데이터가 필수적이기 때문에 데이터품질과 양이 부족할 경우 성능이 저하될 수 있다.
Table 2. 다중 타깃 약물 디자인에 이용되는 심층 생성모델들과 장단점
약물과 타깃의 상호작용 및 원하는 특성에 대한 신뢰할 수 있는 데이터의 활용은 타깃 단백질에 따라 어려움이 따르며 ‘블랙박스’ 형태로 간주되므로, 생물학적 해석가능성이 떨어지는 문제가 있고, 신약 후보물질 선정에서 제한된 통찰력을 제공한다. 이때 연구자들은 약물생성의 방향을 제시하는 입력 조건을 제시하고 생성된 분자구조의 합성 용이성(Synthetic Accessibility), 화학구조의 신규성(Novelty), 다양성(Diversity) 그리고 독성(Toxicity)을 최소화하기 위한 실시간 또는 사후적인 조절을 통해서 정밀한 분자생성과 목표 지향적인 디자인이 가능하게 된다 [11, 12, 13].
2.3. 심층 생성모델을 이용한 다중 타깃 신약 디자인 적용
최근 신약개발에 적용되는 심층 생성모델은 단순한 분자 생성 능력을 넘어서, 목표 특성(targeted properties)을 만족하는 분자 구조를 선택적으로 생성할 수 있는 능력이 요구되고 있다. 이를 위해 도입되는 핵심 메커니즘이 조건부 생성(Conditioning)과 생성제어(Control) 이다. 조건부 생성은 특정 약리학적 특성을 조건으로 명시하여, 모델이 해당조건에 부합하는 분자를 생성할 수 있도록 유도하는 방식을 말하며, 생성제어는 생성과정 중 혹은 이후 단계에서 모델의 출력을 정밀하게 조정하는 기능을 의미한다. 다중 타깃 분자 디자인에서 심층 생성모델을 적용하는 데 있어 핵심 요소이며, 타깃별 활성 값 분포가 매우 상이할 수 있기 때문에 신약개발 과정에서 여러 타깃을 만족시키기 위해서 분자 생성을 정밀하게 유도할 수 있게 하는 것이 필수적이다. 조건부 생성과 생성제어 프레임워크를 적용하여 다중 타깃에 대한 높은 선택성과 약리학적 효능을 만족하는 새로운 약물후보 물질들을 효율적으로 생성할 수 있게 하는 전략을 제시한다 [17, 18, 20].
2.3.1.다중 타깃 신약 디자인 연구사례
심층 생성모델의 발전은 복잡한 질병에 대응하기 위한 다중 타깃 약물 디자인(Multi-target drug design)에 실질적인 핵심도구로 활용되고 있다. 이미 마약중독, 암 그리고 다양한 질병들에서 이질성과 경로 중복성으로 인한 단일 타깃약물들의 한계가 명확히 드러나고 있다. 이런 이유로 다양한 생물학적 표적을 동시에 조절할 수 있는 다중 타깃 분자 디자인이 요구되었다. 마약중독 치료제 개발에서는 도파민 수송체(DAT), 세로토닌 수송체(SERT), 노르에피네프린 수송체(NET)와 함께, 심장 독성과 관련된 hERG 채널을 함께 고려해야 한다 [20, 21]는 보고가 이미 발표되었다.
마약중독 모델의 경우, SMILE 기반 RNN 구조에 강화학습(RL, Reinforcement Learning)을 적용하여, DAT, SERT, NET의 친화도 예측 값과 hERG 억제 확률을 반영한 다중 보상함수(Multi-reward Function)를 구성하였다. 심층 생성모델을 도입하여 조건부 생성과 보상함수(Reward Function)를 이용한 각각 수송체에 대한 친화도 균형과 hERG 회피 조건을 동시에 만족하는 분자들을 생성할 수 있었다. 이와 같은 다중 타깃 활성도(Multi-target Activity)와 독성 인식생성(Toxicity-aware generation)은 실제 신약 후보발굴에 있어 매우 유의미한 접근으로 평가된다.
Table 3. 심층 생성모델을 이용한 다중 타깃 약물디자인의 연구사례
한편, 암치료제 개발에서는, PI3K, BRD4, mTOR, EGFR 등 상이한 경로에 작용하는 단백질 및 후생유전학 타깃을 동시에 조절할 수 있는 이중 혹은 다중 억제제 디자인이 주목을 받고 있다 (Table 3) [23]. 암 관련 학습 데이터 사전 훈련과 생성된 분자들은 구조 기반의 약물 디자인 모델을 이용하여 도킹분석 등을 통해서 리드물질를 선택하고, 이때 심층 생성모델은 단순한 분자 구조 생성에 머물지 않고 약물 디자인에 요구되는 다중 표적활성, 독성감소, 약물 유사성 등을 다양하게 고려하여 실제 약물후보물질의 최적화와 더불어 신약 후보물질로서 유리한 조건을 갖출 수 있게 한다.
2.3.2.인공지능 기반 신약 디자인의 한계와 미래방향성
인공지능 기반 신약 디자인은 혁신적인 접근방식으로 방대한 화학정보와 신약 관련 데이터를 분석하고 학습하여 분자 구조와 약물성 그리고 독성 간의 관계를 통해 약물 디자인과 속성 예측을 통해 신약 후보물질을 얻는 데 획기적인 역할을 할 것으로 예상된다 [14]. 앞으로는 알고리즘의 정교화를 통해 새로운 신약 디자인모델이 개발되어 신약 후보물질 선정에서 더욱 정확한 예측과 다중 타깃 목적 최적화를 통해 비용과 시간을 절감하고 생물학적 데이터의 통합과 더불어 다양한 데이터를 이용함으로써 신약 개발의 효율과 정밀도가 높아질 것으로 기대된다.
자율적인 AI 기반 신약개발을 위한 프레임워크가 현재 개발되고 있으며, 이 프레임워크는 지식그래프(Knowledge graph)와 대규모 언어모델(LLMs, Large Language Models)을 결합하여, 대규모 자동화 신약개발 프로그램을 기획하고 실행할 수 있게 하는 강력한 프레임워크로 부상할 것으로 예상되며, 이 시스템은 연구 전략, 진행상황, 모든 지원 데이터에 대한 상세한 통찰력을 제공할 것이다. 또한, 대량의 생물학적 데이터를 처리하고 해석하는 데 유능하므로 생체 데이터와 환자의 건강 정보분석을 통해서 조기 질병진단으로 질병의 탐지 및 예후를 인공지능을 이용하여 예측할 수 있게 한다. AI 알고리즘 이용을 통해 신속한 데이터 분석과 의사들에게 정확한 진단 및 예측정보를 공유하고, 개인 맞춤형 치료를 지원할 뿐만 아니라 대량의 생체 데이터와 약리학 지식을 활용한 새로운 치료제 후보군 발굴로 신약개발과정을 더욱 신속하고 정교하게 함으로써 질병의 예방과 치료효과 향상, 의료 비용의 절감 등의 다양한 효과를 기대할 수 있다 [9]. 이와 더불어 양자컴퓨터는 인공지능과 함께 제약산업의 패러다임을 다시 한번 바꿀 수 있는 디지털 혁신을 가져올 것이라는 기대를 안겨주는 게임 체인저(Game Changer)로 대두되고 있다.
이미 올해 초, 인실리코메디신은 인공지능과 양자컴퓨터를 활용해 개발한 1호 신약의 탄생을 예고하고 있으며, 신약개발의 가장 초기단계인 신약후보물질 발굴단계에서 상당한 시간단축을 시킬 거라 예상된다. 인공지능을 활용한 제약 및 의료시장 규모는 지난해 209억 달러에서 2029년 1484억 달러로 연평균 48%씩 성장할 것으로 전망한다. 이런 이유로 엔비디아, 마이크로소프트 등 정보기술(IT) 기업들도 양자컴퓨팅 기반의 신약개발사업에 뛰어들고 있으며, 국내 제약사들도 AI 기반 신약개발 스타트업과 협업을 하거나 자체 AI 기반 신약개발 플랫폼을 운영하는 제약사들이 점점 늘어나고 있는 추세다. 우리 정부도 이에 발맞춰 2028년까지 인공지능을 이용한 신약개발에 348억 원가량을 투입해 AI 기반 신약개발 기술의 발전에 협조하겠다는 계획을 발표하였다 [25].
궁극적으로 국내외 제약사, 스타트업 그리고 대학 간의 협력 혹은 자체 AI 기반 신약기술 개발을 통해 다양한 형태의 인공지능 기반 신약개발 플랫폼들이 등장할 것으로 예상되며, 이들 플랫폼들을 이용하여 차세대 복잡한 질병네트워크를 활용한 새로운 치료제개발에서 중추적인 역할을 할 것으로 기대된다.
3. 결론
위에서 살펴본 것처럼, 다중 타깃 신약 디자인은 가장 최근에 대두되는 내용으로 현재까지 인공지능 기반의 신약 디자인에 이용되고 있는 심층 생성모델의 종류와 장단점들에 대해서 알아보았고, 이들 모델을 이용하여 개발된 플랫폼들과 연구 사례 그리고 현재 인공지능을 이용한 신약 디자인의 한계와 미래 방향성에 소개하였다.
다중 타깃 적용을 위한 심층 생성모델 기반의 신약 디자인은 신약개발 연구에 있어 획기적인 진보를 가져다 주었으며, 이러한 기술이 자기 개선형(Self-improving, closed loop) 시스템과 통합될 경우, 약물 후보물질을 데이터 기반 탐색, 최적화, 그리고 검증할 수 있는 강력한 수단을 제공할 수 있다. 이런 자율형 AI 기반 신약개발 시스템은 미래가 아주 밝다고 할 수 있다. 이러한 기술은 복잡한 연구 프로그램을 스스로 기획하고 실행할 수 있으며, 의사결정 과정을 투명하게 제공함으로써 연구자와의 협업 가능성을 크게 향상시킬 수 있다. 또한, 글로벌 건강 문제해결에 기여할 수 있는 잠재력 역시 이미 예상되는 바이다.
현재까지는 인공지능을 이용한 신약개발이 초기 단계이지만 지속적인 발전이 이루어지고 있고 앞으로의 미래 경쟁력을 제고한다면, 인공지능을 이용한 신약개발에 적극적인 투자와 더불어 인공지능 활용 잠재력을 인지하고 꾸준히 인공지능을 이용한 생성모델의 업그레이드로 지속적인 AI 기반 신약 디자인의 발전이 가능하다. 인공지능과 신약개발의 융합은 개발 파이프라인을 가속화할 뿐만 아니라, 개인 맞춤형 타깃 치료제의 제공 가능성도 높이고 있다. 생성형 AI는 약물의 물리화학적 특성 예측, 신규 분자 구조 디자인, 그리고 생체 내 상호작용 시뮬레이션 등을 가능하게 하여 신약개발 초기 단계를 획기적으로 가속화할 수 있다. 이러한 기술은 시간과 비용을 절감하면서도 더 정밀하고 혁신적인 후보물질 탐색을 가능하게 해 준다. 인간과 인공지능 간의 협업에서 자연스러운 인간중심의 의사결정과 함께 자연스럽게 통합구조를 이루는 방향으로의 발전 역시 필요하다. 이러한 변화는 제약 산업의 패러다임을 변화시키며, 인공지능이 단순한 보조 도구를 넘어 실질적인 연구 파트너로 자리매김하게 할 수 있을 것이라 기대된다.
앞으로 인공지능의 미래 의료시스템 혁신과 환자 치료에 긍정적인 영향을 미칠 것이라 예상되며, 대규모 자동화 신약개발 프레임워크의 고도화된 자동화 및 의사결정 능력은 동시에 알고리즘 편향에 따른 의료 형평성의 문제를 야기할 수 있다. 모델이 학습한 데이터가 특정 인구집단, 질환 군, 혹은 치료전략에 편향되어 있을 경우, 인공지능의 판단이 특정 환자군에게 불리하게 작용할 수 있으며, 이는 의료윤리 및 공공정책 차원에서의 책임 있는 AI 설계와 검증 절차 마련이 요구된다. 따라서 향후 AI 기반 신약개발 플랫폼의 발전은 기술의 정확성 뿐만 아니라 공정성과 투명성, 책임을 함께 고려하는 통합적인 디자인 전략이 필요하며, 이는 과학과 윤리의 접점에서 더욱 긴밀한 협력이 중요한 역할을 할 것으로 사료된다.
4. 참고문헌
==>첨부파일(PDF) 참조
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
지식