기술동향
바이오 신약 개발 회사의 인공지능 활용 동향
- 등록일2025-04-03
- 조회수898
- 분류기술동향 > 레드바이오 > 의약기술
-
자료발간일
2025-03-21
-
출처
BRIC
- 원문링크
바이오 신약 개발 회사의 인공지능 활용 동향
◈본문
1. 서론
인공지능(artificial intelligence, AI)은 인간의 논리적 사고, 문제 해결, 언어 이해 등의 지능을 컴퓨터 시스템이 구현하여 데이터와 알고리즘을 통해 ‘학습’하고, ‘경험’을 바탕으로 문제를 해결한다. 사람이 언어를 이해하고 이를 바탕으로 의사소통을 한다면, AI는 방대한 양의 데이터를 바탕으로 언어 및 패턴에 대한 규칙을 학습하고 자연어 처리 기술을 통해 의사소통을 한다. AI가 방대한 데이터를 빠르게 조사하고 규칙을 찾기 위해 사용되는 핵심 기술이 머신러닝(machine learning)과 딥러닝(deep learning)으로, 이 기술은 데이터를 분석하고 이를 AI가 학습하여 성능을 향상시키도록 한다. AI는 대량의 데이터를 신속히 처리하고 그 과정에서 패턴을 찾으며, 이를 학습한 AI는 새로운 데이터가 입력되었을 때 이에 대응하여 기 학습한 내용을 바탕으로 예측 및 결정을 한다. 현시점에서는 특정 작업에 특화되어 학습하고 그 범위 안에서 작업 성능을 최적화하는 narrow AI가 실용화되고 있으며, 사람의 뇌처럼 과정을 이해하고 창의적 사고를 바탕으로 다양한 작업을 수행할 수 있는 general AI는 개발 초기 단계에 있다 [1].
1990년대부터 데이터 처리 능력이 향상되면서 AI 기술이 본격적으로 발전하기 시작했다. 전통적인 알고리즘과 규칙 기반 시스템을 활용한 AI 기술이 개발되기 시작하였으나 당시의 컴퓨터의 성능은 이를 다루기에 제약이 많았다. 하지만 후에 발전할 딥러닝의 기초가 된 인공신경망(neural networks) 연구가 이루어졌다 [2]. 2000년대에는 대규모 데이터(big data)를 활용한 패턴 인식 및 예측 분석 기술이 본격화되었으며, 다양한 머신러닝 알고리즘이 개발되었다. 이 시기에 후술 하는 그래픽처리장치(graphics processing unit, GPU)는 주로 게임과 그래픽 처리에 사용되었다. 2010년대에는 대량의 데이터를 빠르게 처리할 수 있는 GPU의 획기적인 발전으로 인해 딥러닝 훈련 속도가 혁신적으로 단축되었다. 컴퓨터의 운영체제를 실행하고 작업을 관리하여 컴퓨터의 뇌에 해당하는 중앙처리장치(central processing unit, CPU)는 개별적인 작업을 처리하는데 특화되어 복잡한 연산을 순차적으로 처리할 수 있다. 고전적인 하드웨어인 CPU와는 달리 GPU는 여러 가지 작업을 병렬로 처리할 수 있어 대량의 데이터를 신속히 처리하는데 높은 성능을 나타내었고, 이는 딥러닝 훈련에 적합하였다 [3]. 합성곱 신경망, 순환 신경망 등의 복잡한 신경망이 개발되었고, 음성 인식(Siri, Alexa), 이미지 분석(구글 렌즈), 자연어처리(구글 번역) 등이 일상생활에서 사용되기 시작하였다. 2020년대에는 AI가 전 세계적으로 다양한 분야에서 핵심 기술로 자리 잡으며 더욱 고도화되었다. 사람처럼 텍스트를 이해하고 생성하는 GPT와 같은 초거대 언어모델이 개발되어 대화형 AI시스템이 현실화되었다. 사회의 전반적인 영역에서 AI가 활용되고 있고 산업 전반에서 그 중요성이 점차 강조되고 있으며 바이오의약 분야에서도 본격적으로 도입되고 있다. 특히 제약 산업 분야에서 약물 발견, 생물학적 데이터 분석, 단백질 구조 예측, 임상 시험 최적화, 환자 맞춤형 의약품 개발, 약물 재창출, 약물 독성 예측 등에 대한 연구 개발 프로세스를 가속화하는데 중추적인 역할을 하고 있다 [4].
신약이 개발되면 전 세계적으로 파급되어 건강 및 보건에 핵심적인 역할을 하지만, 평균 10-15년이 소요되며 성공 확률이 낮다. 한 종류의 신약이 개발되기까지 수차례의 실험과 임상시험이 필요하며 실패할 경우 경제적 손실을 초래하기 때문에 기업 및 연구기관에서 개발하는 신규 발굴 신약 종에는 한계가 있다. 하지만 AI는 신약 개발 단계에서 생물학적 데이터 분석을 통해 약물 후보 물질의 스크리닝 및 구조 분석을 효율적으로 수행하고, 약물과 단백질 간의 상호작용을 예측하여 치료 효능을 향상시키며, 임상 시험 최적화 단계에서 실험 비용과 시간을 줄이는 등 개발 효율성을 획기적으로 향상시킨다. 특히 AI가 보유하는 방대한 양의 실험 데이터를 신속히 분석하고 복잡한 질환 메커니즘을 이해하여 기존 약물의 효능을 재발견하는 기능은, 연구의 효율성을 높이는 것을 넘어 신약개발의 방식을 근본적으로 변화시키고 있다. 이는 전 세계적인 의료 혁신의 촉진 및 인간의 건강과 삶의 질을 향상시키는 중요한 원동력이 된다.
본고에서는 AI를 기반으로 한 신약 개발의 동향과 함께 바이오 제약 업계에서의 AI 기술 활용 사례를 정리하고, 향후 해당 기술이 어떻게 제약 산업의 혁신을 이끌어갈지에 대한 전망을 제시한다.
2. 본론
2.1. 바이오 신약개발에 사용되는 인공지능
2.1.1. 머신러닝과 딥러닝
신약 개발을 위해서는 방대한 데이터 분석과 복잡한 패턴 탐색이 필요되는데, 기존에는 많은 양의 생물학적, 화학적 데이터를 사람이 직접 분석하였고, 그 과정에서 많은 시간과 비용이 소요되었다. 하지만 머신러닝을 활용함으로써 데이터 분석 속도와 정확성이 획기적으로 증가되었다. 특히 딥러닝을 활용하여 복잡한 패턴과 상관관계를 파악할 수 있어 기존에는 발견하지 못했던 새로운 결과를 발견함으로써 새로운 신약 후보 물질 개발 기술로 재규명되고 있다.
신약 개발에 사용되는 머신러닝 기술은 세 가지로 대표될 수 있는데, 그중 한 가지인 지도학습은 랜덤 포레스트, 서포트 벡터 머신과 같은 알고리즘을 바탕으로 기존의 레이블이 있는 데이터를 처리하여 예측 모델을 학습시켜 약물과 단백질 사이의 상호작용 예측, 약물 효능 평가, 독성 예측에 활용된다. 비지도학습은 K-평균 클러스터링 및 주성분 분석과 같은 기법을 통해 레이블이 없는 데이터를 분석하여 약물 구조 분석 및 약물 간 유사성을 바탕으로 그룹화하는데 사용된다. 강화학습은 딥리워드 생성모델 등을 통해 목표하는 특징을 가진 화합물을 최적화하거나 생성하는 약물 설계에 활용된다 [5, 6].
머신러닝은 데이터에서 찾은 규칙에 기반하여 새로운 데이터를 처리하는 데이터 기반 학습을 통해 결과를 예측하는 기술이다. 머신러닝의 한 종류인 딥러닝은 데이터로부터 특징을 자동으로 추출하여 학습한다. 따라서 사람이 데이터를 분석하고 특징을 추출하여 알고리즘에 입력하는 것이 주가 되는 머신러닝과는 달리 딥러닝은 데이터에서 자동으로 특징이 추출되기 때문에 사람이 데이터를 처리하는 과정이 생략된다. 딥러닝은 머신러닝 보다 복잡한 특성을 인식하고 이를 위해 대량의 데이터와 정교한 계산 능력을 요구한다. 신약 개발에서 활용되는 딥러닝 기술에는 합성곱신경망(Convolutional Neural Network, CNN), 순환신경망(Recurrent Neural Network, RNN), 생성적적대신경망(Generative Adversarial Network, GAN)이 있다. 약물과, 약물이 결합하는 단백질의 2D 이미지가 입력되면 CNN을 통해 결합부위가 학습되어 약물-단백질 결합 분석 및 분자 구조 예측에 사용되며 기존의 계산 화학적 방법을 통한 결합 및 구조 예측보다 신속하고 정확한 분석이 가능하다. RNN은 데이터의 흐름을 시간 경과에 따라 처리할 수 있기 때문에 시간에 따른 체내에서의 약물의 반응, 시간 경과에 따른 약물의 효능 변화 등의 약물의 동적 반응을 예측하는 데 사용된다. 또한 단백질 서열을 입력하여 그 구조를 예측할 수 있다. GAN은 생성자신경망과 판별자신경망이 경쟁하며 학습하는 구조로, 신약개발에서는 생성자신경망이 새로운 분자구조를 생성하고 판별자신경망이 생성된 분자 구조가 실제 약물과 얼마나 유사한지를 평가하여 정교성을 점차적으로 증가시켜 최종적으로 기존 화합물의 한계를 극복한 새로운 약물 후보 물질을 발굴한다 [7-10].
2.1.2. 약물 후보 물질 발굴
AI는 머신러닝 및 딥러닝 알고리즘을 사용하여 화합물의 물리화학적 특성, 생물학적 특성, 단백질-화합물 상호작용 등에 대한 데이터를 신속하고 정확하게 분석한다. 이를 통해 약물 후보 물질을 선별하고, 효능과 안전성을 평가한다. 예를 들어, 약물로 사용되는 화합물의 용해도, 분자량, 극성표면적 등을 파악하여 약물이 체내에서 작용하는 기전 및 치료 타깃 분자와 약물 상호 간의 작용을 예측한다. 또한 방대하고 복잡한 유전체학, 단백질체학 등의 생물학적 데이터를 분석하여 질병의 메커니즘을 제시하고, 질병의 원인이 되는 유전자 변이, 단백질 변화 형태를 발견하여 그에 맞는 효과적인 치료법을 제시한다 [11-13].
2.1.3. 단백질 구조 예측
DeepMind社의 AlphaFold와 같은 AI 시스템은 아미노산 배열 정보를 바탕으로 단백질의 입체구조를 예측하는데 중추적인 역할을 한다. 기존에 단백질 구조를 규명하는 방법으로는 단백질을 고순도로 대량생산한 후 X-ray 결정구조를 파악하는 실험적 방법이 사용되었다. 이 방법은 고순도로
재조합 단백질을 대량생산하는 것이 필요하기 때문에 많은 시간과 비용이 소요되었고, 재조합 단백질을 발현하기 위한 최적화 과정이 요구되었다. 반면에 AlphaFold 시스템은 단백질을 구성하는 아미노산 배열로 입체구조가 예측 가능하기 때문에 재조합 단백질을 대량생산하지 않아도 아미노산 배열 정보만으로 실행 가능하다 [14, 15]. 현시점에서 AI를 통해 예측한 단백질 구조가 실제 단백질 구조와 100% 일치하지는 않지만, 앞으로 실험적인 방법으로 단백질 구조를 규명한 데이터가 더욱 증가된다면 그 데이터를 AI가 학습하여 점차적으로 AI의 정확성이 향상될 것이기 때문에, 실험적인 결정구조 파악과 AI를 통한 예측 양쪽 모두가 활발히 진행됨이 기대된다.
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
-
이전글
- 유전자가위 기반 치료제
-
다음글
- 2024년 지방과학기술 연감