기술동향
[KPBMA FOCUS 제11호] 연합학습 기반 신약개발 플랫폼 FDD 外
- 등록일2024-08-01
- 조회수1681
- 분류기술동향
-
자료발간일
2024-03-14
-
출처
한국제약바이오협회
- 원문링크
-
키워드
#신약개발#플랫폼#FDD
- 첨부파일
KPBMA FOCUS 제11호
연합학습 기반 신약개발 플랫폼 FDD 外
◈본문
■ 신약개발 패러다임 변화
ㅇ 2023년 3월 글로벌 회사인 엔비디아(NVIDIA) 社가 신약개발에 뛰어들면서 신약개발을 위한 생성형AI 플랫폼 ‘BioNeMo’를 소개한 이후, 이와 유사한 것들을 모두 다 적용하기 위해 미국의 주요 제약 회사들이 진행 중이던 파이프라인들을 멈추고 AI가 도출하는 결과를 보고 파이프라인 순위를 바꾸려고 할 정도로 AI의 파급력이 커지고 있음
ㅇ AI 기반의 신약개발 모델이 성공하기 위해서는 충분한 학습데이터가 확보되어야 함
- 제약바이오 분야의 데이터는 이미지나 텍스트 같은 방대한 공개 데이터와 달리, 실험으로 확보할 수 있는 학습데이터 수가 적고, 특히 다른 기관에서 생산한 데이터를 공동 활용하기가 어려움
ㅇ 2024년 3월 11일 한국제약바이오협회 AI신약융합연구원은 “연합학습 기반 신약개발(FDD, Federated Learning based Drug Discovery) 가속화 프로젝트” 사업에 최종 선정되어 4월부터 세부 과제 기획, 공모·선정 등 본격적으로 추진할 예정임
ㅇ FDD의 최종 목표는 “신약개발을 위한 AI 모델 학습에 필요한 데이터를 기관 간에 안전하게 공유할 수 있는 플랫폼을 확보”하는 것임. 본 고에서는 FDD의 핵심 개념을 소개하고자 함
■ K-MELLODDY 사업
▶ 사업 개요
ㅇ K-MELLODDY 사업은 2019~2022년 수행된 EU의 MELLODDY(Machine Learning Ledger for Drug DiscoverY) 사업을 모델로 기획됨
- EU MELLODDY 사업은 암젠, 아스텔라스, 아스트라제네카, 바이엘, 얀센, 머크, 노바티스 등 10개 제약 회사와 5개 IT 회사, 2개 대학이 참여하여 각 제약 회사의 실험 데이터를 연합학습(Federated Learning)2)을 이용하여 안전하게 공유하는 것을 실증한 사업임
ㅇ 본 사업을 통해 신약개발 과정에서 유용하게 사용할 수 있는 연합학습 기반 신약개발 FDD(Federated Drug Discovery) 플랫폼을 구축하고 약물 흡수, 분포, 대사, 배설, 독성(ADMET, Absorption, Distribution, Metabolism, Excretion, Toxicity) 예측 솔루션을 만들 것이며 이 예측 솔루션을 “FAM(Federated ADMET Model)”이라고 명명함
- 이 사업에서는 제약 회사와 같은 ADMET 데이터 소유자 20개 내외, 플랫폼 개발자 1개, AI 모델 공급자 15개 내외 등 산·학·연·병이 과제에 참여하도록 지원할 계획임
▶ FAM 솔루션
ㅇ 신약 후보 물질의 첫 검증 과정인 시험관내(in-vitro) 실험을 통해 후보물질의 ADMET 값을 측정하고 있으나, 이 결과만으로 생체내(in-vivo) 및 임상시험 통과를 보장하지 못하는 경우가 많으며 이는 in-vitro 실험 방식의 한계임
ㅇ 신약개발 가속화 연구보고서에 의하면 북미·유럽의 신약개발 R&D 비용 중 22%를 ADMET 검증이 차지하고 있으며 ADMET는 임상시험의 성공률을 결정짓는 가장 중요한 요소임
ㅇ 최근 in-vitro 실험에 필요한 시간과 비용을 줄이기 위해서 가상(in-silico) 실험으로 대체하는 노력을 하고 있으나, 현재 AI 성능과 적용 수준의 한계로 임상시험 통과를 보장하기 어려움
ㅇ FAM 솔루션은 현재의 AI 솔루션과 달리, End-to-End4) 예측 모델로 동작하며 최초 측정된 in-vitro 데이터를 일련의 시그널(신호)로 임상시험 결과를 직접 예측하는 모델임
- FAM 솔루션은 in-vitro 실험의 목적변수5)(그림1, Y1)를 예측하는 것이 최종 목표가 아니라, 미래 임상시험 결과(그림1, Y3)를 예측하는 모델임
<그림 1> FAM: 연합학습 기반 ADMET 예측 솔루션
ㅇ FAM 솔루션은 신약개발 과정에서 생산된 in-vitro, in-vivo, 임상시험(in-human Clinical Trials) 데이터를 모두 사용하는 플랫폼 기반 솔루션이며, 이에 필요한 각 기관의 데이터를 공개하지 않아도 되도록 연합학습 방법을 도입함
ㅇ FAM 솔루션을 구현하기 위해서는 제약 회사, 연구소, 병원, 규제 기관, 임상시험수탁기관(Contract Research Organization, ,CRO), 대학 등 다양한 기관에 분산 저장된 데이터 연합이 필요함
- 향후 in-vitro 실험값뿐 아니라, 타겟 정보, 개인 정보를 추가로 사용함으로써 약물의 특정 타겟에 대한 약효나 적용 환자 그룹별 ADMET 상세 예측 모델로 확장이 예상됨
■ K-MELLODDY 추진 전략 및 체계
▶ 추진 전략
ㅇ (연합학습 실용성 입증) K-MELLODDY 사업에서 가장 중요한 목표는 연합학습의 실제 현장 적용을확인하고 향후 확대 가능성을 입증하는 것임
- 1차년도에는 세부 사업별 구체적인 목표 설정과 연구개발 범위를 상세하게 설계함
- 2차년도 이후에는 FDD 플랫폼을 구축하고 FAM 솔루션 동작을 확인하며 이의 고도화 및 확산을 추진함
ㅇ (데이터 기여도 평가) 연합학습 실제 도입 시 가장 큰 이슈는 자신이 보유한 모델 성능도 개선되겠지만 공동의 모델 성능개선을 위해서 자신의 데이터를 활용하는 것에 대한 거부감임(즉, 자신의귀중한 데이터로 남 좋은 일을 하는 것이라는 생각)
- 이러한 문제를 피하기 위해서는 데이터 소유자에게 인센티브를 제공해야 하며, 예를 들어 활용된데이터의 양과 질에 기반한 'AI 모델 개선 기여도'를 측정하고 이를 향후 정부 지원 사업이나 우수 AI 회사 발굴에 활용하는 전략이 필요함
ㅇ (데이터의 다양성 확보) AI 모델의 성능을 높이기 위해서는 다양한 데이터가 필요하며 이를 위해 여러 기관의 참여와 협력이 중요함
- 제약 회사가 약물 후보물질 발견 단계에서 수행한 in-vitro 데이터뿐 아니라, in-vivo, 임상 진행 중측정된 약동학 데이터 보유기관과의 협력 전략이 필요함
▶ 추진 체계
ㅇ 데이터 소유자는 분석 목적 태스크(세부 ADMET 예측 등)를 협의하여 선정하며, FAM 솔루션을 구성하는 베이스라인 AI 모델 개발에 필요한 데이터를 공급함
ㅇ 모델 공급자는 FAM 솔루션을 구성하는 베이스라인 AI 솔루션을 개발하고, 이의 성능을 FDD 플랫폼으로 검증하며 고도화함
ㅇ 플랫폼 개발자는 안전한 데이터 활용과 편리한 사용자 인터페이스를 개발하고, 연합학습 참여와 기여도를 산정하는 시스템을 구축함
ㅇ K-MELLODDY 사업단은 한국제약바이오협회에서 담당하며 데이터 소유자, 모델 공급자, 플랫폼 개발자를 선정하고 사업의 최종 목표를 달성할 수 있도록 사업평가 및 관리를 수행함
<그림 2> K-MELLODDY 추진 체계 및 참여자의 역할과 혜택
■ 성과 활용 및 기대효과
▶ 활용 방안
ㅇ (ADMET 모델 활성화) 현장에서 유용하게 사용할 수 있는 우수한 성능을 가진 ADMET 예측 모델을 개발하고 참여기관을 확대함
ㅇ (신약개발 단계 적용 및 확장) 본 사업을 통해 구축되는 플랫폼은 향후 신약개발의 여러 단계 즉, 타겟 발굴, 후보물질 탐색, 선도물질 최적화, 임상 설계, 시판 후 조사 등에 적용될 수 있음
ㅇ (글로벌 협력 활용) 글로벌 협력을 통해 K-MELLODDY 참여자를 확대하고 플랫폼의 성능을 높이도록 함
<그림 3> K-MELLODDY 사업 성과 활용 방안
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
지식
동향