BioINwatch
(BioIN + Issue + watch) : 바이오 이슈를 빠르게 포착하여 정보 제공글로벌 반도체기업 NVIDIA, 신약개발 AI 파운데이션 모델(BioNEMO)의 클라우드 서비스 발표
- 등록일2024-04-25
- 조회수3775
- 분류플랫폼바이오 > 바이오융합기술
-
발간일
2024-04-25
-
키워드
#신약개발 #AI 파운데이션 모델#바이오니모#헬스케어#클라라
- 첨부파일
-
차트+
?
차트+ 도움말
글로벌 반도체기업 NVIDIA, 신약개발 AI 파운데이션 모델(BioNEMO)의 클라우드 서비스 발표
BioINwatch(BioIN+Issue+Watch): 24-27
최근 반도체 기업 엔비디아(NVIDIA)는 인체 데이터 셋을 활용해 신약 개발용 AI 파운데이션* 모델 ‘바이오니모’를 클라우드 서비스로 제공. 이러한 서비스를 이용하여 제약기업들은 자체 데이터로 ‘바이오니모’를 파인튜닝하여 목적에 맞는 AI 모델을 빠르게 개발할 수 있게 됨. Wet lab 실험과 단순 시뮬레이션 중심이었던 기존 신약개발 프로세스가 생성형 AI 기반 설계로 전환되는 계기가 될지 주목 * 대규모 데이터 셋을 사용하여 사전에 학습되어 있는 일종의 반제품 형태의 AI 모델 ▸주요 출처 : https://www.nvidia.com/en-us/clara/bionemo/ |
■세계 최대 반도체 기업 NVIDIA가 신약개발 시간과 비용을 획기적으로 줄일 AI 기반 신약개발 플랫폼인 ‘바이오니모(BioNEMO)를 공개
* Tumor Origin Recognition via Classification of Histology
○ ‘JP모건 헬스케어 컨퍼런스’에서 생성형 AI 기반의 신약개발 플랫폼 ‘바이오니모’를 공개하며 전 세계 제약 바이오 업계의 이목이 집중(2024.1.8)
- 바이오니모는 엔비디아 헬스케어 전용 AI 플랫폼인 ‘클라라*’에 속한 생성형 AI 플랫폼 중 하나로,
* 클라라 플랫폼에는 바이오니모(바이오제약)를 비롯해 홀로스캔(의료기기), 파라브릭스 (유전체학), 모나이(의료 영상) 등이 포함
- 생체분자 언어*를 학습해 단백질 구조 예측, 단백질 서열 생성, 분자 최적화, 화합물 생성, 결합구조 예측 등 신약개발을 위한 AI 파운데이션 모델**을 구축
* 염기서열, 아미노산 서열, 화합물·단백질 구조, 세포 및 의료 영상 등
** 대규모 데이터 셋을 사용하여 사전에 학습되어 있는 일종의 반제품 형태의 AI 모델
○ 이번 컨퍼런스에서 엔비디아는 세계 매출 4위 제약기업 암젠(Amgen)과의 협업 내용도 공개
- 암젠은 바이오니모를 도입해 세계 최대 규모의 인체 데이터 셋을 분석하는 생성형 AI 모델 ‘프레이야(Freyja)’를 디코드 제네틱스(deCODE genetics)*에 구축
* 암젠이 다년간 AI 신약개발을 위해 생성하고 수집한 대규모 인체 데이터(유전체, 전사체, 단백체, 표현형 데이터, 단백질 구조, 대규모 멀티오믹스)를 취합·분석하는 센터
- 엔비디아는 디코드의 빅데이터로 신약개발용 AI 파운데이션 모델을 제작
※ 엔비디아 부사장은 ‘프레이야’에는 인구 300만 명의 5억 개 유전자 데이터가 저장되어 있고 이러한 빅데이터로 구축한 엔비디아의 AI 시스템을 활용하면 데이터를 7배 더 빠르게 처리하고 비용을 1/7로 줄일 수 있다고 설명
■바이오니모를 통해 12개 이상의 생성형 AI 파운데이션 모델을 제공, 컴퓨터로 약물을 개발하는 시대로 신약개발 프로세스의 변화를 가속
○ AI 기반 신약개발을 위해 주요 제약사·연구기관과의 협업으로 신약개발용 AI 파운데이션 모델을 모아 놓은 ‘바이오니모’ 클라우드 서비스를 시작
- 바이오니모는 신약개발을 위한 파운데이션 모델을 제공하고 제약기업은 자체 데이터로 파인튜닝하여 최적화된 AI 모델을 저비용으로 신속히 개발 가능
※ 바이오니모에는 저분자 화합물 생성을 위한 3가지 파운데이션 모델이 제공되는데 몰밈과 오픈폴드 모델은 앤비디아가 자체 개발한 모델이고 ’페놈-베타‘는 파트너사 리커전이 개발
○ 최근 엔비디아는 리커전*에 5천만 달러 투자와 신약개발용 AI 파운데이션 모델에 대한 접근 권한을 제공
* 리커전은 세포 이미지 결과를 판독하는 AI 기반의 약물 재창출 비즈니스 모델을 구축하고 있는 제약사로, 임상에 진입한 4개의 파이프라인을 보유
- 리커전은 우수한 합성 연구소(wet lab)를 가지고 있다는 점이 다른 AI 신약개발 기업과 차별화된 요소로, 빅파마도 보유하기 힘든 독자적인 화합물 합성 기술을 보유
※ 리커전은 화합물 라이브러리(chemical library) 기반으로 화합물질을 합성한 후, 세포 기반의 in vitro 실험 결과인 세포 이미지 데이터로 자체 AI 플랫폼을 개발
- 리커전은 엔비디아의 AI 파운데이션 모델을 활용해 자사 AI 모델을 최적화 하고 확장할 계획으로,
- 3조개 유전자와 화합물 관계에 대한 자체 데이터 셋(23 petabyte)을 엔비디아 바이오니모에 제공하여 생성형 AI 파운데이션 모델 개발에 활용할 예정
※ 세포 현미경 이미지 임베딩 모델인 ’페놈-베타‘ 저분자 화합물 생성용 파운데이션 모델을 엔비디아 바이오니모에 제공
○ 대학, 연구소, 기업, 정부-민간 컨소시엄 등 다양한 기관에서 바이오니모를 활용하여 자체 모델을 개발하는 등 협업 추진 중
- (테레이 테라퓨틱스) 다중 표적 구조 결합용 AI와 저분자 설계를 위한 생성형 AI 개발을 위해 바이오니모 파운데이션 모델을 활용
- (아스트라제네카) 엔비디아 케임브리지-1 슈퍼컴퓨터를 활용해 바이오니모 ’MegaMolBART‘ 파운데이션 모델 개발
※ MegaMolBART는 14억개 분자로 학습된 화합물 생성 LLM 파운데이션 모델
- (뮌헨 공대 로스트랩) 원하는 기능을 갖는 단백질의 아미노산 서열을 생성하는 바이오니모 LLM 파운데이션 모델 ’ProtT5’를 개발
- (브로드 연구소) 바이오니모 프레임워크를 이용해 차세대 DNA 언어 모델 개발
- (펩톤) 안정적인 3D 구조가 없는 단백질 모델링을 위해 바이오니모 ’ESM의 다양한 LLM 버전‘을 개발
- (정부-민간 컨소시엄) 바이오니모를 통해 최첨단 단백질 모델링 툴인 오픈소스 AI 파이프라인 ’OpenFold‘ 제공
- (Meta AI Labs) 아미노산 서열을 처리해 단백질 구조를 예측하는 LLM 파운데이션 모델, ‘ESM-1’을 바이오니모에 제공
- 단백질 엔지니어링 및 분자 설계 회사인 이노포어와 인실리코 메디슨도 신약개발을 위해 바이오니모를 도입
○ 2,500억 달러 규모의 신약개발 산업은 AI를 통해 새로운 전환을 맞이할 것으로 예상되는 가운데 바이오니모가 이러한 변화를 가속할지 주목
- 바이오니모는 AI 파운데이션 모델을 제공하여 제약사의 AI 트레이닝 시간을 획기적으로 단축할 것으로 전망
- 또한 주요 기업들과의 협업으로, 신약개발용 AI 파운데이션 모델이 점점 더 증가하고 있어 맞춤형 AI 개발을 위한 다양한 옵션을 제공
- 맞춤형 AI 개발을 위해 많은 기업들이 바이오니모를 많이 활용함에 따라 향후 생성형 AI 기반의 신약개발 시대로의 전환을 가속화할 것으로 기대
■엔비디아는 헬스케어 전용 생성형 AI 파운데이션 모델 콜렉션인 클라라를 제공하여 의료·헬스케어 분야의 AI 활용도 가속화할 것으로 전망
○ 헬스케어 전용 GPU* 기반 AI 파운데이션 모델 클라라(nVIDIA CLARATM)를 제공하여 의료·헬스케어 분야의 AI 활용을 가속화
* 엔비디아 AI용 GPU는 기존 CPU 대비 높은 사양을 요구하는 고성능 컴퓨팅과 대용량 데이터 처리를 초당 페타바이트급으로 가속화
- 생성형 AI 파운데이션 모델은 개발 시간과 비용의 절감, 추가적 학습으로 다양한 튜닝이 가능해 목적에 맞는 애플리케이션 개발이 가능
- 개발자들은 엔비디아 클라우드*로 클라라에 접속하여 자체 데이터로 실시간 파인튜닝**함으로써 시간과 비용을 절감하여 목적에 맞는 AI 개발이 가능
* 마이크로소프트, 구글 등 클라우드 업체와 협력해서 클라우드 서비스를 제공했으나 자체 데이터센터를 구축해 프라이빗 클라우드(DGX 슈퍼 POD)로도 서비스 제공
** 이미 훈련된 AI 모델에 특정 데이터 셋을 사용하여 추가적인 학습을 수행하여 특정 사양에 맞는 애플리케이션으로 개발하는 작업
○ 클라라(nVIDIA CLARATM)는 헬스케어 전용 여러 유형의 생성형 AI 파운데이션 모델을 제공하여 헬스케어 산업 및 연구를 지원
- 신약개발용 바이오니모(BioNeMo), 의료기기용 홀로스캔(Holoscan), 유전체 분석용 파라브릭스(Parabrics), 의료영상용 모나이(Monai) 등의 모델을 제공
< 엔비디아 클라라의 생성형 AI 솔루션 >
분야 | 주요 내용 및 제품군 |
바이오제약 (Biopharma) | ▪ AI에 의한 신약개발의 주요 워크플로우 가속화를 목표로, - 염기·아미노산 등 생체분자 원시데이터로 비지도 학습을 통해 훈련된 파운데이션 LLM 모델을 자체 데이터로 파인튜닝하여 단백질 구조 예측과 같은 특정 작업에 맞게 최적화된 AI를 빠르게 개발 ▪ 제품군 ➀ 바이오니모(BioNEMO) * 대규모 인체 데이터 셋을 활용해 생체분자 언어로 사전 훈련된 AI 파운데이션 모델을 제공. 후보물질 식별, 단백질 및 저분자 특성 예측(ESM-1, ESM-2, MegaMolBART, MoFlow), 단백질 생성(Prot GPT2), 결합구조 예측(DiffDock), 3D 단백질 구조 예측(OpenFold, AphaFold2, ESMFold)을 위한 LLM AI 파운데이션 모델 제공 ➁ 그로맥스(Gromacs) * 단백질, 핵산 및 지질과 같은 생체 분자 간 결합 안정성 계산을 위한 분자 역학 시뮬레이션 소프트웨어로, 분자 수준에서 복잡한 분자 간 상호 작용 및 결합을 예측 ➂ 오토독(AutoDock) * 약물 발견 및 생체 분자 구조의 메커니즘 분석을 위한 분자 결합구조 (도킹) 시뮬레이션 및 가상 스크리닝 방법을 제공 ➃ 릴라이온(Relion) * Cryo-EM 이미지를 3D로 재구성하는 프로그램 |
의료기기 (Medical Devices) | ▪ 의료기기(CT/MRI) 영상 데이터로부터 실시간 3D 이미지로 재구성하여 신체 구조를 명확히 보여주는 AR(증강현실)을 구현하는 AI 컴퓨팅 기술로, 임상의가 진단을 내리는데 도움을 주고 의료 시스템을 효율적으로 개선 ▪ 제품군 ➀ 홀로스캔(Holoscan) * 엣지(의료기기 영상)에서 실시간 데이터를 처리하기 위해 GPU와 가속 컴퓨팅을 통한 AR(증강현실) 기술로 신체 이미지를 명확히 보여주는 AI 컴퓨팅 플랫폼 <의료 영상 AI 팩토리> |
의료영상 (Medical Imaging) | ▪ LLM AI 파운데이션 모델을 통해 의료 영상 데이터를 명확하고 상세하게 분석하여 보다 정확한 질병 진단 및 예측을 구현하는 것이 목표 ▪ 제품군 ➀ 모나이(MONAI, Medical Open Network for AI) * 의료 영상용 AI 개발을 위한 오픈 소스 프레임워크로 크게 3가지 기술로 구성 - (모나이 라벨) 이미지 라벨링 학습도구를 포함하고 있어 AI 기반 라벨링 작업을 쉽게 수행 - (모나이 코어) 라벨링 작업 이후 질병의 영역을 명확하고 상세히 구분하는 딥러닝 기술을 제공 - (모나이 디플로이) 실제 환경에서 AI 애플리케이션을 설치, 개발, 테스트 및 실행할수 있는 기술 <모나이 구조> * 실제 모나이를 이용하는 대학이나 공공기관은 이후 연구결과를 다시 사회에 환원하는데 노력 - 킹스 칼리지 런던은 모나이를 이용해 인간 두뇌 3D MRI 이미지를 합성하는 LLM 모델을 구축했고 그 과정에서 만들 합성 뇌 사진 10만 개를 오픈소스로 공개 |
유전체학 (Genomics) | ▪ 전체 유전체, 엑솜(exome), 유전자 패널 분석을 가속하는 유전체 분석 AI 플랫폼으로 전례 없는 속도, 비용 효율성 및 정확성을 제공하여 개인 맞춤형 정밀 의료 발전에 기여 ▪ 제품군 ➀ 파라브릭스(Parabricks) * 시퀀싱 기기(Element, Illumina, MGI, Thermo Fisher, Ultima 등)의 원시 신호를 A,G,T,C 문자로 바꾸는 염기 콜링(base calling)과 DNA 서열 속, 유전체 변이를 찾는 변이콜링(variant calling)을 GPU 가속 버전을 사용해 빠르게 분석 - 며칠 걸리던 CPU 기반 환자 전체 게놈 분석을 GPU 가속 버전으로 몇 시간으로 단축하여 유전체 분석을 통한 정확한 진단과 맞춤형 치료 발전에 기여 <파라브릭스의 염기서열 분석 및 변이 분석 프로세스> |
지식
동향