본문으로 바로가기

BioINwatch

(BioIN + Issue + watch) : 바이오 이슈를 빠르게 포착하여 정보 제공

글로벌 반도체기업 NVIDIA, 신약개발 AI 파운데이션 모델(BioNEMO)의 클라우드 서비스 발표

  • 등록일2024-04-25
  • 조회수3777
  • 분류플랫폼바이오 > 바이오융합기술
  • 발간일
    2024-04-25
  • 키워드
    #신약개발 #AI 파운데이션 모델#바이오니모#헬스케어#클라라
  • 첨부파일
  • 차트+ ? 차트+ 도움말

 글로벌 반도체기업 NVIDIA, 신약개발 AI 파운데이션 모델(BioNEMO)의 클라우드 서비스 발표

BioINwatch(BioIN+Issue+Watch): 24-27


최근 반도체 기업 엔비디아(NVIDIA)는 인체 데이터 셋을 활용해 신약 개발용 AI 파운데이션* 모델 ‘바이오니모’를 클라우드 서비스로 제공. 이러한 서비스를 이용하여 제약기업들은 자체 데이터로 ‘바이오니모’를 파인튜닝하여 목적에 맞는 AI 모델을 빠르게 개발할 수 있게 됨. Wet lab 실험과 단순 시뮬레이션 중심이었던 기존 신약개발 프로세스가 생성형 AI 기반 설계로 전환되는 계기가 될지 주목

* 대규모 데이터 셋을 사용하여 사전에 학습되어 있는 일종의 반제품 형태의 AI 모델

▸주요 출처 : https://www.nvidia.com/en-us/clara/bionemo/

 

 세계 최대 반도체 기업 NVIDIA가 신약개발 시간과 비용을 획기적으로 줄일 AI 기반 신약개발 플랫폼인 ‘바이오니모(BioNEMO)를 공개

* Tumor Origin Recognition via Classification of Histology

○ ‘JP모건 헬스케어 컨퍼런스’에서 생성형 AI 기반의 신약개발 플랫폼 ‘바이오니모’를 공개하며 전 세계 제약 바이오 업계의 이목이 집중(2024.1.8)

- 바이오니모는 엔비디아 헬스케어 전용 AI 플랫폼인 ‘클라라*’에 속한 생성형 AI 플랫폼 중 하나로,

* 클라라 플랫폼에는 바이오니모(바이오제약)를 비롯해 홀로스캔(의료기기), 파라브릭스 (유전체학), 모나이(의료 영상) 등이 포함

- 생체분자 언어*를 학습해 단백질 구조 예측, 단백질 서열 생성, 분자 최적화, 화합물 생성, 결합구조 예측 등 신약개발을 위한 AI 파운데이션 모델**을 구축

* 염기서열, 아미노산 서열, 화합물·단백질 구조, 세포 및 의료 영상 등

** 대규모 데이터 셋을 사용하여 사전에 학습되어 있는 일종의 반제품 형태의 AI 모델

○ 이번 컨퍼런스에서 엔비디아는 세계 매출 4위 제약기업 암젠(Amgen)과의 협업 내용도 공개

- 암젠은 바이오니모를 도입해 세계 최대 규모의 인체 데이터 셋을 분석하는 생성형 AI 모델 ‘프레이야(Freyja)’를 디코드 제네틱스(deCODE genetics)*에 구축

* 암젠이 다년간 AI 신약개발을 위해 생성하고 수집한 대규모 인체 데이터(유전체, 전사체, 단백체, 표현형 데이터, 단백질 구조, 대규모 멀티오믹스)를 취합·분석하는 센터

- 엔비디아는 디코드의 빅데이터로 신약개발용 AI 파운데이션 모델을 제작

※ 엔비디아 부사장은 ‘프레이야’에는 인구 300만 명의 5억 개 유전자 데이터가 저장되어 있고 이러한 빅데이터로 구축한 엔비디아의 AI 시스템을 활용하면 데이터를 7배 더 빠르게 처리하고 비용을 1/7로 줄일 수 있다고 설명


바이오니모를 통해 12개 이상의 생성형 AI 파운데이션 모델을 제공, 컴퓨터로 약물을 개발하는 시대로 신약개발 프로세스의 변화를 가속

○ AI 기반 신약개발을 위해 주요 제약사·연구기관과의 협업으로 신약개발용 AI 파운데이션 모델을 모아 놓은 ‘바이오니모’ 클라우드 서비스를 시작

- 바이오니모는 신약개발을 위한 파운데이션 모델을 제공하고 제약기업은 자체 데이터로 파인튜닝하여 최적화된 AI 모델을 저비용으로 신속히 개발 가능

※ 바이오니모에는 저분자 화합물 생성을 위한 3가지 파운데이션 모델이 제공되는데 몰밈과 오픈폴드 모델은 앤비디아가 자체 개발한 모델이고 ’페놈-베타‘는 파트너사 리커전이 개발

○ 최근 엔비디아는 리커전*에 5천만 달러 투자와 신약개발용 AI 파운데이션 모델에 대한 접근 권한을 제공

* 리커전은 세포 이미지 결과를 판독하는 AI 기반의 약물 재창출 비즈니스 모델을 구축하고 있는 제약사로, 임상에 진입한 4개의 파이프라인을 보유

- 리커전은 우수한 합성 연구소(wet lab)를 가지고 있다는 점이 다른 AI 신약개발 기업과 차별화된 요소로, 빅파마도 보유하기 힘든 독자적인 화합물 합성 기술을 보유

※ 리커전은 화합물 라이브러리(chemical library) 기반으로 화합물질을 합성한 후, 세포 기반의 in vitro 실험 결과인 세포 이미지 데이터로 자체 AI 플랫폼을 개발

- 리커전은 엔비디아의 AI 파운데이션 모델을 활용해 자사 AI 모델을 최적화 하고 확장할 계획으로,

- 3조개 유전자와 화합물 관계에 대한 자체 데이터 셋(23 petabyte)을 엔비디아 바이오니모에 제공하여 생성형 AI 파운데이션 모델 개발에 활용할 예정

※ 세포 현미경 이미지 임베딩 모델인 ’페놈-베타‘ 저분자 화합물 생성용 파운데이션 모델을 엔비디아 바이오니모에 제공

○ 대학, 연구소, 기업, 정부-민간 컨소시엄 등 다양한 기관에서 바이오니모를 활용하여 자체 모델을 개발하는 등 협업 추진 중

- (테레이 테라퓨틱스) 다중 표적 구조 결합용 AI와 저분자 설계를 위한 생성형 AI 개발을 위해 바이오니모 파운데이션 모델을 활용

- (아스트라제네카) 엔비디아 케임브리지-1 슈퍼컴퓨터를 활용해 바이오니모 ’MegaMolBART‘ 파운데이션 모델 개발

※ MegaMolBART는 14억개 분자로 학습된 화합물 생성 LLM 파운데이션 모델

- (뮌헨 공대 로스트랩) 원하는 기능을 갖는 단백질의 아미노산 서열을 생성하는 바이오니모 LLM 파운데이션 모델 ’ProtT5’를 개발

- (브로드 연구소) 바이오니모 프레임워크를 이용해 차세대 DNA 언어 모델 개발

- (펩톤) 안정적인 3D 구조가 없는 단백질 모델링을 위해 바이오니모 ’ESM의 다양한 LLM 버전‘을 개발

- (정부-민간 컨소시엄) 바이오니모를 통해 최첨단 단백질 모델링 툴인 오픈소스 AI 파이프라인 ’OpenFold‘ 제공

- (Meta AI Labs) 아미노산 서열을 처리해 단백질 구조를 예측하는 LLM 파운데이션 모델, ‘ESM-1’을 바이오니모에 제공

- 단백질 엔지니어링 및 분자 설계 회사인 이노포어와 인실리코 메디슨도 신약개발을 위해 바이오니모를 도입

 2,500억 달러 규모의 신약개발 산업은 AI를 통해 새로운 전환을 맞이할 것으로 예상되는 가운데 바이오니모가 이러한 변화를 가속할지 주목

- 바이오니모는 AI 파운데이션 모델을 제공하여 제약사의 AI 트레이닝 시간을 획기적으로 단축할 것으로 전망

- 또한 주요 기업들과의 협업으로, 신약개발용 AI 파운데이션 모델이 점점 더 증가하고 있어 맞춤형 AI 개발을 위한 다양한 옵션을 제공

- 맞춤형 AI 개발을 위해 많은 기업들이 바이오니모를 많이 활용함에 따라 향후 생성형 AI 기반의 신약개발 시대로의 전환을 가속화할 것으로 기대


엔비디아는 헬스케어 전용 생성형 AI 파운데이션 모델 콜렉션인 클라라를 제공하여 의료·헬스케어 분야의 AI 활용도 가속화할 것으로 전망

○ 헬스케어 전용 GPU* 기반 AI 파운데이션 모델 클라라(nVIDIA CLARATM)를 제공하여 의료·헬스케어 분야의 AI 활용을 가속화

* 엔비디아 AI용 GPU는 기존 CPU 대비 높은 사양을 요구하는 고성능 컴퓨팅과 대용량 데이터 처리를 초당 페타바이트급으로 가속화

- 생성형 AI 파운데이션 모델은 개발 시간과 비용의 절감, 추가적 학습으로 다양한 튜닝이 가능해 목적에 맞는 애플리케이션 개발이 가능

- 개발자들은 엔비디아 클라우드*로 클라라에 접속하여 자체 데이터로 실시간 파인튜닝**함으로써 시간과 비용을 절감하여 목적에 맞는 AI 개발이 가능

* 마이크로소프트, 구글 등 클라우드 업체와 협력해서 클라우드 서비스를 제공했으나 자체 데이터센터를 구축해 프라이빗 클라우드(DGX 슈퍼 POD)로도 서비스 제공

** 이미 훈련된 AI 모델에 특정 데이터 셋을 사용하여 추가적인 학습을 수행하여 특정 사양에 맞는 애플리케이션으로 개발하는 작업

○ 클라라(nVIDIA CLARATM)는 헬스케어 전용 여러 유형의 생성형 AI 파운데이션 모델을 제공하여 헬스케어 산업 및 연구를 지원

- 신약개발용 바이오니모(BioNeMo), 의료기기용 홀로스캔(Holoscan), 유전체 분석용 파라브릭스(Parabrics), 의료영상용 모나이(Monai) 등의 모델을 제공

  

엔비디아 클라라의 생성형 AI 솔루션 >


 

분야

주요 내용 및 제품군

바이오제약

(Biopharma)

바이오제약

▪ AI에 의한 신약개발의 주요 워크플로우 가속화를 목표로,

- 염기·아미노산 등 생체분자 원시데이터로 비지도 학습을 통해 훈련된 파운데이션 LLM 모델을 자체 데이터로 파인튜닝하여 단백질 구조 예측과 같은 특정 작업에 맞게 최적화된 AI를 빠르게 개발


▪ 제품군

➀ 바이오니모(BioNEMO)

* 대규모 인체 데이터 셋을 활용해 생체분자 언어로 사전 훈련된 AI 파운데이션 모델을 제공. 후보물질 식별, 단백질 및 저분자 특성 예측(ESM-1, ESM-2, MegaMolBART, MoFlow), 단백질 생성(Prot GPT2), 결합구조 예측(DiffDock), 3D 단백질 구조 예측(OpenFold, AphaFold2, ESMFold)을 위한 LLM AI 파운데이션 모델 제공

➀ 바이오니모(BioNEMO)


➁ 그로맥스(Gromacs)

* 단백질, 핵산 및 지질과 같은 생체 분자 간 결합 안정성 계산을 위한 분자 역학 시뮬레이션 소프트웨어로, 분자 수준에서 복잡한 분자 간 상호 작용 및 결합을 예측

➂ 오토독(AutoDock)

* 약물 발견 및 생체 분자 구조의 메커니즘 분석을 위한 분자 결합구조 (도킹) 시뮬레이션 및 가상 스크리닝 방법을 제공

➃ 릴라이온(Relion)

* Cryo-EM 이미지를 3D로 재구성하는 프로그램

의료기기

(Medical Devices)

의료기기

▪ 의료기기(CT/MRI) 영상 데이터로부터 실시간 3D 이미지로 재구성하여 신체 구조를 명확히 보여주는 AR(증강현실)을 구현하는 AI 컴퓨팅 기술로, 임상의가 진단을 내리는데 도움을 주고 의료 시스템을 효율적으로 개선


▪ 제품군

➀ 홀로스캔(Holoscan)

* 엣지(의료기기 영상)에서 실시간 데이터를 처리하기 위해 GPU와 가속 컴퓨팅을 통한 AR(증강현실) 기술로 신체 이미지를 명확히 보여주는 AI 컴퓨팅 플랫폼

<의료 영상 AI 팩토리>


<의료 영상 AI 팩토리>

의료영상

(Medical Imaging)

의료영상

▪ LLM AI 파운데이션 모델을 통해 의료 영상 데이터를 명확하고 상세하게 분석하여 보다 정확한 질병 진단 및 예측을 구현하는 것이 목표


▪ 제품군

➀ 모나이(MONAI, Medical Open Network for AI)

* 의료 영상용 AI 개발을 위한 오픈 소스 프레임워크로 크게 3가지 기술로 구성

- (모나이 라벨) 이미지 라벨링 학습도구를 포함하고 있어 AI 기반 라벨링 작업을 쉽게 수행

- (모나이 코어) 라벨링 작업 이후 질병의 영역을 명확하고 상세히 구분하는 딥러닝 기술을 제공

- (모나이 디플로이) 실제 환경에서 AI 애플리케이션을 설치, 개발, 테스트 및 실행할수 있는 기술

<모나이 구조>


<모나이 구조>

* 실제 모나이를 이용하는 대학이나 공공기관은 이후 연구결과를 다시 사회에 환원하는데 노력

- 킹스 칼리지 런던은 모나이를 이용해 인간 두뇌 3D MRI 이미지를 합성하는 LLM 모델을 구축했고 그 과정에서 만들 합성 뇌 사진 10만 개를 오픈소스로 공개

유전체학

(Genomics)

유전체학

 전체 유전체, 엑솜(exome), 유전자 패널 분석을 가속하는 유전체 분석 AI 플랫폼으로 전례 없는 속도, 비용 효율성 및 정확성을 제공하여 개인 맞춤형 정밀 의료 발전에 기여

▪ 제품군

➀ 파라브릭스(Parabricks)

* 시퀀싱 기기(Element, Illumina, MGI, Thermo Fisher, Ultima 등)의 원시 신호를 A,G,T,C 문자로 바꾸는 염기 콜링(base calling)과 DNA 서열 속, 유전체 변이를 찾는 변이콜링(variant calling)을 GPU 가속 버전을 사용해 빠르게 분석

- 며칠 걸리던 CPU 기반 환자 전체 게놈 분석을 GPU 가속 버전으로 몇 시간으로 단축하여 유전체 분석을 통한 정확한 진단과 맞춤형 치료 발전에 기여

<파라브릭스의 염기서열 분석 및 변이 분석 프로세스>


<파라브릭스의 염기서열 분석 및 변이 분석 프로세스>


 

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용