본문으로 바로가기

BioINwatch

(BioIN + Issue + watch) : 바이오 이슈를 빠르게 포착하여 정보 제공

CZI(챈 주커버그 이니셔티브), 단일세포 연구를 지원할 빅데이터 분석용 무료 오픈소스 툴 개발

  • 등록일2024-05-07
  • 조회수1419
  • 분류종합 > 종합
  • 발간일
    2024-05-07
  • 키워드
    #단일세포 RNA 시퀀싱 데이터#CZ CELLxGENE#빅데이터분석#무료 오픈소스 툴
  • 첨부파일
    • pdf BioINwatch24-29(5.7)●CZI(챈 주커버그 이니셔티브) 단일세포 연... (다운로드 103회) 다운로드 바로보기
  • 차트+ ? 차트+ 도움말

CZI(챈 주커버그 이니셔티브), 단일세포 연구를 지원할 빅데이터 분석용 무료 오픈소스 툴 개발

BioINwatch(BioIN+Issue+Watch): 24-29


       CZI(챈 주커버그 이니셔티브)에서 개발한 CZ CELLxGENE라는 새로운 리소스는 단일세포 RNA 시퀀싱 데이터를 찾고, 질의하고, 분석하고, 다운로드하고, 게시할 수 있는 무료 오픈소스 도구 모음으로, 연구자들이 방대한 데이터를 관리하고 분석하는 데 소모되는 시간을 획기적으로 단축해줄 것으로 기대

    ▸주요 출처 : Nature News, 85 million cells - and counting - at your fingertips, 2024.4.29


 

 CZI(Chan Zuckerberg Initiative)*에서 방대한 데이터를 관리하고 분석하는 데 소모되는 시간을 획기적으로 단축해줄 도구를 개발

* Chan Zuckerberg Initiative는 페이스북 창업자인 마크 주커버그와 그의 아내 프리실라 찬이 설립한 비영리 단체로, 교육, 정의, 과학, 그리고 기회 평등 증진을 목표로 다양한 이니셔티브와 프로젝트를 지원

○ Chan Zuckerberg CELL by GENE Discover(CZ CELLxGENE)라는 새로운 리소스는 연구자들이 단일세포 RNA 시퀀싱 데이터를 찾고, 질의하고, 분석하고, 다운로드하고, 게시할 수 있는 무료 오픈소스 도구 모음으로,

  - 현재까지 약 8,500만 개의 단일세포와 1,317개의 데이터 세트를 포함하며, 표준화된 세포 유형 및 메타데이터를 사용하여 일관되게 처리되도록 지원

○ 연구자들은 CZ CELLxGENE를 사용하여 다른 연구에서 수집한 방대한 양의 데이터에 대해 질문할 수 있고, 이를 통해 세포의 정체성이나 특정 유전자 변형의 영향을 예측할 수 있는 모델 구축 및 훈련이 가능

  - 또한 데이터를 공통 공간에 투영하는 임베딩을 통해 다양한 유래의 데이터와 비교 분석을 할 수 있어 복잡한 생물학적 데이터에서 의미 있는 패턴을 추출하는 데 매우 유용

   ※ CZ CELLxGENE는 연구자들이 대규모 단일세포 데이터 세트를 쉽게 접근하고 분석할 수 있도록 하여 세포 간의 차이를 이해하고, 세포가 어떻게 서로 상호작용하는지, 그리고 질병 상태에서 세포가 어떻게 변화하는지 등을 탐구할 수 있게 지원

○ 이와 같이 무료로 접근 가능한 도구 모음은 단일세포 연구를 수행하는 실험실에서 데이터를 더 효과적으로 사용하고 시간을 절약하는 데 도움

  - CZ CELLxGENE는 개별 연구실 뿐 만 아니라 Human Cell Atlas 프로젝트와 같은 대규모 연구에 있어 방대한 세포 데이터를 통합하고 분석할 수 있는 플랫폼을 제공함으로써 연구에 기여할 것으로 기대


< 과학자들의 단일세포 데이터 분석을 지원하는 CZ CELLxGENE >

< 과학자들의 단일세포 데이터 분석을 지원하는 CZ CELLxGENE >


출처 : Nature News, 85 million cells - and counting - at your fingertips, 2024.4.29


 CZ CELLxGENE는 데이터 처리 및 분석에 대한 번거로운 단계를 제거하여 연구자들이 실제 과학적 질문에 더 집중할 수 있도록 지원

○ Van Andel Institute의 생물정보학자 Timothy Triche는 약 1,200만 개의 마우스 세포를 이용하여 성염색체가 면역세포의 생물학에 미치는 영향을 연구

  - CZ CELLxGENE를 통해 일반적인 단일세포 실험에서 실행할 수 있는 것보다 훨씬 많은 세포를 다루며, “schlep steps”라고 불리는 번거로운 단계들을 제거하였다고 설명

   ※ "Schlep steps"라는 용어는 일반적으로 번거롭고 시간이 많이 소요되는 작업 단계를 의미

○ 스탠포드대학의 컴퓨터 과학자 Jure Leskovec는 CZ CELLxGENE 데이터를 본인이 개발한 Universal Cell Embeddings 모델을 훈련시키는 데 사용

  - 이 모델을 3,600만 개의 세포 데이터 세트에 적용하여 마우스의 심장, 폐 등에 존재하는 신장 세포인 Norn 세포를 식별하였으며, 이 모델의 일반화 가능성이 핵심 기능이라고 언급

○ California Institute of Technology의 대학원생 Meera Prasad는 CZ CELLxGENE를 사용하여 약 900만 건의 건강한 세포와 종양 세포를 대표하는 약 150개의 세포 유형을 특성화하는 연구를 추진 중

  - 이를 통해 종양 미세환경을 더 잘 재현하고, 암과 관련된 구조적 변화와 관련된 유전자를 식별하는 것을 목표

○ 이러한 연구 사례들은 CZ CELLxGENE 도구가 단일세포 연구에 어떻게 활용될 수 있는지 보여주며, 데이터 분석과 모델 훈련에 있어 효율성과 정확성을 크게 향상시킬 수 있음을 강조

- 이 도구는 다양한 연구자들이 자신의 데이터를 다른 연구자들의 데이터와 함께 비교하고 통합하여 보다 광범위한 생물학적 질문에 대답할 수 있도록 도움을 줄 것으로 기대


CZ CELLxGENE 도구 모음은 생물학 연구, 특히 단일세포 유전자 발현 데이터를 분석하는 분야에서 여러 가지 중요한 장점을 제공

○ 데이터 접근성을 향상시켜 데이터 수집 과정에서 소모되는 시간과 노력을 대폭 감소시킬 수 있음

  - CZ CELLxGENE는 다양한 공공 데이터베이스와 개별 실험실에서 수집된 방대한 데이터를 통합하여 연구자들이 쉽게 접근할 수 있도록 지원

  - 표준화된 데이터 처리로 연구자들은 데이터의 일관성을 걱정하지 않고 직접적으로 분석에 집중

   ※ 모든 데이터는 표준화된 세포 유형 및 메타데이터를 사용하여 일관되게 처리

○ 또한 다양한 분석 도구를 제공하여 복잡한 데이터 처리와 사용자 정의 분석이 가능

  - 연구자는 데이터를 검색 및 분석하고, 조합하기 위해 R 또는 Python 같은 프로그래밍 언어를 사용할 수 있음

○ 데이터를 하나의 플랫폼에서 쉽게 접근하고 분석할 수 있게 함으로써 시간 및 자원을 절약

  - 특히, 연구자들은 반복 실험에 들어가는 시간과 비용을 절약할 수 있으며, 인공지능 및 모델링 도구를 사용하여 연구자들은 자신의 데이터에 대한 모델을 구축하거나 기존 모델을 미세조정할 수 있음

  - 또한 임베딩을 통해 자신의 데이터를 기존의 거대한 데이터 세트와 비교하여 더 폭넓은 인사이트를 확보할 수 있음

○ CZ CELLxGENE를 통해 연구자는 자신의 데이터를 공유함으로써 전 세계 과학자들과 협력이 가능

  - 이러한 장점들은 CZ CELLxGENE가 생물학 데이터 분석 및 활용 방식을 혁신적으로 변화시키는 데 기여할 수 있는 부분으로 주목


...................(계속)

 

자료 추천하기

받는 사람 이메일
@
메일 내용