본문으로 바로가기

BioINpro

(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공

[플랫폼바이오] 유전체 해독 기술을 활용한 바이오 산업

  • 등록일2023-09-26
  • 조회수3177
  • 분류생명 > 생명과학,  생명 > 생물공학,  플랫폼바이오 > 바이오융합기술
  • 저자/소속
    김준/충남대학교 생명정보융합학과 조교수
  • 발간일
    2023-09-26
  • 키워드
    #유전체 해독#긴 리드 유전체 해독 기술#신생항원#암백신
  • 첨부파일
    • pdf [BioINpro 116호] 플랫폼바이오_유전체 해독 기술을 활용한 바이... (다운로드 218회) 다운로드 바로보기
  • 차트+ ? 차트+ 도움말

 

 

[플랫폼바이오] 유전체 해독 기술을 활용한 바이오 산업



김준 / 충남대학교 생명정보융합학과 조교수

 

◈ 목차

1. 유전체 해독 기술 관련 기본 개념

  가. 유전체 해독 기술의 중요성

  나.유전체 해독 과정

  다. 기술적 한계로 인해 생긴 리드(read)의 정의

2. 리드 길이별 유전체 해독 기술

  가. 짧은 길이의 분자 정보를 해독하는 기법

  나. 긴 길이의 분자 정보를 해독하는 기법

3. 긴 리드 해독 기법을 활용한 연구와 산업 연계 가능성

  가. 예상 연구 활용 방법1 – 암 유전체 지도를 활용한 돌연변이 완전 해독

  나. 예상 연구 활용 방법2 – 암세포 특이적 유전자를 활용한 암 백신 개발

  다. 암 백신 국내 개발의 실현 가능성

4. 결론

 

 

◈본문


1. 유전체 해독 기술 관련 기본 개념

 유전체 해독 기술은 생명현상을 이해하기 위한 가장 기반 기술로 쓰이고 있을 뿐만 아니라현재 다양한 바이오 산업과 밀접한 관계를 맺으며 중요한 정보를 생산하고 있는 핵심 기술이기도 하다본 글에서는 이러한 유전체 해독 기술의 여러 측면을 소개하고 이를 활용한 산업 연계 가능성에 대해 논의하고자 한다특히 긴 리드 유전체 해독 기술과 암 백신 사례 등을 중심으로 이를 살펴보고자 한다. 긴 리드 유전체 해독 기술은 저명 학술지인 네이처 메소드(Nature Methods) 에서 2023년 올해의 기술로 선정됐을 정도로 중요한 기술로 자리 잡고 있으며, 암 백신은 최근 모더나(Moderna)와 머크(Merck)에서 임상 2상을 성공리에 마치고 임상 3상에 도입하며 중요성이 크게 부각되고 있는 기법이다(Marx, 2023).


유전체 해독 기술의 중요성

 이 단락과 관련된 내용은 바이오인프로, “[디지털 바이오유전체 빅데이터 기반의 맞춤 의료” 보고서에 보다 자세하게 담겨 있다.

 유전체는 세포 안에 담겨 있는 DNA를 통틀어 일컫는다이러한 유전체에는 세포가 작동하는 데 필요한 다양한 정보가 담겨 있으며대표적으로는 유전자 정보와 유전자를 조절하는 정보 등이 포함된다이러한 유전자는 RNA를 생산하게 되며이 RNA에서 단백질이 만들어진다그리고 단백질은 세포 안에서 다양한 생화학 반응이 일어나도록 도우며 세포에게 기능을 부여한다이러한 유전자에 돌연변이가 생겨 그로부터 생산되는 단백질이 제 기능을 못하게 되기도 하는데때로는 그로 인해 세포가 망가지거나 암세포로 발전하게 되기도 한다따라서 세포가 제 기능을 하기에 충분할 만큼 단백질이 제대로 잘 만들어지고 있는지 확인할 수 있다면또는 반대로 세포 안에 망가진 단백질이 얼마나 되고 그것이 세포의 기능을 얼마나 망가뜨리고 있는지 확인할 수 있다면수많은 질병과 질환에 대해 유례 없는 수준으로 깊이 있게 이해하는 것이 당장이라도 충분히 가능할 것이다나아가 혹시라도 이렇게 망가진 단백질을 다시 복원시켜 단백질과 세포가 제 기능을 하도록 도울 수 있다면이로 인해 생겨날 수 있는 질병과 질환을 예방하는 데 큰 도움이 될 것이다.

 그러나 이러한 단백질의 정보를 저렴하게대량으로 분석하는 것은 현재 기술로는 쉽지 않은 일이다따라서 이러한 단백질을 직접 읽는 것이 아니라간접적으로 읽어내는 방식이 필요하다그리고 수많은 생체 분자 중에서 단백질에 대한 정보를 간접적으로 유추할 수 있으면서도 가장 저렴하게 분석할 수 있는 분자는 현재 단 두 가지만이 존재한다바로 DNA와 RNA이다다시 말해 DNA와 RNA에 담긴 다양한 정보를 대량으로 확보하고이러한 정보를 기반으로 단백질과 세포 안에서 일어나는 반응이 어떻게 망가져 있는지를 조사해 질병과 질환에 대해 이해할 수 있는 것이다.


유전체 해독 과정

 유전체 해독 기술(sequencing technology)이란 바로 이러한 DNA 및 RNA에 담긴 정보를 해독해내는 기술이다서로 다른 DNA 분자는 다른 것은 거의 다 똑같지만 염기 부분에서는 대개 뚜렷한 차이점을 보인다다시 말해, DNA는 총 네 가지의 염기즉 아데닌(A), 타이민(T), 구아닌(G), 사이토신(C)이라는 분자 중 하나가 실처럼 늘어선 뼈대에 붙어있는 형태를 띠고 있다예를 들어 한 DNA 분자는 ATGCGTGCT라는 9개 염기로 이루어져 있지만다른 분자는 GGTG CTTTGA라는 10개 염기로 이루어져 있을 수 있다각각을 9개 염기쌍10개 염기쌍 등으로 부르곤 하며이때 단위로 쓰이는 염기쌍은 DNA에 존재하는 염기의 길이를 가리킨다. (참고로 DNA는 이중나선이기 때문에 염기이라 불린다.

 아쉽게도 이러한 염기 분자 각각이 DNA라는 선 위에 어떻게 배열돼 있는지는 우리가 직접 눈으로 확인할 수 없기 때문에 반드시 해독 과정을 거쳐야 한다이러한 해독 과정은실제로는 생화학 반응을 통해 DNA에 담긴 정보를 A, T, G, 등의 문자 정보로 바꾸는 과정이다이를 통해 DNA에 담긴 정보는 사람이 이해할 수 있는그리고 컴퓨터가 이해할 수 있는 대용량 문자 정보로 치환되게 된다사람이라면 23개 염색체에 담긴 30억 개의 DNA 염기 정보가 30억 개의 A, T, G, C 조합으로 저장되는 것이다.


기술적 한계로 인해 생긴 리드(read)의 정의

 문제는 이러한 DNA 분자에 담긴 정보를 처음부터 끝까지 한 번에 해독하는 것이 현재로서는 기술적으로 불가능하다는 데 있다예컨대 사람은 30억 개 염기쌍이 23개 염색체에 나뉘어 들어있다평균적으로 대략 1억 3천만 염기쌍이 하나의 염색체에 들어있는 셈인데염색체의 왼쪽 끝부터 오른쪽 끝까지 한 번에 1억 3천만 개의 염기 정보를 읽어내는 것은 기술적으로 불가능하다. DNA 분자의 길이가 너무나 길기 때문이다바꿔 말하자면DNA가 어느 정도는 잘려서 적당한 길이가 되어야만 읽을 수 있는 것이 현재 유전체 해독 기술이 지닌 중요한 한계점 중 하나이다.

 이렇게 DNA가 잘린 뒤 한 번에 읽어낼 수 있는 염기 정보를 리드(read)라고 부른다보통은 수백 염기쌍에서 수만 염기쌍 정도로 DNA가 아주 잘게 잘려야만 읽어낼 수 있다이는 1억 3천만 염기쌍의 DNA를 수백만 개 또는 수만 개 정도 조각으로 잘려야 하는 수준이다이로 인해 염색체라는 고유한 구조물의 정보는 잃게 되지만이렇게 잘라야만 DNA 정보를 온전하게 얻을 수 있는 것이 현재의 딜레마다유전체 해독 기술을 분류하는 방식은 여러 가지가 있지만, 이번 글에서는 먼저 이렇게 잘라낸 뒤 한 번에 읽어내는 DNA 분자의 길이즉 리드 길이에 따라 크게 분류하고자 한다.

 참고로 최근에는 이러한 기법을 활용해 각 세포 안에 존재하는 DNA 및 RNA 정보를 확보하는 단일세포 유전체 해독 기법도 크게 성장하고 있으며이러한 기법은 짧은 리드 해독 기법 및 긴 리드 해독 기법 등과 함께 적용된다이를 통해 수많은 서로 다른 세포들이 복잡하게 섞여 있는 경우에도 그 유전체 정보를 상당 부분 해독하는 것이 가능해졌다.


2. 리드 길이별 유전체 해독 기술

 유전체 해독 기술은 현재 가장 빠르게 발전하고 있는 기술 분야 중 하나이다이는 DNA와 RNA에 담긴 염기서열 정보를 해독함으로써 다양한 생명현상에 대해 이해하는 것이 가능해졌기 때문이다실제로 다양한 업체가 저마다 서로 다른 기반 기술을 지니고 있으며이러한 기반 기술을 기반으로 서로 다른 형태로 유전체를 해독해내고 있다본 단락에서는 이러한 해독 기술을 크게 리드 길이가 짧은 경우와 긴 경우로 나눠서 설명하고자 한다현재는 각각 약 100에서 200 염기쌍을 읽어내는 기술과 약 1만 여 염기쌍 이상을 읽어내는 기술로 크게 나눌 수 있다.


짧은 길이의 분자 정보를 해독하는 기법


① 기법이 지닌 특징

 리드 길이가 짧은 기법들은 주로 (1) 가격이 상대적으로 저렴하고 (2) 정확도가 상당히 높으며 (3) 해독할 DNA가 손상돼 있거나 양이 적어도 괜찮다는 특징을 지니며보통 읽어내는 리드 길이는 100 염기쌍에서 200 염기쌍 수준이다금액이 저렴하다 보니 현 시점에서는 가장 널리 쓰이는 방법이기도 하다.

 이러한 기법들은 보통 해독 과정에서 동일한 DNA를 증폭하는 과정을 거치는 경우가 많은데이로 인해 DNA 양이 적어도 문제없이 해독할 수 있다는 장점을 지닌다이에 더해 증폭된 분자를 대상으로 A, T, G, C 정보를 확인하는 것이다 보니 상대적으로 그 신호가 명확하게 나와 정확도도 높다. DNA의 품질도 보통 크게 문제가 되진 않는데애초에 읽어내는 길이가 수백 염기쌍 수준이다 보니 DNA가 잘게 조각나 있는 상황에서도 해독은 가능하기 때문이다실제로 수백 수천 년 된 시료에서 DNA를 추출해 유전체 정보를 해독하는 것도 가능할 정도로 다양한 기법이 개발돼 있다.


② 관련 업체 및 장비

 리드 길이가 짧은 유전체 해독 장비 중 가장 대표적인 것은 일루미나(Illumina)에서 제공하는 NovaSeq6000을 꼽을 수 있다일루미나는 가장 오랜 시간 동안 가장 높은 점유율을 보이고 있는 업체로서짧은 리드를 정확하고 저렴하게 확보할 수 있도록 하는 다양한 플랫폼을 제공하고 있다이에 대한 대항마로 등장한 장비로는 BGI 지노믹스(BGI Genomics)에서 제공하는 BGISEQ-500, 울티마 지노믹스(Ultima Genomics)에서 제공하는 UG 100, 엘리먼트 바이오사이언스(Element Biosciences)에서 제공하는 AVITI 등을 들 수 있으며이들은 저렴한 금액비슷한 수준의 정확도 등을 무기로 내세우고 있다.

 다만 현재까지 해독된 유전체 정보가 이미 대부분 일루미나 기반의 장비로부터 생산된 것이기 때문에이것과 직접적인 비교를 하기 위해 새롭게 생산하는 유전체 해독 정보도 일루미나 장비를 활용하는 경우가 많다서로 다른 장비에서 생산된 데이터는 서로 몇몇 지점에서 차이를 보여 직접적인 비교가 어려운 경우가 많기 때문이다.

 그럼에도 향후에는 저렴한 비용을 기반으로 새로운 환경을 구축할 가능성이 있다특히 사람과 달리 애초에 유전체 해독이 많이 되지 않은 경우그래서 새롭게 더 많은 개체의 유전체를 해독하는 것이 의미가 있는 다양한 가축과 작물 등이 주요 대상이 되지 않을까 예상한다또는 자국에서 생산된 장비를 기반으로 국가 차원의 유전체 해독 사업이 진행되는 경우도 늘어날 것으로 내다본다.


③ 일반적인 연구 활용 방법

 리드 길이가 짧은 유전체 해독 기법들은 기본적으로 엄청난 숫자의 유전체 정보를 해독해야 할 때 주로 쓰인다이러한 기법들은 금액이 저렴하다는 것이 가장 주된 장점이기 때문이다예를 들어 국가 차원에서 수십만수백만 명의 유전체 정보를 해독해야 할 때현재는 주로 리드 길이가 짧은 기법이 주로 쓰인다또한 한번에 수많은 세포의 정보를 분석해야 하는 단일세포 분석법에서도 리드 길이가 짧은 기법이 주로 쓰이게 된다마찬가지로 대량의 정보를 확보해야 하기 때문이다이와 관련해서는 뒤에서 좀 더 자세히 다루고자 한다.

 이렇게 저렴하고 정확성이 높다는 장점을 지닌 기법이지만 완벽하진 않다이러한 짧은 길이만으로는 해독하고 분석하는 것이 거의 불가능한 복잡한 영역이 유전체 내에 대량으로 존재하기 때문이다이처럼 복잡한 영역을 분석해내려면 거의 반드시 리드 길이가 긴 기법을 활용해야만 한다다음 단락에서 이에 대해 좀 더 자세히 알아보고자 한다.


긴 길이의 분자 정보를 해독하는 기법


① 기법이 지닌 특징

 리드 길이가 긴 기법들은 한번에 읽어내는 DNA의 길이가 길다는 것만으로도 짧은 리드 기법으로는 대체할 수 없는 장점을 지니게 된다리드 길이가 길어야만 분석이 가능한 유전체 영역다시 말해 인류가 접근하기 어려웠던 이 영역에 산업적으로 유용한 정보가 대량으로 잠재돼 있을 것이란 예상이 많기 때문이다.

 현재는 비싼 비용만이 문제가 되고 있다짧은 리드 해독 기법에 비해 여전히 5배에서 10배 가량 비싸기 때문에이러한 비용적인 측면이 해결되어야 해당 기법이 본격적으로 보편적인 기법으로 자리 매김할 수 있을 것으로 내다보고 있다. 2023년 현 시점은 과도기에 가까운데여전히 비용이 비싸긴 하지만 대규모 유전체 해독 연구를 할 수 있는 수준까지는 저렴해졌기 때문이다따라서 지금 시기에 긴 리드 해독 기법을 기반으로 한 대규모 유전체 해독 연구를 선점하려는 시도가 전 세계적으로 차츰 늘고 있다국내에서는 소규모 연구진 수준에서만 관련 논의가 진행되고 있는 형편이다.


② 관련 업체 및 장비

 현재는 크게 두 개 업체에서 제공하는 장비를 통해 긴 리드 기반 유전체 해독 연구가 수행되고 있다하나는 퍼시픽 바이오사이언스(Pacific Biosciences; PacBio; 팩바이오)에서 제공하고 있는 레비오(Revio) 시스템이며다른 하나는 옥스퍼드 나노포어 테크놀로지(Oxford Nanopore Technologies; ONT)에서 제공하고 있는 프로메싸이온(PromethION)이다이 둘은 저마다 다음과 같은 장점을 지니고 있다.

 먼저 PacBio의 레비오 시스템은 충분히 긴 리드 길이매우 높은 정확도충분히 저렴해지고 있는 가격 등의 장점을 지니고 있다이는 약 15,000 염기쌍 수준의 리드 정보를 제공해주는데이는 짧은 리드 해독 기법 대비 100배 가까이 긴 정보를 담고 있을 뿐만 아니라유전체 영역에 존재하는 복잡한 영역의 상당 부분을 해독할 수 있는 수준이기에 활용도가 매우 높다가장 큰 장점은 99.9%를 넘는 매우 높은 정확도이며이는 최근에 구글에서 개발한 딥러닝(deep learning) 기반 모델이 도입되며 달성된 성과이다(Baid et al., 2022)최근에는 장비에서 생산할 수 있는 데이터 양이 급격하게 늘어나며 비용도 저렴해졌다현 시점에 유전체 해독 장비를 전문으로 활용하는 국내 업체에 맡길 경우짧은 리드 해독 기법 대비 약 5배 수준으로 비용이 저렴해진 상황이다.

 참고로 기존에 널리 쓰이던 긴 리드 해독 기법은 정확도가 낮다는 것과 비용이 매우 비싸다는 것이 가장 큰 문제였다실례로불과 5년 전만 해도 정확도가 90%에서 95수준에 지나지 않았으며정확도 문제가 개선된 2년 전 즈음에도 비용은 여전히(짧은 리드 해독 기법 대비) 30배 수준으로 매우 비싼 편이었다. PacBio의 레비오 시스템은 이러한 단점 중 정확도 문제는 완벽하게 해결한 상황이며비용은 지금보다도 더 저렴해질 수 있을 것으로 예상된다현재 DNA 해독 분야에서는 레비오 시스템이 거의 표준에 가깝게 널리 쓰이고 있다.

 다음으로 ONT에서 제공하고 있는 프로메싸이온은 매우 긴 길이의 리드 정보를 상당히 저렴하게 제공한다는 장점을 지닌다특히 길이가 압도적으로 긴데보통 수만 염기쌍 이상가장 길게는 백만 염기쌍에 가까운 매우 긴 리드 정보를 제공해준다이로 인해 PacBio 레비오 시스템으로도 정확하게 해독하기 어려울 정도로 복잡한 유전체 영역에 대한 정보를 확보하려고 할 때에는 ONT 기법을 활용하는 것이 현재까지는 필수적이다다만 정확도는 떨어져서 약 99수준으로 알려져 있다정확도를 뒤집어 오류율로 따져보면 1%에 준하는 수준인데이는 짧은 리드 해독 기법이나 PacBio 레비오 시스템에서 제공하는 데이터의 오류율인 0.01%~0.1%와 비교해 10배에서 100배 정도 높은 수준이다필요 비용은 빠르게 저렴해지고 있으며향후 리드 길이와 정확도 등이 발전할 가능성이 높아 각광 받고 있기도 하다현재는 ONT 기법 자체로도 유전체 해독에 쓰이는 경우가 많지만정확도 문제로 인해 PacBio 레비오 시스템 데이터를 보완하는 용도로 쓰이는 경우도 많다.


3. 긴 리드 해독 기법을 활용한 연구와 산업 연계 가능성


예상 연구 활용 방법– 암 유전체 지도를 활용한 돌연변이 완전 해독

 리드 길이가 긴 기법들은 최근에야 널리 활용되게 되었는데이는 이러한 긴 리드 해독 기법이 실용성 높은 수준으로 발전한 지 얼마 되지 않았기 때문이다해당 기법은 근 5년 사이에 눈부신 속도로 발전하며 이제는 다양한 측면에서 기존 짧은 리드 해독 기법을 대체할 수 있는 수준까지 이르게 되었다특히 올해 기존의 긴 리드 해독 장비보다 5배 가량 저렴하면서도 정확도 높은 긴 리드를 생산할 수 있는 장비인 PacBio 레비오 시스템이 출시되며 다양한 가능성이 열리고 있다동시에 PacBio와 ONT에서 생산된 데이터를 처리할 수 있는 다양한 프로그램이 계속해서 개발되며 활용도가 높아졌다최근에는 이 두 데이터를 모두 활용해 서로를 보완해 완벽한 수준으로 유전체를 해독하는 프로그램이 개발되기도 했다가장 대표적인 활용법인 DNA와 RNA 해독 기법을 간략하게 살펴보겠다.


유전체 조립 과정 요약

그림 1. 유전체 조립 과정 요약① 리드 기반 DNA 조각의 염기 정보를 확인(회색 사각형)-->② 리드끼리 서로 겹치는 부분을 활용하여 퍼즐 맞추듯 원래 염색체에 가까운 보다 큰 덩어리의 DNA 정보를 재구성(검은색 사각형)

 서로 겹치는 부분이 없거나 DNA 서열이 복잡해 그 구조를 정확하게 풀어낼 수 없는 경우에는 서로 분리된 덩어리로 분석이 끝나기도 함예컨대 위 그림에서 두 개의 검은색 사각형 사이에는 겹치는 DNA 리드가 없어 독립적인 덩어리 형태로 분석이 완료


 현재 가장 널리 쓰이는 사례는 유전체 지도 작성 관련 분야이다유전체 지도란 생물이 지니고 있는 유전체 정보를 염색체 또는 그에 준하는 수준으로 재구성한 것을 가리킨다가장 널리 알려진 사례는 2000년대 초에 마무리된 인간 게놈 프로젝트(Human Genome Project)를 들 수 있다당시에는 현재 가치로 약 3조에서 5조 원 가량의 비용이 들었던 것으로 추산되는 거대 과학이었으나현재는 기술이 발전하면서 그 금액이 매우 저렴해졌다예컨대 PacBio의 레비오 시스템을 활용하면 약 1,000만 원 정도만으로도 인간 게놈 프로젝트보다 정확도 높은 유전체 지도 결과물을 얻는 것이 가능하다이에 더해 ONT에서 제공하는 매우 긴 리드 정보 및 다른 유전체 해독 기법을 함께 활용하면 품질을 더 높일 수도 있다이를 통해 어머니에게 물려받은 염색체에 담긴 30억 염기쌍의 정보와 아버지에게 물려받은 염색체에 담긴 30억 염기쌍의 정보를 따로따로 온전하게 재구성해 한 사람당 총 60억 염기쌍에 달하는 유전체 지도를 완벽하게 확보하는 것도 가능해졌다(Nurk et al., 2022; Liao et al., 2023; Rautiainen et al., 2023).

 이러한 유전체 지도 작성 사업은 대부분 정상 세포를 대상으로 진행되고 있으나빠른 시일 내에 암세포 대상 유전체 지도 작성 사업까지도 시작될 것으로 예상된다암세포는 유전체 불안정성이 높아 DNA가 손상되고 회복되는 일이 자주 일어나게 되는데이는 암세포 유전체에 수많은 돌연변이를 일으킨다이러한 돌연변이 중 1개 염기가 바뀐 단일 염기 변이(single nucleotide variant; SNV)에 대한 연구는 수없이 진행된 바 있으나염기가 한두 개 바뀐 수준이 아니라 수백 수천 염기쌍 달하는 DNA 손상 및 회복 과정은 명확하게 해독된 바 없다또한 암세포 내에서 염색체가 쪼개지고 합쳐지는 과정을 반복하며 서로 다른 염색체가 융합되기도 하는 등 복잡한 형태로 재구성된다는 것은 잘 알려져 있다그러나 이렇게 재구성된 암세포의 유전체 지도를 염색체 수준에서 완벽하게 해독한 사례는 현재까지도 없다다시 말해 인류는 여전히 암세포의 유전체가 어떻게 생겼는지 모른다.

 이러한 문제는 암세포 대상 유전체 지도 작성 사업이 시작되면 충분히 해독할 수 있는 사안임이 확실하다이러한 암 유전체 지도가 계속해서 쌓인다면 기존에 알려지지 않은 새로운 형태의 돌연변이를 확인할 수 있을 것이 확실하다나아가 이러한 돌연변이 중 암세포를 암세포로 만드는 돌연변이를 찾아내는 것도 가능할 것으로 내다본다.


암세포 내에서 일어날 수 있는 염색체 손상과 그 결과 형성되는 새로운 염색체 구조

그림 2. 암세포 내에서 일어날 수 있는 염색체 손상과 그 결과 형성되는 새로운 염색체 구조정상세포의 3개 염색체(왼쪽)가 암세포에서는 중간중간 끊어지는 염색체 손상이 일어날 수 있고(가운데)이렇게 끊어진 염색체가 다시 서로 이어지지 않는다면 세포는 사멸하게 될 수 있는데 어떻게든 서로 다시 이어져 안정적인 새로운 염색체를 형성하게 되면(오른쪽) 이러한 세포 사멸을 방지 가능.

※ 암세포에서는 이렇게 복잡하게 구조가 바뀐 새로운 염색체가 형성되는 경우가 잦으며이러한 과정을 통해 유전자 조절이 바뀌거나 유전자 융합 등이 일어나기도 함이는 때때로 암세포의 생존에 중요한 기능을 담당하거나 암세포에서만 나타나는 단백질을 만들어내기도 하기 때문에이러한 유전자를 찾아 암세포를 표적 치료하려는 시도가 많으나 기술적 한계로 인해 복잡한 구조를 지니게 된 암 세포의 새로운 염색체 정보는 제대로 분석된 적이 없음그리고 이러한 염색체 정보는 긴 리드 기반 유전체 해독을 통해서 달성 가능.


예상 연구 활용 방법– 암세포 특이적 유전자를 활용한 암 백신 개발

 긴 리드 해독 기법은 DNA 뿐만 아니라 RNA에도 고스란히 적용될 수 있으며암세포 내 RNA를 해독하는 일은 그 잠재성이 훨씬 더 크다암 백신을 비롯해 산업적으로 응용될 수 있는 분야가 무궁무진하기 때문이다이것이 가능한 이유를 이해하려면 RNA의 특성과 암세포 내에서 나타날 수 있는 RNA에 대한 특징을 이해해야 한다.

 먼저 RNA는 DNA 중 극히 일부분인 유전자 지역(사람에서는 대략 1% 수준)에서 만들어지며이중 단백질을 만드는 데 쓰이는 유전자는 약 2만 여 개가 알려져 있다각 DNA의 유전자에서는 서로 비슷하지만 조금씩 다른 RNA가 최종적으로 만들어진다이는 DNA 유전자 지역에서 최종 RNA가 될 수 있는 지역은 블록(엑손exon이라고 부름)처럼 떨어져 있으며하나의 유전자에 존재하는 여러 블록으로부터 다양한 조합이 형성돼 최종 RNA가 완성되는 특징을 지니기 때문이다그리고 이렇게 서로 다른 블록 조합을 활용해서 형성된 RNA는 서로 다른 단백질을 만들어낼 수 있다하나의 유전자만으로도 서로 다른 RNA와 단백질을 만들어냄으로써 다양성을 극도로 높일 수 있는 것이다그리고 최근 실제로 조직마다 서로 다른 RNA가 만들어진다는 것이 밝혀지기도 했으며기존에 알려지지 않은 새로운 조합의 RNA가 7만 여 개 이상 찾아지기도 했다(Glinos et al., 2022). 이러한 결과는 어떻게 단 2만 여 개의 유전자만으로 우리 몸에 있는 수많은 세포가 서로 다른 기능을 갖게 되는지를 일부 설명해주기도 한다유전자는 2만 개에 불과하지만그로부터 만들어지는 단백질은 수십만 개 이상 존재할 가능성이 있기 때문이다.

 이러한 RNA 내 블록 조합은 기존 짧은 리드 해독 기법으로는 정확하게 분석하는 것이 불가능했으며긴 리드 해독 기법으로만 제대로 된 해석이 가능하다이는 최종 RNA가 약 수천 염기쌍의 길이를 지니고 있기 때문이다. RNA가 이렇게 길다 보니 수백 염기쌍만 읽어낼 수 있는 짧은 리드 해독 기법으로는 특정 조합의 연결은 확인할 수 있지만실제로 어떤 조합이 가능한지 명확하게 해독하는 것이 불가능했다반면 긴 리드 해독 기법은 한번에 1만 염기쌍까지도 거뜬히 읽어낼 수 있기 때문에최종 RNA를 처음부터 끝까지 한번에 읽어내는 것이 가능하다따라서 하나의 최종 RNA 내에 어떤 블록들이 어떤 순서로 조합을 이루는지를 명확하게 해독해내는 것이 가능하다여전히 사람의 몸에 존재하는 최종 RNA들이 어떤 블록들의 조합으로 이뤄져 있는지실제로 활용되는 조합은 대체 몇 개나 되는지는 이제 막 연구가 시작되었기 때문에관련 연구를 선점하는 것이 중요할 것으로 보인다.



그림 3. 암세포 내에 존재하는 새로운 유전자 정보를 활용한 진단 및 백신 개발정상세포의 염색체에서 4개의 유전자에서 특정한 형태의 RNA가 생산염색체 손상 후 복구된 암세포 내 염색체에서 기존에는 유전자가 만들어지지 않던 지역에서 새로운 유전자가 만들어지기도 하고(맨 왼쪽 새 유전자”)기존에 알려진 유전자들이 합쳐져 새로운 융합 유전자가 만들어지기도 하며(가운데 융합 유전자”)같은 유전자에서 블록 조합이 이상하게 바뀐 형태로 RNA가 형성되기도 한다(맨 오른쪽 블록 조합이 바뀐 유전자”)이러한 경우 모두 정상세포에는 없는 신생항원(neoantigen)을 만들어낼 수 있기 때문에이를 기반으로 암을 진단하거나 암 백신을 개발이 가능.


 정상 세포에는 없지만 암세포에만 존재하는 새로운 형태의 블록 조합이나 새로운 RNA를 밝혀내는 일은 그 중요성이 훨씬 더 높을 것이 분명하다암세포는 돌연변이를 많이 지니고 있을 뿐만 아니라 유전자 조절 과정이 제대로 작동하지 않는 경우가 많은데이런 이유들로 인해 RNA 생성 과정이 비정상적으로 일어나는 경우가 많다이러한 조절 과정이 제 기능을 하지 못하게 되면 정상 세포에서는 쓰이지 않는 블록 조합이 탄생할 수 있으며때로는 정상 세포에서는 단백질이 만들어지지 않는 또는 만들어져서는 안 되는 지역에서 RNA 및 단백질이 새롭게 생성되기도 한다마찬가지로 기술적 한계로 인해 이와 같은 정보는 지금까지 제대로 조사된 바가 거의 없었고그렇기에 암세포를 대상으로 RNA 정보를 명확하게 해독하려는 시도가 앞으로 계속될 것으로 보인다.

 이처럼 암세포에만 존재하는 블록 조합 및 새로운 RNA 정보 중 적어도 일부는 암 진단 표적으로 쓰일 수 있을 것이 확실하다정상 세포에는 없고 암세포에서만 만들어지는 RNA 목록을 긴 리드 해독 기법으로 확보할 수 있다면향후에는 이러한 암세포 특이적 RNA를 검출할 수 있는 장비를 개발하는 것이 가능하기 때문이다.

 더욱 중요한 점은이러한 RNA를 활용하여 암 백신 개발에 도전할 수 있을 것이라는 점이다이러한 암세포 특이적 RNA 중 상당수는 단백질을 만들어낼 수 있을 것이기에이중 적어도 일부는 암세포에서만 나타나는 신항원(neoantigen)을 만들어낼 가능성이 높다이러한 신항원은 정상세포에서는 만들어지지 않지만 암세포에서만 만들어지는 단백질로부터 생겨나는 항원을 가리킨다이는 암세포에서만 만들어지기 때문에 이를 표적으로 삼아 암세포를 공격하도록 암 백신을 활용해 면역세포를 훈련시키는 것이 가능하다마치 코로나바이러스의 항원을 표적으로 하는 mRNA 백신이 코로나바이러스를 무찌른 것처럼암세포의 신항원을 표적으로 하는 mRNA 백신은 암세포를 제거할 수 있다실제로 모더나(Moderna)와 머크(Merck)에서 임상 3상에 돌입한 mRNA 암 백신은 흑색종을 대상으로 개발됐으며수술로 종양 조직을 제거한 뒤 재발 및 전이를 40% 이상 막아주는 방식으로 작동한다긴 리드 해독 기법을 활용해 더 많은 신항원을 개발할 수 있다면흑색종이 아닌 다양한 암종에 대해 수술 이후 재발과 전이를 막아주는 암 백신 개발을 성공시킬 수 있을 것이라 내다본다.


암 백신 국내 개발의 실현 가능성

 이처럼 긴 리드 해독 기법을 활용한 신생항원 발굴 연구는 국내 역량으로 충분히 해낼 수 있는 일이며, R&D 투자가 시급한 일이라 생각한다한국은 분명 mRNA 기반 암 백신 개발의 후발 주자이긴 하나이를 선도하기 위한 다양한 장비와 기술을 갖추고 있는 곳이기도 하다또한 현재 이와 관련된 거대 국제 협력 연구가 존재하지 않는 것으로 알고 있기 때문에국내에서 이러한 분야를 선점하여 연구에 돌입해야 할 필요성이 높다이는 국가전략기술로 자리 잡을 수 있는 주요 연구 분야라 내다본다.

 국내에 확보된 주요 사항은 다음과 같다먼저 신생항원 발굴을 위해 암세포 특이적 RNA를 찾는 일은 긴 리드 해독에 쓰이는 고가의 분석 장비를 필요로 한다한국은 이러한 유전체 해독 장비를 기반으로 고품질 빅데이터를 생산하는 주요 업체가 다수 포진해 있는 국가일 뿐만 아니라다수 업체에서 긴 리드 해독 기법을 활용하기 위한 인프라와 기타 장비를 갖추고 수년간 고품질의 긴 리드 기반 빅데이터를 생산하는 업력을 쌓아온 바 있다또한 이러한 데이터 생산의 대상이 될 수 있는 주요 암 조직 시료를 확보해둔 의학 계열 연구진과 병원이 적지 않다따라서 당장 긴 리드 해독 기법을 적용해 고품질 데이터를 산하는 것이 가능하다이러한 긴 리드 기반 빅데이터는 기존 짧은 리드 해독 기법과는 다른 프로그램과 데이터 처리 과정을 필요로 하나국내에 이러한 긴 리드 해독 기법 관련 분석 전문성을 확보한 연구진도 몇몇 존재한다이러한 전문성을 활용하면 암세포 특이적 RNA를 검출하는 것이 가능할 것이며충분히 짧은 기간 안에 성과를 보는 것도 가능할 것이라 내다본다.

 이러한 암세포 특이적 RNA가 확보된다면이를 기반으로 신항원 후보를 골라내고 검증한 뒤 실제 mRNA 백신 등을 개발하는 단계가 필요할 것이다이러한 신생항원 발굴 및 예측 연구는 국내의 몇몇 연구진이 이미 관련 전문성을 지니고 있으며이러한 신항원을 검증하기 위한 플랫폼도 충분히 구축할 수 있을 것이다이렇게 신생항원 후보가 확보되고 나면 이를 표적으로 하여 효과적으로 체내로 전달하기 위한 전달체 개발이 필요하다이 또한 국내 정부출연연구소에서 관련 전문성을 확보하고 있기에 달성할 수 있는 목표라 생각한다또한 지난 판데믹을 겪으며 구축된 한국생명공학연구원 내 영장류 기반 전임상 플랫폼(국가전임상시험지원센터)이 존재하기에 실제 임상으로 이어질 수 있을 것으로 보이며나아가 국내에 존재하는 다양한 제조업 기반을 활용하면 대량 생산 및 판매도 가능할 것이다.

 물론 현재 이러한 백신의 효율성을 높이기 위한 여러 특허가 대부분(미국 내선도 업체에게 있기 때문에 실제로 효과와 효율성이 높은 백신을 개발하는 데는 다양한 난관이 있을 것으로 예상된다그럼에도 지금 관련 연구 분야를 선점해 각 암종에 대한 온갖 암세포 특이적 RNA와 신생항원 목록을 확보할 수 있다면그리고 그러한 신생항원을 대상으로 하는 백신 개발을 성공시키는 것은 무엇보다 중요한 과제 중 하나라 생각한다이러한 과정 속에서 쌓인 전문성은 단순히 암 백신 개발 성공이라는 성과를 넘어향후 다양한 질환과 질병에 고스란히 적용될 수 있고 대체할 수 없는 국가 자산이 될 것이 확실하기 때문이다지금은 암 백신을 목표로 하지만암세포만 특이적 신생항원을 지니고 있는 것은 아니다예컨대 노화 과정에서 나타나는 노화세포 또한 유전자 조절이 망가지며 노화세포만의 신생항원을 만들어낼 가능성이 있다암 백신 개발에 성공한 경험이 쌓인다면 이러한 노화세포를 제거할 수 있는 노화 백신 개발 등 다양한 질환을 예방할 수 있는 기회 열릴 것으로 내다본다.


4. 결론

 DNA와 RNA 등에 담긴 유전체 정보는 현재 가장 저렴하게 생산하고 손쉽게 처리할 수 있는 생체 데이터 중 하나이다이러한 유전체 해독 기법은 매우 빠른 속도로 발전하고 있으며이러한 생체 데이터를 활용해 질병을 치료하거나 질환을 예방하기 위한 다양한 산업 또한 같이 성장하고 있다향후 단백질을 비롯한 다른 생체 분자의 정보를 손쉽게 해독할 수 있는 기법이 계속해서 개발된다면 더 다양한 층위의 생체 데이터를 쌓는 것이 가능할 것이며이는 유전체 데이터만으로는 부족한 지점까지도 채워줄 수 있을지도 모른다.

 물론이제야 본격적으로 활용 가능해진 긴 리드 기반 유전체 해독 기법만으로도 인류가 접근하기 어려웠던 복잡한 생체 데이터를 수집하는 것이 가능하다이러한 생체 데이터를 암세포를 중심으로 수집해 활용함으로써이미 검증된 mRNA 기반 암 백신 개발을 시도하는 것이 중요할 것이라 내다본다이는 빠른 시일 내에 산업적으로 성장할 수 있는 새로운 분야를 낳을 수 있을 뿐만 아니라이러한 플랫폼을 활용해 계속해서 새로운 질병과 질환에 대한 백신 개발을 시도할 수 있는 길을 열어줄 것이기 때문이다이는 국가 핵심 산업의 기틀을 다질 수 있는 기반이 될 뿐만 아니라인류의 건강과 삶의 질 향상에 기여할 수 있는 기회가 될 수 있을 것으로 내다본다.


 

 

...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용