기술동향
Long non-coding RNAs (lncRNA)에 대한 연구 동향
- 등록일2015-09-15
- 조회수12227
- 분류기술동향
-
자료발간일
2015-09-15
-
출처
생물학연구정보센터(BRIC)
- 원문링크
-
키워드
#RNA#비암호화 RNA#암#ncRNA#lncRNA
- 첨부파일
출처 : 생물학연구정보센터(BRIC)
Long non-coding RNAs (lncRNA)에 대한 연구 동향
한남식 (Gurdon Institute, University of Cambridge)
목차
I. 서론
II. 비암호화 RNA
1. ncRNA의 재발견
2. ncRNA의 종류
길이가 짧은 비암호화 RNA
길이가 긴 비암호화 RNA
Ⅲ. lncRNA 연구 방법
1. 비암호화 전사체의 발견과 검증
2. lncRNA 구조와 기능에 대한 실험
3. 국제적 협동연구
IV lncRNA에 대한 연구 결과
1. lncRNA의 기능과 역할
Cis-acting lncRNA
Trans-acting lncRNA
Competing endogenous RNA
lncRNA-directed chromosome conformation
2. lncRNA와 관련된 질병
Cancer
Alzheimer's disease
Ⅴ. Discussion
VI. Reference
Ⅰ. 서론
부모로부터 물려 받은 DNA에 저장되어 있는 유전정보들이 우리 몸을 구성하고 있는 다양한 종류의 단백질들로 만들어지기 까지는 매우 정교하며 복잡하게 상호연관 되어 작동하는 다양한 생물학적 메커니즘들이 적용된다. 신체를 구성하는 수많은 종류의 단백질들이 적재적소에 공급될 수 있도록 하기 위해서 이다. 예를 들어 A라는 단백질이 폐를 구성하는 허파조직에 지금 당장 만들어 져야 하는데 A가 아닌 다른 종류의 단백질이 만들어 진다든지, 아니면 A와 매우 비슷하지만 돌연변이가 일어난 단백질이 허파조직에 만들어 진다면 어떻게 될 것인가? 우리 신체에 정상이 아닌 비정상 단백질들이 생겨나게 된다면 이것은 곧 질병으로 이어질 가능성을 우리들의 몸 속에 남겨 놓게 된다. 우리 신체를 정상적으로 건강하게 유지하고 발달시킬 수 있는 모든 유전정보가 담겨진 DNA로부터 올바른 시기에 올바른 종류의 단백질이 만들어지기 위해서는 앞서 언급한 복잡하고 정교한 생물학적 매커니즘들이 긴밀하게 상호연관 하여 작동 해야만 한다.
후성유전적 요인들이 이러한 다양한 매커니즘들을 제어하는 중요한 조절인자로 활동한다는 연구결과들이 근래 들어 보고되고 있다. 과다한 음주, 흡연, 스트레스 등은 건강한 사람도 질병에 걸리게 한다는 것은 이미 삼척동자도 아는 내용으로 일반 상식처럼 받아들여 지고 있다. 그런데 이것을 조금 달리 생각해 보자면, 음주나 흡연과 같은 후천적 생활습관이 부모로부터 물려 받은 온전한 DNA가 건강한 정상 발달로 이어지는 매커니즘을 파괴한다는 것을 유추할 수 있는 것이다. 즉, DNA로부터 건강한 신체를 구성해주는 정상 단백질들이 만들어지기 위해서는 우리가 살아가는 환경은 물론 생활 습관과 같은 후천적 환경의 직접적 영향을 받는 후성유전적 요인들이 매우 중요한 역할을 한다는 사실을 근래의 과학적 연구결과들이 보고되기 이전부터 우리들은 이미 잘 알고 있었던 셈이다.
그렇다면 이제 조금 더 과학적인 시각에서 후성유전학과 질병과의 관계를 들여다 보자. 앞서 설명한 바와 같이 후성유전적 요인들은 우리 신체 발달에 있어 중요한 조절자의 역할을 한다. 거꾸로 보자면, 후성유전적 변이들이 생겨난 다는 것은 곧 비정상적 발달을 초래하여 질병의 발생에 원인이 된다는 것이다. 여러 질병들 중에 특히 신경 질환 및 암과의 연관성이 최근 들어 다시 주목 받고 있다. 암 질병을 예로 들자면, 초기에는 DNA 메틸화가 암유전자 발현에 영향을 준다는 발견이 주류를 이루었었다. 이를 바탕으로 DNA메틸화가 암 발병 매커니즘에 주요 역할을 할 것이라는 추측이 다수의 연구그룹들에서 제기되었으며, 이러한 초기 관찰에 근거한 추측들은 최근 들어 진행되고 있는 International Cancer Genome Consortium (ICGC)의 연구 결과들에 의하여 올바른 추측이었음이 입증되고 있다. 다수의 후성유전적 조절자들에서 메틸화에 의한 체세포 돌연변이가 존재한다는 것을 ICGC에서 50여 종류의 암 유전체들의 염기서열을 분석한 결과 발견한 것이다.
이제 우리의 궁금함은 “과연 어떠한 후성유전적 요인들이 DNA로부터 단백질이 만들어지는 과정 중 어느 시점에 오작동 하여 정상 세포가 아닌 암세포를 만들어 내는 것인가?”로 이동한다. 지금 이 순간에도 이 질문에 답을 하기 위하여 수많은 연구자들이 전세계에서 연구에 매진하고 있으나, 안타깝게도 모든 것을 설명해 줄 수 있는 총체적인 답변은 아직 나오지 않고 있다. 그러나, 다양한 후성유전적 현상들에 대한 심도 깊은 연구들이 많이 진행되어 몇몇 종양에 적용이 가능한 신약들이 개발되고 있다.
후성유전적 요인들을 통한 신약개발이 큰 주목을 받고 있는 이유는 종전까지 알려진 유전적 요인들보다 이들이 훨씬 더 동적인 특성을 지니고 있기 때문이다. 이러한 동적인 특성들은 후성유전학 연구들에 큰 어려움을 가져다 주지만, 아이러니 하게도 이들을 제대로 이해하고 이용할 수만 있다면 비정상적으로 생성된 단백질에 직접 작용이 가능한 신약을 개발하여 개선된 치료가 가능하다. 전통적 약물들은 표적 단백질이 아닌 주로 효소에 결합하는 경우가 많았다. 그러나, 후성유전적 요인들이 세포 내부의 환경에 따라 유동적으로 급변하며 특정한 대상에 직접 결합하는 특성을 이용한다면, 특정 분자를 인지하여 직접 결합함으로써 제어할 수 있는 약물 개발이 가능하다는 것이다. 일정한 상태를 유지하지 않고 상황에 따라 동적으로 변화하는 Chromatin remodeling, Histone modification, DNA methylation 등의 대표적 후성유전적 매커니즘들에 대한 집중적인 연구들로 인해 비교적 많은 사실들이 밝혀졌다.
그러나 후성유전적 매커니즘들과 아울러 보다 포괄적 개념인 유전적 매커니즘들은 마치 퍼즐 조각들처럼 각 요인들 별로 나뉘어 연구되어 왔다. 그렇기 때문에 완성된 한 장의 퍼즐처럼 하나의 완전하고 거대한 유전자 발현 매커니즘으로 만들어 내기에는 아직 찾아내야 할 연결고리들이 많이 남아있다. 지금 현재 이 연결고리의 가장 강력한 후보자로 급부상하고 있는 것이 바로 non-coding RNA (비암호화 RNA) 이다. 비암호화 RNA 들은 크게 두 부류로 나뉘어 지는데, 그 기준은 염기서열의 길이이다. 본 보고서에서는 두 분류 중 하나인 길이가 긴 비암호화 RNA에 대하여 살펴보고자 한다.
Ⅱ. 비암호화 RNA
1. ncRNA의 재발견
Human Genome Project가 완료되면서 비암호화 RNA의 존재는 이미 발견되었다. 그렇지만 당시에는 아무도 비암호화 RNA에 관심을 두지 않았다. 심지어 1960년대부터 등장하였던 개념인 쓰레기 DNA (junk DNA) 혹은 암흑 물질 (dark matter)이라고 불리며 연구자들의 관심 밖으로 밀려나고 말았다. 인간 단백질 종류가 10만개에 달한다는 당시의 추론에 근거하여 인간 유전자가 이처럼 많을 것이라는 종전의 예상과는 달리 2만여 개의 유전자들이 인간 유전체에 존재함이 확인된 점이 가장 큰 화두로 떠올랐었다. 그 이후 연구자들은 인간 유전체의 30억개의 염기서열 중 단 1% 정도만이 단백질 생성에 의미 있는 역할을 하는 유전자들이라고 여기고 주로 이 부분에만 집중하여 왔다. 그것이 바로 ENCODE (Encyclopedia of DNA Elements: https://www.encodeproject.org) 프로젝트이다. 바로 이 1%의 기능과 역할을 밝히고자 국제공동연구가 시작되었고, 10년여에 걸친 세기의 연구 끝에 2012년 9월 30여개의 논문을 네이처와 사이언스 등의 학술논문지에 연구결과들을 동시에 발표하였다 [1, 2].
쓰레기 DNA로 여겨지던 비암호화 RNA가 재조명을 받게 된 것은 바로 이때부터 이다. 아무런 기능도 갖지 않는 쓰레기 DNA로 여겨지던 부분들도 biochemical activity를 갖는다는 것이 알려지게 된다. ENCODE 프로젝트를 진행하는 과정에서 유전체 염기서열 분석기법들의 비약적 발전에 힘입어 실제로 전사 (tranion)되는 부분이 유전체의 1%가 아닌 무려 80% 이른다는 사실들이 밝혀지게 된 것이다 [1, 2]. 즉, 유전체의 80%가 어떠한 생물학적 기능을 하기 위하여 의도적으로 전사된다는 것이다. 전혀 아무런 가치가 없다고 여겨지던 비암호화 RNA들이 실제로 전사가 되며, 단지 오류로 인한 불필요한 전사가 아닌 반드시 필요한 이유에서 전사가 된다는 사실이 밝혀지게 된 것이다. 이러한 새로운 사실은 연구자들에게 큰 충격으로 다가옴과 동시에 그 동안 밝혀 낼 수 없었던 후성유전학적 퍼즐들의 연결고리에 대한 새로운 단초들을 제공할 매우 좋은 기회를 열어주었다.
2 ncRNA의 종류
연결고리 후보 0순위인 비암호화 RNA는 크기에 따라 두 부류로 나뉘어 진다. 현재 학계에서는 200 nucleotides가 기준 사용되고 있다 [3-5]. 이 길이를 기준으로 삼은 주요 이유는 현재까지 알려진 길이가 짧은 비암호화 RNA (small non-coding RNA)들이 보통 200 보다 짧은 서열길이를 가지고 있기 때문이다.
길이가 짧은 비암호화 RNA
길이가 짧은 비암호화 RNA들은 다양한 종들간에 염기서열이 비교적 잘 보존되어 있으며, 비교적 짧은 DNA로서 유전체 곳곳을 이동하여 다닐 수 있는 트랜스포존 (transposon) 및 단순히 반복된 DNA 염기서열들로 구성된 반복염기서열 요소 (repeat element)와 매우 밀접한 연관이 있다고 알려지고 있다 [6]. 이렇듯 DNA 염기서열이 진화의 과정 중에서도 잘 보존된 이유와, 그리고 염기서열이 작동 원리의 핵심인 트랜스포존과 반복염기서열요소와 연관성이 깊은 이유는, 짧은 비암호화 RNA들이 어떻게 후성유전적 매커니즘에 작용하는지를 보면 이해할 수 있다. 짧은 비암호화 RNA들은 주로 대상 mRNA (messenger RNA: 유전자가 전사되어 만들어진 단백질을 생성할 수 있는 유전정보를 담은 RNA)의 꼬리 부분 (3’-UTR)에 특이적 염기쌍 결합을 함으로써 단백질로 만들어 져야만 할 mRNA를 파괴시켜 버린다. 즉, 타겟 mRNA의 특정 염기서열에 염기쌍 결합을 하기 위해 비록 아주 짧을 지라도 염기서열이 매우 중요할 수 밖에 없는 것이다. 짧은 비암호화 RNA의 한 부류인 miRNA(microRNA)들 중 특정 집단이 암세포에서 과발현되어 있는 것이 최근 들어 복수의 연구결과들에 의하여 보고되고 있다 [7-9]. miRNA 외에 길이가 짧은 비암호화 RNA들의 종류로는 short interfering RNAs (siRNAs), Piwi-interacting RNAs (piRNAs), 그리고 small nucleolar RNAs (snoRNAs) 등이 있다.
길이가 긴 비암호화 RNA
반면, 길이가 긴 비암호화 RNA (long non-coding RNA; lncRNA)들은 다양한 종들간에 염기서열상 유사성을 찾아보기 어렵다 [3-5]. 이러한 특성은 lncRNA들이 후성유전적 매커니즘들에 보다 다양한 역할을 수행 할 것이란 기대감을 주고 있다. 특히 유전체 상에서 히스톤 변형자들을 조절하여 유전자 발현을 억제하는 현상이 관찰되고 있다. X염색체 불활성화 조절자인 XIST (X-inactive specific tran)의 발견은 lncRNA가 염색체를 유전자 발현 억제 상태로 유지시키는 것을 보여준 첫 사례이다 [10]. 그리고 인간 암세포에서 XIST가 저발현 된 것이 발견되어, XIST라는 lncRNA의 오작동이 곧 X 염색체가 불활성화 되지 못하게 하여 종양 발생을 초래한다는 것이다 [11]. 또 다른 예로는 HOTAIR (HOX tran antisense RNA)가 있다. HOX라는 유전자는 신체발달과 관련된 유전자 집단 중 대표격이다. HOTAIR는 4개의 HOX 유전자 집단 중 HOXC 유전자 집단에서 전사되었지만 심지어 다른 염색체에 위치한 HOXD 유전자 집단을 억제하는 역할을 한다고 발견되어, trans-acting 역할을 하는 첫 긴 비암호화 RNA로 알려지게 되었다 [12]. HOTAIR 역시 암을 발병시키는 기작에 중요한 역할을 하는 것으로 알려져 있다 [13].
Ⅲ. lncRNA 연구 방법
1. 비암호화 전사체의 발견과 검증
유전체 상에서 lncRNA들을 찾아내는 실험기법들이 날로 발전함으로 인하여 연구 초기에 알려진 것 보다 훨씬 많은 lncRNA들이 발견되고 있다. Massively parallel RNA sequencing (RNA-seq)은 이제 기본적으로 사용되는 실험기법이 되었고, 이에 더하여 quantitative reverse-tranion PCR (qRT-PCR)이나 5′ and 3′ rapid amplification of cDNA ends (RACE) 그리고 5′ capture sequencing (cap-analysis gene expression; CAGE)와 같은 실험을 통하여 보다 더 정확하고 세부적인 발견이 가능해 졌다.
lncRNA를 발견한 이후에 반드시 검토되어야 할 점이 단백질 생성 가능성이다. 정의상 lncRNA는 비암호화 RNA에 한 부류이므로 단백질을 생성한다면 lncRNA라고 분류될 수 없기 때문이다. 즉, lncRNA는 염기서열의 길이가 200 이상이면서 mRNA처럼 말단에 Adenine 염기만 중복된 긴 꼬리(polyadenylation)를 갖지만 단백질 합성에 실제로 이용될 가장 중요한 염기서열 부분인 open reading frames(ORF)가 없는 RNA trans라고 정의 된다 [3-5]. 그러므로 ORF의 존재 여부 확인 및 BLASTX 등의 염기서열비교방법을 이용하여 알려진 단백질 생성 가능성이 높은 도메인을 포함하는 지의 여부를 확인한다. 또한 Codon Substitution Frequency (CSF)과 같은 특정한 변이 특성을 찾아주는 실험을 수행하여 진화의 과정 속에서 단백질 생성을 위해 잘 보존된 아미노산 함유도를 분석하는 것 역시 한 방법이다 [14]. 이에 더하여 세포와 조직 내에서 lncRNA가 어디에 존재하는지를 검토함으로써 단백질 생성이 가능한 환경에 있는지 없는지를 확인하는 실험 역시 진행되고 있다.
아직까지 lncRNA의 구조와 기능에 대한 연구는 상대적으로 진행이 미비한 분야이다. 이에 따라 최근 들어 많은 연구자들이 가장 많은 노력을 들이고 있다. 현재 이 분야는 주로 두 가지 요소를 접목시켜 진행되고 있다. 우선 해당 lncRNA와 단백질이나 DNA와의 결합부위 및 특성에 관하여 밝히고, 여기에서 lncRNA의 2차원 구조가 어떻게 결합하는가에 관한 것이다. 이에 관하여 가장 널리 사용되는 실험기법들은 RNA immunoprecipitation sequencing (RIP-seq) 또는 RNA affinity-purification 과 같은 방법들로 capture hybridization analysis of RNA targets (Chart) [15]와, Chromatin Isolation by RNA Purification (ChIRP) [16]과 RNA Antisense Purification (RAP) [17]가 이에 속한다. 다음 절에서 보다 상세히 살펴보고자 한다.
2. lncRNA 구조와 기능에 대한 실험
상당히 많은 수의 lncRNA가 발견되었고 지금도 계속하여 새로운 발견이 이루어 지고 있다. 이에 따라 그들의 기능을 밝혀줄 만한 실험기법들의 개발이 이루어지고 있다. 현재까지 개발되고 연구에 활용되고 있는 실험기법들을 살펴보고자 한다.
그림1. ChIRP sequencing 실험 과정 개요도 [16]. 4단계로 나뉘는 실험의 첫 단계에서는, DNA에 lncRNA가 상보결합을 한 상태에서 RNA 결합단백질이 lncRNA에 결합해 있는 3자 복합체가 cross-link 된 후에 sonication을 통한 용해시킨다. 또한 핵산중합체의 끝자락에 biotin을 결합시켜 lncRNA에 결합시킨다. 두 번째 단계에서는 streptavidin 자석 구슬을 biotin에 결합시킨다. 결합력이 매우 강력하다고 알려진 biotin 과 streptavidin 결합을 이용하는 것이다. 이렇게 biotind에 결합된 streptavidin 자석 구슬을 이용하여 DNA-lncRNA-RNA 결합단백질 3자 복합체만 추출해 낸다. 세 번째 단계에서는 추출한 3자 복합체로부터 이 실험의 3가지 생물학적 대상들을 분리한다. 마지막 단계에서는 각 생물학적 대상들을 각기 다른 분자생물학 실험기법들을 이용하여 실험한다.
최근 들어 개발된 주요 기법들은 lncRNA의 구조 자체에 대한 것은 물론 유전체 상에서 해당 lncRNA가 활동하는 위치 및 생화학적 결합 대상까지 검사하는데 초점이 맞추어져 있다. 즉, 한번의 실험으로 3가지 생물학적 대상을 동시에 추출하는데, 그 대상은 (1) lncRNA 자체 (2) lncRNA가 활동하는 해당 지역 DNA (3) lncRNA가 결합하는 대상 이다 (그림 1) [15-17]. 첫 두 추출물은 곧바로 대용량 시퀀싱이나 qPCR 등의 실험으로, 그리고 세 번째 추출물의 경우는 Western blot이나 질량분석기 (Mass Spectrometry) 실험을 하여 유전체 수준에서 해당 추출물의 변이와 영향 등을 질량적으로 측정할 수 있다.
이러한 lncRNA를 연구하는 주요 기법들로는 앞서 언급한 chromatin isolation by RNA purification (ChIRP) [16]과 capture hybridisation analysis of RNA targets (Chart) [15]와 RNA antisense purification (RAP) [17]이 있다. 세 기법 모두 동일한 결과물을 얻어주지만 실험을 준비하는 단계에서 두 가지 큰 차이점이 있다. 우선 실험에서 연구목표로 삼는 목표 lncRNA에 결합하는 핵산중합체 (oligonucleotide) 설계하는 방식이 다르다. 또한 DNA와 lncRNA와 RNA 결합단백질을 cross-linking하는 방식이 다르다. 첫 번째 차이점의 경우, 핵산중합체는 실험의 주요 대상물인 lncRNA에 결합함으로써 결국 DNA-lncRNA-RNA 결합단백질 3자 복합체를 추출할 수 있게 해준다. 예를 들자면, 낚시를 할 때 물고기를 잡기 위해 사용하는 미끼와도 같은 매우 중요한 역할을 하는 것이다. 그런데 lncRNA가 어떠한 구조를 취하고 있는지에 관하여 사전에 알 수 없기 때문에 어떻게 핵산중합체를 설계해야 대상 lncRNA에 잘 결합할 수 있을지 예측하기 어렵다는 장애물이 있다. 가능하다면 어떤 구조에든 모두 결합 할 수 있는 핵산중합체들을 설계하는 것이 바람직할 것이다. ChIRP은 서열 길이가 20인 핵산중합체를, RAP은 서열 길이가 100인 핵산중합체를 사용한다. Chart의 경우는 핵산중합체와는 다른 Ribonuclease H를 사용한다. 두 번째 차이점인 cross-linking은 DNA-lncRNA-RNA 결합단백질 3자 복합체를 구성하는 세가지 대상물들이 서로 결합을 하도록 하는 것인데, 분자생물학계에서 전통적으로 사용되는 방법들이 여러 가지 있다. ChIRP과 RAP과 Chart 모두 조금씩 다른 cross-linking 방법을 사용하지만 결국 최종 산출물인 3자 복합체를 만들어 낸다는 점은 동일하다. 세가지 실험기법들의 두 가지 차이점은 실험준비 단계에서 사용되는 매우 밀접하며 상호연관성이 높은 실험기법들이다. 즉, 실험준비 단계에서 두 가지 차이점은 있지만, 세가지 실험기법 모두 전반적으로 매우 비슷한 과정을 거치며, 특히 실험의 최종 산출 결과는 매우 유사하다고 하겠다.
한편, 연구의 주요 대상이 되는 특정 lncRNA와 유전체 상의 모든 단백질과의 결합여부만을 판별해 주는 기법 또한 개발되었다. iDRiP (identification of direct RNA-interacting proteins)이라고 불리는 기법이다 [18]. 앞서 설명한 세가지 실험기법들과 실험절차는 유사한 편이다. 우선 특정 lncRNA와 RNA 결합단백질 간에 UV cross-linking를 시키고, 결합된 lncRNA와 RNA 결합단백질을 침전시켜 추출해 낸다. 그렇게 추출해낸 RNA 결합단백질들을 질량분석기를 이용해 추출된 단백질들의 결합 정도를 질량적으로 측정함으로써, 결합 정도가 매우 강하고 신뢰도가 높은 RNA 결합단백질들만 선별해 낸다.
3. 국제적 협동연구
lncRNA 연구에 대한 국제협력 프로젝트들이 이미 시작되어 보다 체계적이고 통일된 데이터베이스를 구축하고자 하는 시도를 하고 있다. 그 첫 단계로 모든 종들의 유전체 발현에 관련된 사항들을 저장하고 있는 GenBank (www.ncbi.nlm.nih.gov/genbank), RNAcentral (www.rnacentral.org)과 같은 창고형 데이터베이스에 발견된 lncRNA 역시 보관한다. 첫 단계가 수집 단계였다면 그 다음 단계에서는 수집된 사항들을 선별하고 분류하고 새로운 의미를 부여하는 것이다. 주로 Ensembl (www.ensembl.org)나 Human and Vertebrate Analysis and Annotation (HAVANA; www.sanger.ac.uk/research/projects/vertebrategenome/ havana) 또는 RefSeq (www.ncbi.nlm.nih.gov/refseq) 등이나 아예 lncRNA만을 취급하는 databases인 lncRNAdb (www.lncrnadb.org)나 NONCODE (www.noncode.org) 또는 LNCipedia (www.lncipedia.org) 등이 이러한 작업을 하고 있다.
여기에 한발 더 나아가 영국 케임브리지대학교 소속 Wellcome Trust Sanger Institute (HAVANA 와 GENCODE도 포함됨)와 미국 국립보건원 소속 National Center for Biotechnology Information (NCBI) 같은 기관들에서는 발견된 lncRNA들의 아이소폼(isoform)이나 일부분만 발현된 경우에도 이를 선별하고 분류할 정도의 수준에 도달하려 하고 있다. 즉 mRNA와 같은 수준의 질 높은 정보를 축적하겠다는 시도를 하고 있는 중이다. 이러한 고품질의 정보는 곧 Encyclopedia of DNA Elements (ENCODE)를 비롯한 전세계에서 lncRNA를 연구하는 연구그룹들에게 매우 유용한 자료가 될 것이다. GENCODE에서는 이미 대용량 시퀀싱과 데이터 통합 기법들을 동원하여 각 컨소시엄이나 기관들에서 새로이 발견하고 선별하여 분류한 lncRNA에 대한 검증을 하고 있다 [19].
Ⅳ. lncRNA에 대한 연구 결과
1. lncRNA의 기능과 역할
새로운 lncRNA를 찾아내고 분류하여 체계적인 데이터베이스를 구축 함과 동시에 이들이 어떠한 기능과 역할을 하는지 또한 밝혀져야 한다. 그러나 기능과 역할에 대하여서는 아직 밝혀져야 할 부분이 더 많다. lncRNA의 가변적 특성뿐만 아니라 유전체 상에서 역방향이라 할지라도 다른 유전자들과 위치를 공유하는 경우가 종종 발견되는 등의 제약점들이 많아 실험을 하는데 큰 장애요소가 되고 있다. 이렇듯 주어진 환경에 따라 다른 역할을 수행할 가능성이 높은 lncRNA들의 기능을 이해하기 위해서는, 앞서 언급한 실험기법들과 함께 해당 lncRNA가 활동하는 세포 내의 위치를 염두해 두어야 한다. 가령, 세포의 핵 안에서 lncRNA가 어떠한 활동을 하는 것이 발견될 경우는 trans-acting이나 cis-acting을 하며 유전자 발현을 경우에 따라 촉진 또는 억제하는 기능을 할 가능성이 높다. 반면, 세포질에서 활동할 경우는 전사 후 과정 (Post-tranional regulation)에서 miRNA가 mRNA의 3’UTR 부위에 상보결합 하여 파괴시키는 것을 방지해 주는 competing endogenous RNA (ceRNA)의 역할을 할 가능성이 크다.
Cis-acting lncRNA
세포의 핵 안에서 lncRNA의 기능은 앞서 설명하였듯 두 가지로 나뉠 수 있다. 우선 cis-acting 방식의 기능을 하는 경우는 대체로 전사과정에 영향을 미칠 대상 유전자로부터 유전체상에서 근접한 곳에 lncRNA가 위치한다. 간혹 원거리에 위치하는 경우도 있으나 대부분의 경우 동일한 염색체에 위치하게 된다. 근거리에 위치하면서 lncRNA의 locus에 히스톤 변형자가 결합하도록 유도하여 결국 대상 유전자의 발현을 촉진 하거나 억제하도록 히스톤 상태를 변형시킨다 [4, 5, 20]. 예로는 유전자량 보정 기작에 주요한 역할을 하는 XIST (X-inactive specific tran)라고 불리는 lncRNA의 경우, DNMT3 (DNA methyltransferase3)와 PRC2 (polycomb repressive complex)와 같은 히스톤 변형자 (histone modifiers)들을 자신의 locus에 결합하도록 유도하여 전사 억제와 DNA가 접근성이 크게 줄어드는 유전체 상태인 이질염색체 형성에 기여한다 [21]. 다른 예로 신체발달에 중요한 역할을 하는 HOXA 유전자의 5’ UTR에 위치한 HOTTIP이라 불리는 lncRNA가 있다. HOTTIP은 HOXA 유전자의 발현을 촉진 시키기 위해 MLL1 복합체를 자신의 locus에 결합시켜 DNA 가 휘어지게 함으로써 원거리에 위치한 유전자 발현 증진자 (Enhancer)를 HOXA 유전자로 이동시킨다 [22].
Trans-acting lncRNA
다른 방식으로는 trans-acting 기능을 하는 경우이다. Cis-acting의 경우와는 달리 대상 유전자의 위치에 크게 구애 받지 않고 매우 먼 거리나 심지어 다른 염색체간에서도 작동하는 것으로 알려져 있다 [4, 5, 20]. 아직까지도 어떻게 이렇게 멀리 떨어져 있는 대상 유전자 위치를 정확히 인지하여 찾아오는지를 비롯하여 다양한 기작들이 베일에 가려져 있다. Trans-acting lncRNA 중 가장 잘 알려진 HOTAIR는 12번 염색체에 위치한 HOXC 유전자로부터 발현되어 2번 염색체에 있는 HOXD 유전자 주변으로 이동하여 와서 억제자의 역할을 한다 [12]. 마우스 모델에서 HOTAIR를 제거할 경우 HOXD 유전자의 발현이 증가됨이 관찰되었다. 한가지 흥미로운 발견은, 마우스 HOXC 유전자의 locus를 전체를 제거할 경우 출산에 임박하여 사망에 이를 정도로 매우 치명적 결과를 가져오지만 골격 발달에는 큰 변화를 일으키지 않는다. 하지만 HOTAIR만을 제거한다든지 HOXC 유전자의 locus 중 일부만 부분적 제거할 경우에는 생존에는 큰 영향을 미치지 않지만 발달 과정에 중대한 결핍 야기시킴을 관찰하였다 [23, 24]. 더 나아가 종양세포들에서 HOTAIR가 과다발현 되어 있는 현상이 보고되었다. 유방암의 경우 HOTAIR가 종양발생을 억제하는 유전자들의 발현을 저해하기 위하여 히스톤 변형자인 PRC2를 유도하는 기작이 밝혀졌다 [13].
Competing endogenous RNA
세포질에서 lncRNAs는 mRNA를 miRNA의 공격으로부터 보호한다. Competing endogenous RNAs (ceRNAs)라고 불리는 lncRNAs의 특이적 기능이 세포질에 존재한다 [25]. miRNA의 공격을 mRNA를 대신하여 ceRNA 받음으로써 표적 mRNAs를 보호하는 방식이다. 서로 다른 mRNA와 lncRNA가 miRNA가 상보결합을 하는 염기서열을 공유함으로써 상호작용 할 수 있음을 보여주는 새로운 기작이다. BACE1-AS (β-site APP-cleaving enzyme 1-antisense)와 TINCR (tissue differentiation-inducing non-protein-coding RNA)라고 불리는 lncRNA들은 표적 mRNAs의 안정성을 향상 시켜준다고 알려져 있다 [26]. 이 BACE1-AS라는 lncRNA는 알츠하이머 질병과도 관련된 것으로 추정되고 있다 (자세한 내용은 질병에 관하여 다룬 “V.2. lncRNA와 관련된 질병” 참고).
lncRNA-directed chromosome conformation
X염색체 상의 유전자들을 발현 억제상태로 유지시키기 위해서 XIST는 cis-acting을 하면서 억제기작 관련 복합체들과 겹합한다고 앞서 설명하였다. 그런데 최근에 XIST가 단지 억제기작 관련 복합체들에만 결합하는 것이 아니고 다른 주요 기능을 하는 단백질들과도 결합한다는 사실이 밝혀졌다. 특히, 유전체가 특정한 구조 (chromosome conformation)를 취하는 과정에서 매우 중요한 역할을 하는 CTCF (CCCTC-binding factor) 단백질에도 결합을 한다는 것이다. CTCF 단백질은 유전체가 특정한 구조를 취하기 위하여 휘어져 두 가닥 이상의 유전체가 맞아야 접합하는 부분의 결합을 지탱시켜주는 역할을 한다고 알려져 있다. 즉, 접착제와 같은 역할을 하는 CTCF 단백질이 없어지면 그 접합이 풀리면서 유전체가 특정한 구조를 취할 수 없게 되는 것이다. XIST가 CTCF 단백질에 결합을 하는 이유가 더 흥미로운데, CTCF 단백질이 유전체에 결합하는 것을 유도하여 유전체가 특정한 구조를 취할 수 있도록 도움을 주는 것이 아니다. 오히려 XIST가 CTCF에 결합을 하면 유전체의 접합을 유지시키던 CTCF와 유전체 사이의 결합이 제거되어 유전체의 구조가 풀려 버리는 것을 발견하였다. 즉, XIST가 유전체 구조를 직접 조절한다는 것이다.
이러한 연구결과는 앞서 언급한 iDRiP이라는 실험기법을 이용하여 XIST와 직접 결합하는 200여개의 단백질들을 검출하고, 이 단백질들을 기능별로 분류한 결과, CTCF 단백질과 같이 유전체 구조를 고정시켜주는 중요한 역할을 하는 단백질 집단을 XIST와 직접 결합하는 200여 개의 단백질들 중에서 발견하면서 밝혀지게 되었다 [18]. 특히, XIST가 정상적으로 발현되어 있는 억제된 상태의 X 염색체의 구조와 XIST를 제거시켜 억제가 풀린 X 염색체의 구조를 Hi-C (high-throughput chromatin conformation capture) 기법으로 각각 실험하여 둘 사이의 구조가 현저히 다르다는 것을 밝혀내었다. XIST에 의해 억제된 상태의 X 염색체는 전체 염색체의 구조가 크게 두 부분으로 나뉘어 있을 정도로 유전체가 거의 접합을 하지 않아 특정한 구조를 취하고 있지 않았다. 그러나 XIST가 제거된 X 염색체의 경우는 CTCF 단백질들이 유전체에 결합하여 많은 접합을 이룸으로써 특정한 구조를 취하고 있었다. 남성 포유류 세포에 존재하는 정상적으로 활성화된 X 염색체와 거의 유사한 유전체 구조를 취하고 있는 것을 발견한 것이다. 이러한 연구결과는 XIST의 억제자로서의 또 다른 역할을 보여준다. 즉, X 염색체가 유전자들을 발현시키기 위해 특정한 구조를 취하려는 것을 방지하기 위해 XIST가 CTCF라는 단백질과 결합하여 CTCF의 기능을 제거시킴으로써 X 염색체가 구조를 취하지 못하게 한다는 것이다. 이 발견은 XIST가 cis-acting을 하여 X 염색체를 억제상태로 유지하는 것에 더하여, 후성유전학적 기작의 여러 층들 중에서 보다 더 위층에서 유전체 구조를 직접 조절함으로써 억제자로서의 또 다른 역할을 한다는 것을 밝혀준 좋은 예이다.
2. lncRNA와 관련된 질병
신체의 정상 발달과 유지의 근간인 DNA로부터 단백질이 생성되는 과정에서 lncRNA가 여러가지 매우 중요한 기작들을 제어하는 역할을 하는 것이 속속 밝혀지고 있다. 유전자 발현과 단백질 생성에서 중요한 역할을 한다는 것은 곧 질병발생에 원인에도 중요한 역할을 한다고 볼 수 있다. 정상적 발달을 위한 정상 단백질들을 생성하지 못한다면 그것이 곧 질병을 발생시키는 주요 원인이 되기 때문이다. lncRNA가 노화는 물론이고 여러 질병에 연관이 되어 있을 것이라는 보고가 지속적으로 보고되고 있으나, 아직까지 각 질병들 별로 어떠한 lncRNA가 무슨 기능을 하는지에 대한 전반적 연구가 진행되지는 못했다. 다만 암이나 신경질환관련 질병에서 lncRNA의 역할에 관하여서는 다른 질병들에 비하여 조금 더 연구가 진행되었다.
Cancer
암 질환 관련하여서는 XIST와 HOTAIR 등의 lncRNA들이 발병에 깊이 관여하고 있다고 앞서 간략히 소개하였다. 발병되는 과정을 조금 더 자세히 설명하자면 다음과 같다. XIST라는 lncRNA는 히스톤 변형자를 제어함과 동시에 유전체가 유전자 발현을 위해 특정한 구조를 취하는 것을 방지함으로써 X염색체를 불활성화 상태로 유지시키는데 (전사의 억제), 혈액암에서는 XIST 자체가 발현되지 않아 X염색체 상의 유전자들이 과다 발현하게 되어 암세포 발생에 영향을 준다 알려져 있다 [10]. 즉, XIST가 저발현 된다면 X 염색체 관련 유전자들이 과발현되게 되는 것이다. 이렇게 되면 유전체 전반에 걸쳐 유전자량 보정 불균형을 초래하여 된다. 이는 곧 혈액생성을 담당하게 될 단백질을 만들어 내는 조혈줄기세포에 결함을 만들어 낸다. 그 결과로 골수섬유증 (골수가 섬유화되어 혈액세포의 정상적인 생산기능에 장애)를 초래하며, 이는 곧 백혈병이나 혈액암 발병의 원인이 된다 [11].
한편, HOX 유전자자 집단의 발현을 조절하는 HOTAIR 역시 히스톤 변형 복합체인 PRC2 (Polycomb Repressive Complex 2)와 KDM1A?coREST?REST (lysine-specific histone demethylase 1A?REST corepressor 1?RE1-silencing tranion factor)에 결합한다 [12, 27]. HOTAIR는 이러한 결합을 통해 H3K27me3 (다양한 히스톤 상태들 중에서 유전자 발현을 억제한다고 알려진 대표적 히스톤 상태 임)를 조절하여 암발생을 억제하는 유전자들 (antioncogenes)의 발현량을 감소시킴으로써 유방암을 발병시킨다 [13]. 즉, HOTAIR가 과발현된 현상은 곧 유방암 발생을 조기에 진단할 수 있는 지표가 될 수 있다. 또한 HOTAIR와 PRC2간의 결합을 조절할 수 있는 약물이 개발된다면 유방암 치료에 큰 발전을 가져올 수 있다. 그러나 이러한 진단과 치료가 이루어 지기 위해서는 HOTAIR가 PRC2를 유도하고 결합하여 H3K27me3를 조절하는 전반적 기작을 매우 정확히 이해하는 것이 선행되어야 한다.
Alzheimer's disease
알츠하이머 질환과 같은 신경질환의 경우에도 lncRNA들이 주요한 역할을 한다고 여겨지고 있다 [26]. 장기 발달 과정에서는 각 세포들마다 특이적 유전자들의 발현 패턴이 중요한데, lncRNA가 이 발현 패턴을 유지시키는데 중요한 역할을 한다고 알려지고 있다. 특히, 중앙신경망 (CNS; central nervous system) 발달은 여러 가지 장기들 중 가장 복잡하고 다각적이다. 중앙신경망에서 신경 생성 (neurogenesis)을 하는데 있어 lncRNA들이 다양한 역할을 하고 있다 [28]. 신경 시스템(nervous system)에서 MALAT1이라는 lncRNA가 상당히 많이 존재하고 있음이 관찰되었다. Malta1은 핵 얼룩 (nuclear speckles)에 위치하면서 시냅스 (synapse) 형성에 관여하는 유전자들을 제어한다 [29]. MALAT1을 제거한 상태에서 해마 신경 (hippocampal neuron)을 배양하면 시냅스 밀도와 수상돌기 (dendrite)의 성장이 감소함이 관찰되었다 [28]. 한편 MALAT1는 폐암 세포에서도 암 전이 유전자 발현을 조절함이 관찰되기도 하였다 [30].
신경 발생에 관여하는 단백질을 생성하는 주요 유전자들을 제어하는 lncRNA들은 서로 다른 뇌 세포와 밀접히 연관 되어 있으며 오히려 mRNA들 보다 더 조직 특이적인 방식으로 발현된다. 또한 뇌 발생 과정 중 특정 시기에 일시적으로 특이한 발현 패턴을 보인다 [31, 32]. 보다 더 흥미로운 사실은, 이렇게 특이적 발현 패턴을 보임과 동시에 뇌에서 높은 발현율을 보이며 전사량이 많은 lncRNA들은 영장류 또는 인간에만 특이적인 lncRNAs라는 사실이 전사체 분석을 통해 발견되었다 [33]. 반면, 조류에서 포유류에 이르기까지 뇌에서 많이 발견되는 lncRNA들은 종간에 잘 보존되어 있으며 전사량 패턴이 유사하다 [34].
한편 줄기세포로부터 신경세포로의 분화를 유도하는 lncRNA들도 관찰되었다 [35]. 이러한 lncRNA들을 제거하면 줄기세포가 성숙한 신경세포로 분화되지 못한다. 세포 핵에 위치하는 LINC01109라고도 알려진 lncRNA-N1과 lncRNA-N3는 SUZ12와 REST라는 단백질들에 결합하여 신경 생성을 촉진한다. 이와 반대로 세포질에 위치하는 MIR100HG라고 알려진 lncRNA-N2는 let-7과 miR-125b의 전구체로 작용하여 증식 억제 및 신경 분화를 촉진시킨다 [36, 37].
이러한 발견들은 lncRNA들이 인간 뇌 및 중주신경계 발달에 매우 중요한 역할을 한다는 것을 보여준다. 그와 함께 뇌 또는 신경계 관련 질병이 발생할 경우, 이러한 lncRNA들이 발병의 원인을 제공할 가능성 역시 높다고 할 수 있다. 그러므로 알츠하이머병과 같은 치매성 질환 역시 lncRNA 연구를 통하여 새로운 치유 방법을 찾을 수 있을 것이다. 세포질에서 활동하는 lncRNA들을 설명하면서 앞에서 이미 소개한 BACE1-AS은 알츠하이머병이 걸린 경우 매우 높은 발현량을 보인다 [26]. BACE1-AS는 BACE1 유전자의 mRNA의 안정성을 증가시켜 결국 β-amyloid이라고 불리는 세포 자극요소들을 양산하게 만든다. 즉, 전사 후 과정에서 lncRNA와 유전자와 세포자극요소들까지 모두 지속적으로 과발현 시키는 선순환 구조로 들어가게 된다 [38]. 이러한 정상수치를 넘는 과발현들에 의하여 알츠하이머병이 발병하게 된다고 알려져 있다.
Ⅴ. Discussion
비암호화 RNA는 다른 후성유전적 요인들에 비해 연구가 가장 미진한 편이다. RNA자체가 상당히 역동적이며 가변적 이어서 DNA 메틸화나 히스톤 변형보다 연구하기 훨씬 어렵기 때문이다. 그러나 반대로 환경에 따라 유동적으로 변화하는 특성이 다양한 후성유전적 기작들의 연결고리로서의 역할을 해줄 것이란 기대감을 주고 있다. 즉 lncRNA들이 DNA 메틸화나 히스톤 변형과 같은 후성유전적 기작들의 조절자의 역할을 할 것이라는 기대와 최근에는 이런 기대가 사실임을 밝혀주는 연구보고들이 줄지어 보고 되고 있다. 가령 CEBPA이라는 유전자의 한 부분에서 발현되는 길이가 긴 비암호화 RNA가 DNA 메틸화를 조절하는 대표 유전자 중 하나인 DNMT1 (DNA methyltransferase 1)을 제어한다는 것이 발견되었다 [39]. 그러므로 lncRNA들은 후성유전적 요인들을 조절하는 제어자들의 제어자인 것이다. 다른 후성유전적 요인들을 오케스트라의 단원들이라 한다면 lncRNA들은 오케스트라를 총괄 지휘하는 지휘자처럼 후성유전체에서 일어나는 모든 현상을 제어할 수 있을 것이란 추측이 힘을 얻어가고 있다.
만일 비정상 세포들의 발생 과정에서 중요한 역할을 하는 비암호화 RNA들에 직접 결합하여 특정한 오작동을 방지시킬 수 있는 약물이 개발된다면 질병 극복이 요원한 것만은 아닐 것이다. 주어진 환경에 따라 매우 역동적으로 변화하는 후성유전적 특성들을 제대로 이해하고 새로운 치료방법을 개발하는데 활용한다면 보다 더 효과적이고 개인별 특성에 맞추어진 치료가 가능해 질 것이다. 또한 lncRNA를 제대로 정확히 제어할 수만 있다면 기존의 약물들처럼 효소를 제어하기 보다는 실제 표적 단백질을 제어할 수 있게 됨으로써 더 효과가 높은 약물 개발이 가능할 것이다. 즉, lncRNA를 이용한다면 효율성 높은 개인맞춤의학이 가능하기에 후성유전학연구(특히 lncRNA)를 통한 신약개발이 많은 관심과 기대를 받고 있다. 특히 비암호화 RNA와 같이 유전적 및 후성유전적 매커니즘들을 총체적으로 연결시켜 줄 연결고리를 찾는데 비약적 발전을 거듭하고 있는 분자생물학적 연구기법들에 생명정보학 분석기법들을 접목시키는 연구들이 최근 들어 많이 진행되고 있다. 이러한 융합연구들을 통해 후성유전체와 비암호화 RNA들을 다각적이고 입체적인 시각에서 연구한다면 머지 않은 미래에 관련 질병들을 보다 효과적으로 진단하고 치유 할 수 있는 길이 열릴 것이다.
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
지식
동향