기술동향
인간의 전사 인자
- 등록일2019-07-29
- 조회수6611
- 분류기술동향
-
자료발간일
2019-07-18
-
출처
생물학연구정보센터(BRIC)
- 원문링크
-
키워드
#transcription factor#염색질
- 첨부파일
인간의 전사 인자
[요약문]
전사인자(TF, transcription factor)는 특정 DNA 서열을 인식하여 염색질(chromatin)과 전사를 제어하고 유전자의 발현을 유도하는 복잡한 시스템을 형성한다. 지금까지 TF가 유전자 발현을 제어하는 방법에 대한 많은 연구에도 불구하고, TF의 정확한 게놈 결합 부위가 어떻게 지정되 고, TF의 결합이 궁극적으로 전사 조절에 어떻게 관련되는지 결정하는 것은 여전히 어려운 일 이다. 본 총설 논문에서는 1,600개 이상의 인간 TF와 그 중 2/3에 대한 결합 모티프를 통해 TF를 식별하고 기능적으로 특징짓는 방법을 살펴본다. 인간 TF의 주요 그룹들은 진화 경로와 발현 패턴이 현저하게 다르며, 이는 별개의 기능성을 나타낸다. TF는 인간 생리학, 질병, 변이 의 다양한 측면의 밑바탕을 이루고 있기에, TF 매개 유전자의 조절을 이해하기 위한 지속적인 노력이 필요하
[목차]
1. 서론
2. TF의 목록
3. TF의 기능
4. TF와 질병
5. 결론
[내용]
1. 서론
TF는 게놈을 직접 해석해 DNA 염기서열을 해독하는 첫 단계를 수행한다. 많은 수가 "마스 터 조절자"와 "유전자 선택자"로 기능하며, 세포 유형과 발달 패턴을 지정하고 면역 반응과 같은 특 정 신호전달경로를 제어한다. 실험실에서 TF를 통해 세포 분화를 조절할 수 있으며, 심지어 역분화 (de-differentiation) 및 전환분화(trans-differentiation)도 가능하다. TF와 TF 결합 부위의 돌연변이는 많은 인간 질병의 근간이 된다. 이들의 단백질 순서, 조절 영역 및 생리적 역할은 동물계에서 깊이 보존되는 경우가 많기에, 총체적인 유전자 조절 네트워크(gene regulatory network, GRN)는 서로 비 슷할 것이다. 그럼에도 불구하고 개별적인 조절 순서는 많은 차이를 나타내며, 오랜 시간 동안 TF는 중복 복제되고 분산된 것으로 보인다. 동일한 TF는 서로 다른 세포 유형에서 서로 다른 유전자를 조 절할 수 있으며, 조절 네트워크가 동일한 생명체 내에서도 동적으로 변화할 수 있는 것임을 나타낸 다. 결합 부위를 인식하고 전사를 제어하는 다양한 방법으로 TF를 조립하는 방법을 결정하는 것은, 그들의 생리적 역할을 이해하고 게놈의 특정한 기능적 특성을 해독하며 복잡한 유기체에서 얼마나 특정한 표현 프로그램이 조절되는지를 매핑하는 데 있어 가장 중요하다.
본 총설 논문은 TF가 개별적으로 그리고 총체적으로 어떻게 작동하는지 생각해 볼 수 있는 맥락을 제공하기 위해 TF와 TF의 총체적 기능에 대한 현재까지 연구 결과들을 검토한다. 우리는 또 한 인간 TF의 목록과 각 TF에 대해 DNA 결합 모티프가 알려져 있는지에 대한 종합적인 평가를 살 펴본다. 우리는 이를 사용하여 인간의 TF 기능, 발현, 진화를 조사하면서 TF 단백질과 TF 결합 부위 내의 변동 효과를 포함하여 인간 질병에서 TF가 수행하는 역할을 강조한다. 약 1,600개의 단백질에 대한 포괄적인 검토는 불가능하나, 대신에 우리는 기존 데이터의 단점과 떠오르는 새로운 기술들을 제안한다.
2. TF의 목록
인간 TF와 유전자 조절 관계에 대한 총체적 분석의 핵심적인 출발점은 신뢰도가 높은 인간 TF와 그에 대해 알려진 단순 지수들이다. 도메인 구조가 TF를 완벽하게 예측하지 못하며, 문헌이 매 우 이질적이며, 전자 주석이 일치하지 않는 등, 이러한 목록의 생성을 자동화할 수 있는 모든 단일 솔루션이 없다. 우리가 알고 있는 바로는 인간 TF에 대한 최근의 포괄적인 총설 논문은 2009년에 Fulton에 의해, 그리고 뒤이어 Vaquerizas에 의해 발표되었다. 연구진은 총 535개의 TF를 식별하여 DNA 결합과 전사 규제 등 TF 활동의 증거를 토대로 인간 TF 목록을 작성했다. 알려진 TF에 대한 선택성 및 전사 참여 가능성에 기반한 신뢰도 수준으로 이를 포함하는 DBD (DNA-binding Domain) 및 단백질에 주석을 달았다. 이 목록은 총 1,391개의 인간 TF를 생성하기 위해 GO (Gene Ontology) 및 TRANSFAC TF 주석과 함께 추가되었다. 최근 몇 년간 이 분야는 시험관 내에서 생성된 수백 개의 모티프를 포함하여 데이터 수집에 있어 상당히 발전했다. 또한 유전자 자체의 주석에도 업데이트가 있었다. 따라서 우리는 인간 TF 수집의 수정 수작업으로 이 검토의 나머지 부분을 구성했다.
앞서 언급한 논문을 토대로 HMM (hidden Markov model) 및 CisBP의 매개변수를 활용한 도메인 검색, TRANSFAC과 연계된 데이터베이스인 TFClass, PDB (Protein Data Bank)에서 추출한 DNA와 복합체를 이루는 단백질들의 좌위(loci)와 결정구조 및 NMR 구조, 그리고 Interpro, GO 등의 데이터 를 집대성하였다. 또한 모든 관련 정보와 외부 데이터베이스에 대한 링크가 포함된 각 단백질에 대 한 웹 페이지를 만들었다. 그런 다음 두 큐레이터를 지정하여 단백질의 상태를 ‘알려진 모티프가 있 는 TF’, ‘상동 단백질에서 추론한 모티프가 있는 TF’, ‘DBD 또는 문헌정보에서 유사한 TF’, ‘ssDNA/RNA 결합 단백질’, 또는 ‘TF의 가능성이 낮은 단백질’로 분류하였다. 또한 각 단백질의 DNA 결합 모드를 모노머(monomer), 헤테로머(heteromer) 호모멀티머(homomultimer) 등으로 분류하였다. 큐레이터들 은 또한 그들의 평가를 뒷받침하는 메모와 인용 출처를 기록할 수 있었다. CisBP 및 기타 출처의 데 이터를 사용하여 단백질-DNA 구조의 가용성과 함께 각 TF에 모티프가 알려져 있는지 여부를 기록 하였다. 하위 집합이 DNA를 결합하는 패밀리 내에서 불충분한 특징의 단백질을 결정하기 위해 글로 벌 서열 정렬과 알려진 DNA 결합 부위를 고려했다. 이 과제를 실현하기 위해 단백질 변형이나 구속 력 있는 파트너와 같은 복잡성을 탐색하거나 기록하지 않았다. 그 이후 연구자들은 서로 간의 의견 불일치 사례를 해결했으며, 두 큐레이터 모두 DBD가 없는 단백질이 TF일 가능성이 있다는 데 동의 한 모든 사례를 수작업으로 검토했다. HumanTFs 웹사이트(http://humantfs.ccbr.utoronto.ca/)는 각 TF 별로 별도의 페이지와 더불어 DBD 유형별로 알려진 모든 모티프, 정보 및 서열 정렬을 표시한다. 이 사이트에는 사용자가 추가 정보를 제출할 수 있는 옵션도 있다.

그림 1. 인간 TF 목록을 집대성하기 위한 탐색 방법
최종적으로 생성된 리스트에는 1,639개의 알려진 인간 TF가 포함되어 있다. 대부분은 두 가 지 DBD 유형인 C2H2-ZF 및 Homeodomain 중 하나만을 포함한다. 나머지의 거의 절반이 추가적으 로 bHLH, bZIP, Forkhead, 핵 호르몬 수용체, HMG/Sox, ETS 6개 중 하나로 분류된다. DNA-서열 특이 성이 결여된 알려진 하위 분류를 고려하면 Myb/SANT 또는 HMG 도메인 TF는 이전에 추정된 것보 다 훨씬 적다. 1,639개의 TF 중 대다수가 DNA를 모노머 또는 호모멀티머로 묶일 것으로 알려져 있 다. 상당수는 동일한 DBD 유형의 사본을 여러 개 포함하고 있지만, 대부분은 DNA를 배열로 묶는 C2H2-ZF이다. 단백질 당 C2H2-ZF의 수는 부분적으로 이펙터 도메인에 따라 상당히 다르다. KRAB를 포함하는 하위 유형에서 많은 수의 C2H2-ZF는 개별 변환 가능한 요소를 대상으로 하는 데 필요한 특수성 때문일 수 있다. 오직 TF의 일부(47개, 약 3%)만이 하나 이상의 DBD 유형을 포함하고 있으 며, POU:Homeodomain이 가장 널리 사용되고 있다. 대부분의 인간 TF는 또한 추가적인 단백질 영역 을 가지고 있다. 총 391개의 다른 유형의 비 DNA 결합 도메인이 표시되며, TF 이펙터 기능의 다양 하고 광범위한 네트워크 개념과 일치한다.
이 조사는 기존 목록에 포함되지 않은 348개의 TF를 포함한다. 눈에 띄는 새 TF로는 C2H2-ZF 134개, bHLH 22개, AT-hook 14개, Homeodomain 13개가 있으며, 최근에 기술된 THAP 핑거 단백질이 있다. 이전 목록의 개별 단백질은 거의 완전히 재확인된다. 출판되었던 1,391개 단백질 중 1,292개 단백질(93%)도 현재 목록에 있었고, 50개는 유전자 주석의 변화로 통합되었고, 49개는 위의 지침을 사용하여 제거되었다. 마찬가지로 Fulton의 연구진에 의해 수동 큐레이션으로 식별된 TF의 98%는 본 연구에서 TF로 간주된다.
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.