기술동향
차세대 단백질체학: 통합적 관점에서 본 단백질체의 역동성
- 등록일2015-12-17
- 조회수11640
- 분류기술동향
-
자료발간일
2015-12-15
-
출처
생물학연구정보센터(BRIC)
- 원문링크
-
키워드
#차세대 단백질체학#단백질체#단백질 수식#질량분석#단백질 번역
- 첨부파일
출처 : 생물학연구정보센터(BRIC)
차세대 단백질체학: 통합적 관점에서 본 단백질체의 역동성
저자 : 오석준 (인제대학교)
본 자료는 Next-generation proteomics: towards an integrative view of proteome dynamics. Nature Rev. Genet. 2013; 14: 35-48 의 논문을 한글로 번역, 요약한 자료입니다.
목차
1. 머릿말
2. 질량 분석 기반의 단백질체학
3. 단백질체의 발현 양상
4. 단백질로의 번역 후 조절의 분석
5. 단백질 상호작용과 망 생물학
6. 임상적 응용
7. 정리 및 전망
1. 머리말
세포는 다양한 성격의 분자들이 매우 복잡하게 서로 연동되는 거대한 복합체이다. 따라서, 세포 내에서 중요한 역할을 하는 단백질의 총합인 단백질체에 대한 분석은 자기 복제와 외부 자극에 대한 섭동 등 생물체의 다양한 반응과 행동을 이해함에 있어 기본이 되는 각 수준에서의 기능을 파악하는 큰 의의를 갖는다.
후성유전체 표식, 선택적 이어맞추기 (alternative splicing), 마이크로 RNA (microRNA, miR-NA)를 비롯한 비번역 (non-coding) RNA, 단백질 간 상호작용 (protein-protein interaction, PPI), 번역 후 수식 (post-translational modification, PTM) 등의 현상은 유전체의 정보를 단 하나의 유전형과 표현형으로 단정지을 수 없다는 것을 보여 준다. 따라서, 어떤 시스템에서 단백질체 수준의 정보를 수집하고 연구하는 것은 유전체, 전사체 수준에 비해 좀더 도전적이라고 할 수 있겠다. 단백질체 연구는 단백질의 구성 단위인 아미노산의 매우 다양한 물리화학적 특성으로 인해 더욱 힘든 연구가 된다. 게다가 단백질의 생성부터 소멸까지는 위에서 열거한 수많은 역동적인 현상들이 지속적으로 일어난다.
최근 들어, 질량 분석 기반의 단백질체학은 기기 개발과 시료 처리 및 전산학적 분석 방법의 결합을 통한 발전을 계속하여 이제 성숙 단계에 이르고 있다. 10년 전만 해도 질량 분석 기반의 인산화 단백질체 분석을 통해 수백 자리의 인산화를 확인할 수 있었지만, 지금은 3만 개 이상의 인산화를 관찰할 수 있다. 이에 따라 2013년 현재에는 이처럼 거의 완전한 단백질체 분석이 이루어지고 있으며, 이를 반영하여 현재의 단백질체 관련 기술을 '차세대 단백질체학 (next-generation proteomics)'이라고 한다.
이 리뷰에서는 이러한 차세대 단백질체학을 가능하게 한 최근의 해결책, 돌파구, 전략 등을 알아 보고, 질량 분석 기반의 단백질체학을 중심으로 하여 최근 발전된 응용과 이에 따른 생물학적 이해를 도모하고자 한다. 여기에는 질량 분석 방법뿐만 아니라 시료 처리 (예를 들면, 펩티드 분리와 증폭)도 포함된다. 또한, 유전체와 전사체 수준에서의 정량적 발현 단백질체학 (quantitative expression proteomics) 및 번역 후 수식, 단백질 상호작용과 신호망 (signaling network) 등을 훑어 보고, 이들과 외부 자극 간의 섭동에 대해서도 알아 보면서, 이렇게 다양한 분야의 자료들로부터 적절한 정보를 추출할 수 있는 전산학적 도구의 필요성과 함께 이러한 기술 발전의 임상적 응용과 미래에의 전망도 함께 알아 보자 (그림1).
2. 질량 분석 기반의 단백질체학
2.1. 단백질 질량 분석의 중요성과 다양성
일반적으로 단백질체 실험은 세포나 조직, 또는 체액으로부터의 시료 용해와 단백질 추출로부터 출발한다. 이후, 실험의 목적에 따라서 이온 교환 (ion-ex) 크로마토그래피 (chromatography, 색층 분석) 등의 다양한 방법을 통한 사전 분획 또는 친화성 수지 (affinity resin)나 특정 항체 등을 이용한 특정 영역의 펩티드 분리를 진행하게 된다. 이들은 계속해서 직렬 질량 분석 (tandem mass spectrometry, MS/MS)을 적용한 역상 액상 크로마토그래피 (reversed-phase liquid chromatography coupled to mass spectrometry, RPLC-MS)를 거친 후, 분리된 펩티드 서열 확인을 위한 데이터베이스를 검색하고, 그 결과로 나온 펩티드를 종합하여 임의의 (random, 무작위) 단백질과의 위양성률 (false positive rate) 비교를 통한 통계적 타당성을 검증한 후, 최종적으로 그 단백질을 특정한다. 이 과정에서 주로 사용되는 질량 분석 기반 (mass-spectrometry-based)의 단백질체 관련 데이터베이스 검색 도구를 표 1에 소개하였다.
2.2. 비표지 단백질 정량
단백질을 정량하는 방법으로 대중적인 것은 비표지 (label-free) 정량법과 안정 동위 원소 표지법 (stable isotope labelling)이 있다. 분광 계산 (spectral counting)이나 신호 세기 (signal intensity)를 이용한 비표지 정량법은 단백질의 양에 관한 정확한 정보를 얻기 위해, 복잡한 절차를 최소화하여 채택할 수 있는 방법이다. 다만, 단백질의 절대 수치 (absolute number)를 결정하기 위한 실험에 있어서는 초기 단백질 분해 효소 (protease)의 선택과 사용에 유의해야 한다1 .
선택 반응 분석 (ed reaction monitoring, SRM)은 목표로 하는 특정 단백질 정량을 위한 새로운 전략적 방법이며 [4], 단백질 발현 변화 양상을 검증하는 데 유용하다. 선택 반응 분석 방법은 펩티드의 질량-대-전하 (mass-to-charge, m/z) 비율과 다중 진단용 펩티드 조각 이온 (multiple diagnostic peptide fragment ion)과의 독특한 조합을 통하여 높은 특이성을 얻는 방식이기 때문에, 전 실험 절차에 걸쳐서 이러한 방법론과 시료의 특성에 대한 상세한 사전 정보와 지식이 요구되므로, 기존의 고전적인 비표지 단백질 정량 방법들보다는 노력이 많이 든다는 점을 유의해야 한다. 최근에는 또다른 방법으로 의사 선택 반응 분석 (pseudo-SRM) 방법이 보고되었는데, 이는 모든 이온을 조각내거나 (Sequential Window Acquisition of all THeoretical fragment-ion spectra, SWATH) [5,6], 용출되는 펩티드를 즉석에서 예측하는 방식 [7]으로 문제의 복잡성을 해결하고자 새로운 시도를 제시한 것들이다.
2.3. 표지 기반 (label-based) 단백질 정량
시료를 취급하는 동안에 발생하는 정량적 오류는, 안정 동위 원소를 시료에 포함시켜 출력 스펙트럼에서 질량 차이에 의해 구분될 수 있는 펩티드 동위 원소 이성질체 (peptide isotopomer)를 만들어 분석함으로써 최소화할 수 있다. 최근 들어서는 분석 대상 생물체에 대하여 안정 동위 원소를 이용하는 신진대사 표지 (metabolic labelling)와 관련된 여러 방법들이 개발되고 있다. 이러한 대사 물질 표지에 있어서의 문제점은, 내부 표준으로서 동위 원소로 표지된 시료가 배양 세포로부터 확보된다 해도, 분석 대상인 일차 세포나 인체 조직 시료의 배양과 표지가 쉽지 않다는 것이다.
단백질 정량은, 직렬 질량 분석 (MS/MS) 정보 제공 이온 (reporter ion)에 기반한 정량을 사용하는 동중핵 화학 표지 (isobaric chemical label)2의 경우가 아니라면, 보통은 질량 분석 단계에서 이루어진다. 질량 분석 수준에서 비용 대비 효율이 높은 방법으로 디메틸 표지법 (dimethyl labelling)이 있는데, 이는 1차 세포 배양으로부터 조직에 이르기까지 대부분의 시료에 대하여 매우 능률적이고 대단히 정확한 결과를 얻게 해 준다. 직렬 질량 분석 (MS/MS) 단계의 정량은 8중 분석 (octoplex)까지 동시 분석이 가능하여 다중 섭동 (multiple perturbation)에 대한 분석을 가능하게 해 준다. 그렇지만 동중핵 표지법과 관련하여 아직 해결되지 않은 사안은 동일 질량의 두 가지 이상의 펩티드가 함께 분리되는 경우인데, 이렇게 되면 정량 결과를 변형시키게 될 수도 있다. 이런 문제점은 추가 비용이 들긴 하지만 두 가지 단백질체를 사용하거나, 기상 분리 (gas-phase isolation)를 적용하는 등의 2중 분리법 (double-isolation event)으로 극복할 수 있다.
이처럼, 지난 몇십 년 간의 단백질체 연구 개발에 있어서 어느 하나의 뛰어난 방법이 큰 혁신을 만들었다기 보다는 전반적으로 넓은 분야에 있어서 다양한 방식의 진전이 모여 현재의 발전을 이루었다고 보는 것이 타당하다. 따라서, 하나의 이상적인 작업 절차는 있을 수 없으며, 실제로 방법론의 대부분은 채택되는 실험과 풀어야 할 문제에 의해 결정된다. 질량 분석을 포함한 단백질체 연구의 전체적인 작업의 흐름을 그림2에 나타내었다.
3. 단백질체의 발현 양상
단백질체학의 가장 기본적인 목표는, 어떤 생물학적 시스템 내에서의 단백질 전체 집합을 규정하고, 이들이 일정 시공간에서 생성하는 질적ㆍ양적 궤적을 파악하는 것이다.
3.1. 단백질 목록의 특징 분석
채 몇 년 되지 않은 2008년에만 해도 효모의 대규모 시료를 다룰 경우, 단백질군을 미리 분류한 후 질량 분석 자료를 얻기까지 수 일이 걸렸으나, 4년 후인 2012년에는 거의 같은 수준의 결과를 얻기 위해서 단백질체의 사전 분류 없이 4 시간이면 가능하게 되었다. 이것은 거의 100 배에 달하는 처리량의 증가이다.
고속 대량의 RNA 서열 결정법 (RNA-seq)의 눈부신 발전에도 불구하고 인간 세포 내에서 단백질을 만드는 유전자의 숫자는 아직 정확하게 밝혀지지 않았다 [9-11]3.
현재 질량 분석 기반의 기술로 분석할 수 있는, 배양된 인간 세포 내에서 발현되는 단백질의 수는 약 11,000 개까지 가능한데, 이 숫자는 기술이 소화할 수 있는 최대치에는 아직 미치지는 못하는 것으로서, 이로부터 예상해 보건대 조직 특이적, 세포 특이적, 그리고 발생 단계 특이적 단백질체 등 전체 단백질체의 일괄 분석도 가능하다고 볼 수 있다. 최근의 이러한 움직임은 유전자의 재주석 (再註釋, re-annotation)에 유전체 정보와 단백질체 정보를 함께 사용하는 단백 유전체학 (proteogenomics)으로 이어지고 있다. 차세대 서열 분석으로부터 생산되는 RNA 전사체와 단백질체의 비교 분석을 통하여 위유전자 (僞遺傳子, pseudogene)를 가려내고, 새로운 이어맞추기 변종 (new splice variant)을 찾아내며, 심지어 새로운 유전자를 발견하는 흥미로운 결과로 이어질 수도 있다. 다만, 이 경우에는 대량의 자료를 다루는 과정에서 발생할 수 있는 위양성 결과 (僞陽性 結果, false-positive result)의 배제라는 중요한 문제를 해결해야 하는 것이 관건이 된다.
또한, RNA 편집 (RNA editing)도 간과할 수 없는 부분으로서, 염기 서열 결정 시의 오류나 인공적인 부산물로 간주하기보다는 단백 유전체학을 통하여 DNA와 RNA 서열 간의 차이를 단백질 수준에서 밝혀야 할 경우라고 보는 것이 타당할 것이다.
3.2. 단백질 발현 양상의 비교 분석
시스템 전체에 대한 유전자의 차등 발현 (differential gene expression) 분석은 많은 생물학적, 병리학적 과정에 있어서 분자 수준의 원인을 파악하는 강력한 접근 방법이다. 전사체학에서 시료 간의 각 유전자의 전령 RNA 양을 비교하는 것과 같이 단백질체학에서도 단백질의 상대적 정량을 정밀하게 수행할 수 있다.
최근에는 체세포로부터 배아와 유사한 상태의 유도 만능 줄기 세포 (induced pluripotent stem cells, iPSCs)가 재프로그램 (reprogram)될 수 있다는 사실이 발견되면서 재생 의학 (regenerative medicine) 분야가 새로운 돌파구를 찾았다. 그러나 이러한 유도 만능 줄기 세포는 치료 용도의 잠재적 가능성을 확인하기 위해서 임상에 적용하기 전에 이에 대응되는 배아 줄기 세포 (embryonic stem cell, ESC)와 분자 수준의 비교 분석이 반드시 필요하다. 전사체학을 통하여 유도 만능 줄기 세포의 유전자 발현 양상이 그에 대응하는 배아 줄기 세포와는 상이한 특이성을 보이는 것으로 알려졌는데, 이것은 또한 서로 다른 유도 만능 줄기 세포 간의 차이라기 보다는 각 실험실 간의 기내 (in vitro) 배양 조건으로부터 기인한 것으로 파악되고 있다. 따라서 세포주 간의 단백질 발현 양상의 비교는 전령 RNA (messenger RNA)와 이에 해당하는 단백질 간의 수준에는 상관 관계가 크지 않다고 알려진 상황에서 [12,13]4, 새로운 관점을 제공해 준다.
3.3. 발현 단백질의 절대적 정량
두 가지 이상의 상태에 대하여 단백질 수준의 변화라는 것은 상대적 정량을 의미하며 일반적으로 비율의 형태로 표현된다. 최근의 질량 분석 및 생물정보학의 발전으로 세포당 단백질 복제 개수를 세는 수준으로 단백질의 절대 정량 (absolute quantification)이 가능하게 되었다.
핵산이나 아미노산의 펄스 표지 (pulse label)5를 통하여 전령RNA와 단백질의 변화량과 발현량을 측정할 수 있게 되었다 [15]. 지금까지 알려진 바로는 단백질의 발현량은 주로 번역 수준에서 조절된다고 볼 수 있다6.
이처럼 전사와 번역 단계에서 일어나는 현상을 정확하게 확인하기 위해서는 이 두 단계 모두에 관한 전반적인 분석이 필요하다. 이럴 경우에 적용해 볼 수 있는 방법이 시료의 내부 표준과 선택 반응 분석 (SRM)을 결합한 분석이며, 비록 단백질의 분해 과정이나 단백질 분해 효소 등으로부터 야기될 수 있는 오류 가능성이 있음에도 불구하고 이를 통하여 단백질 복제 개수를 확인함으로써 유전자 발현 조절 기작에 있어서의 좀더 중요한 통찰과 이해에 접근할 수 있다.
3.4. 단백질 발현의 시공간적 변화 분석
비록 어느 한 시점의 단백질체가 유용한 정보를 제공하기는 하지만, 결국은 정상 상태 (steady-state) 조건에서의 교란에 역동적으로 반응하는 단백질체의 동적 정보를 통하여 세포와 조직 등 전체 시스템의 잠재적인 운명을 파악할 수 있다. 예를 들면, 배아 줄기 세포의 분화에 대한 다학제적 연구를 통해 세포 분화와 관련된 수백 가지 단백질의 발현 수준을 파악하면, 이로부터 해당 세포의 잠재적인 미래의 방향을 예상하는 데 필요한 지식을 개선할 수 있다. 이렇게 하기 위해서는 시간축뿐만 아니라, 해당 시점에서 각 단백질의 부위 별 분포에 대한 정보 또한 필수적이다. 이럴 때에는 세포 내 분획을 통해 단백질의 공간 분포를 얻을 수 있다. 물론 좀더 개선된 해상도로 단세포 분석을 할 수 있는 영상 기법도 있지만, 추가로 질량 분석법의 검색 모드 (discovery mode)를 이용하여 세포 내 소기관에 존재하는 새로운 단백질을 동정하는 것이 필요하다: 새로운 중심체 관련 단백질의 발견이 그 예가 될 수 있다. 이상적으로는 이 모든 접근법을 종합적으로 적용할 때, 변화하는 단백질체의 모습을 좀더 선명하게 얻게 해 주고 이들 단백질들이 외부의 자극에 어떤 방식으로 반응하는 지 알 수 있게 될 것이다.
4. 단백질 번역 후의 조절 분석
단백질의 번역 후 수식 (post-translational modification, PTM)은 작은 화학 작용기나 지질 또는 작은 단백질 등이 가역적 공유 결합으로 해당 단백질을 변경하고 이를 통하여 단백질의 활력을 조절하는 주요 현상이다. 또한 단백질은 단백질 분해 효소에 의해 절단되기도 하며 구성 아미노산의 화학적 성질이 변하기도 한다. 인체 내에서 발현되는 단백질의 숫자와 번역 후 수식의 종류 그리고 이들의 다각적인 변화 및 화학량론 (stoichiometry)을 고려해 볼 때, 이러한 단백질 번역 후 수식의 위치와 종류를 특정하는 것은 상당히 도전적인 일이다. 단백질의 기능과 역할을 연구함에 있어서 이러한 종류의 변화를 파악하는 것은 매우 중요한 일이며 질량 분석 방법의 발전이 이 분야에서 기여한 바가 대단히 크다. 특히 전자 전달 분해법 (electron transfer dissociation, ETD)은 불안정한 번역 후 수식을 단백질의 펩티드에 그대로 두고 동정할 수 있게 함으로써 많은 발전이 가능하게 하였다. 질량 분석은 전체 시스템에 대하여 단백질의 번역 후 수식을 연구하는 데 가장 강력한 도구이다.
4.1. 인산화 단백질체학
단백질 인산화의 결과는 거의 모든 생물학적 과정에 개입하는 관계로 그 특성이 잘 알려져 있다. 고정화 금속 이온 친화성 크로마토그래피 (Immobilized Metal ion Affinity Chromatography, IMAC), 이산화티타늄 (TiO2) 크로마토그래피, 인산화티로신 면역침전법 (phosphotyrosine immuno-precipitation) 등의 인산화된 펩티드나 단백질을 농축하는 방법들이 개발되어, 다른 종류의 조직, 질병의 상태, 세포주의 종류 등 다양한 분야의 연구에 사용되고 있다. 통상적으로 인산화 단백질의 농축법은 산성 펩티드에 치우쳐 있었으나, 찾기 어려운 염기성 인산화 펩티드에 대응하는 Ti4+-IMAC 기반의 농축법이나 특정 호염기 인산화효소 (basophilic kinase)의 목표 서열에 대한 면역 침전법을 이용한 인산화 펩티드 농축법도 개발되었다.
2003년에는 질량 분석 기반의 방법으로 단백질의 인산화 부위를 300 개까지 확인할 수 있었고 이것도 당시로서는 획기적인 일이었으나, 지금은 수천 개를 고정밀도로 동정할 수 있다. 이러한 질적 정보의 발전은 여러 데이터베이스를 통하여 확장되어 왔으며, 현재는 한 단백질체의 반 가량이 500,000 개 가까이되는 인산화에 의해 조절된다고 예측하고 있다. 그렇다면 이처럼 많은 수의 단백질 인산화 부위가 모두 기능을 발휘하는가 하는 의문이 든다. 이와 관련해서는 효모를 이용한 실험에서 단백질의 인산화 지점이 그 기능에 있어서 불리하지 않다면 계속 보존되는 것으로 나타났다. 앞으로 세포 기능의 기본적 유지에 필요한 단백질 인산화는 반감기가 길고, 상황에 따라 신속한 조절이 필요한 경우에는 인산화가 상당히 적극적으로 조절될 수 있도록 인산화 효소와 탈인산 효소가 짝을 이루어 (kinase-phosphatase pair) 작동하는 것을 확실히 밝혀야 할 것이다. 이같은 발전에도 불구하고 전 시스템에 대한 분석이 아직 완전하지 않은데, 이는 하나의 단백질에서 일어나는 다중 수식 (multiple PTM)을 감당할 수 있는 적절한 분석 소프트웨어가 아직 없는 실정이기 때문이다.
생체 내의 신호 전달 체계를 이해하려면, 특정 세포 내 소기관뿐만 아니라 전체적인 인산화 현상의 일시적인 특성을 파악하기 위해 정량적인 인산화 단백질체학 (quantitative phosphoprote-omics)이 수행되어야 한다. 이때, 유전자 발현 시기와 그에 의한 단백질 인산화 시점의 세밀한 비교 분석이 매우 중요하며, 이것은 단백질 인산화 및 탈인산 현상에 관여하는 효소들의 작용 기전에 대한 이해와 함께 이루어져야 한다. 끝으로, 인산화 특이적 항체를 이용한 부위 예측 검사가 이루어 진다면, 인산화 관련 효소의 구획화에 따른 비대칭 인산화 현상과 같은 문제를 세포 수준보다 더 정밀한 해상도로 풀어 낼 수 있을 것이다.
4.2. 기타 단백질 번역 후 수식 (other PTMs)
질량 분석법을 통하여 단백질의 인산화가 함축하는 다양한 영향을 조사하는 것처럼 다른 수식 (modification) 역시 미흡하기는 하지만 측정할 수 있게 되었고, 이것은 생물학적으로 새로운 개념을 의미하는 것이다. 예컨대, 펩티드 중심의 (peptide-centric) 면역 침전법을 통하여 리신 아세틸화 (lysine acetylation) 및 유비퀴틴화 (ubiquitylation)에 대한 실험이 더욱 발전하게 되었다. 비록 히스톤의 리신 아세틸화가 유전자를 조절하는 기작으로 많이 알려져 있으나, 히스톤이 아닌 다른 수천 개의 단백질에도 작용하는 것이 밝혀지면서 염색질 (chromatin)의 상태 조절이 리신 아세틸화의 모든 것은 아니라고 생각하게 되었다. 또한, 단백질의 유비퀴틴화 (ubiquitination)와 수모화 (sumoylation)의 경우에는 친화 꼬리표 (affinity tag)를 유비퀴틴이나 수모 잔기 (Small Ubiquitin-like MOdifier, SUMO)에 결합시키는 방식을 사용하기도 한다. 이렇게 만들어진 구성물을 세포 내로 주입 (transfect)하면, 이들이 목표 단백질과 결합하여 공면역 침전 (co-immunoprecipitation) 등의 방법으로 분리할 수 있게 된다.
당화 (glycosylation)는 또 다른 보편적 번역 후 수식 현상인데, 그 종류가 매우 다양하고 불안정한 특성으로 인해 다루기가 상당히 까다롭다. 당화에는 크게 두가지가 있는데, 그것은N-연결 (아스파라긴 결합)과 O-연결 (세린과 트레오닌 결합)이다.
N-연결 당화 (N-linked glycosylation)는 렉틴 친화 기반 컬럼 (lectin-affinity-based column)이나 친수성 상호작용 액체 크로마토그래피 (hydrophilic interaction liquid chromatography, HILIC)를 이용한 펩티드 및 단백질의 농축이 가능하게 하였다. 예를 들면, 세포막 단백질에 존재하는 N-연결 당화의 연구를 위해 여과기 보조 시료 조제법 (filter-aided sample preparation, FASP)을 적용한 렉틴 친화 크로마토그래피와 같은 훌륭한 조합으로 이루어진 방법이 개발되었다. 이러한 방법들을 활용하여 N-당화와 유비퀴틴화된 수천 개의 부위를 식별함과 동시에 이와 관련된 기능들도 좀더 잘 이해할 수 있게 되었다.
하나의 단백질에 서로 다른 수식이 공존한다는 것은 번역 후 수식에 있어서 혼선이 존재할 수 있다는 것을 의미한다. 예컨데, 유전자 발현을 조절하는 단백질 SMAD7 (MADH7으로도 알려져 있다)은 이들 리신 잔기가 이렇게 아세틸화 되면 이 부위의 유비퀴틴화를 방해하여 SMAD7의 분해를 막는다. 또 다른 예로, 전분화능 (pluripotency) 관련 전사 인자인 SOX2는 3 개의 세린이 인산화되는데, 이것이 수모화를 유도해서 이 전사 인자의 DNA 결합 특성을 손상시킨다. 이러한 혼선은, 순차적이면서도 서로 배타적이거나 적대적인 기전에 의해 단백질의 기능이 조절되는 것으로 보이는, 번역 후 수식 간의 복잡한 통신이라는 결과로 나타난다. 이와 같은 연구의 결과로, 현재는 아세틸화와 인산화뿐만 아니라 O-연결 N-아세틸 글루코사민 (GlcNAc)과 인산화의 조합을 포함한 여러 가지 단백질 번역 후 수식에 대한 동시 분석이 이루어지고 있다.
관련 데이터의 기하급수적 증가로 인해 밝혀지고 있는 번역 후 수식이 갖고 있는 고도의 복잡성은, 여러 가지 수식에 대해 기존에 예상했던 것보다 몇 차원 높은 복잡성을 보여 준다; 그리하여 이 복잡성이 우리로 하여금 신호망에 대한 고전적인 선형적 관점을 훨씬 복잡하면서도 다각적인 조절망의 관점으로 바꾸게 하고 있다.
5. 단백질 상호작용과 망 생물학
단백질체의 동적 특성을 제대로 이해하기 위해서는 단백질 간의 물리적인 상호작용에 대하여 큰 그림을 그리는 것이 필요하다. 인간 단백질의 상호작용체 (interactome)에 대하여 대략 13만 가량의 이진 상호작용 (binary interaction)을 예상한 보고가 있으며, 생분자 간의 상호작용은 단백질 간에서만이 아니라 단백질과 리보핵산, 단백질과 대사 물질 간에도 이루어지기 때문에 복잡할 수 밖에 없다. 이런 관계에서 생성되는 복합체는 조절 과정이나 신호 전달 체계 그리고 세포의 기능에 필연적으로 작용하게 되며, 이런 결합 능력이 소실될 경우에는 관련 기능의 상실로 이어지게 된다.
5.1. 친화 정제-질량 분석법을 이용한 단백질 간 상호작용 특성 분석
효모 단백질 잡종법 (yeast two-hybrid, Y2H)으로 시작된 단백질 상호작용 분석은 최근 들어 관심 대상 단백질 (미끼, bait)에 대한 상호작용 단백질 (먹이, prey)의 친화 정제법 (affinity purifica-tion, AP)인 친화 정제-질량 분석법 (affinity purification-mass spectrometry, AP-MS)을 채택ㆍ보완하면서 더욱 발전되고 있다. 또한, 고속 대량 효모 단백질 잡종법이 개발되면서, 고전적인 효모 단백질 잡종법이 지닌 문제점인 높은 위양성률 (false positiveness) 논란을 극복하기 위하여, 서로 다른 효모 단백질 잡종법을 적용하는 등의 상호작용 데이터의 신뢰도를 높이는 노력을 계속함으로써 문제를 해결하고자 힘쓰고 있다. 상호작용체에 있어서, 효모 단백질 잡종법으로 얻을 수 있는 믿을 만한 상호작용과 친화 정제-질량 분석법을 통해 얻을 수 있는 상호작용 영역이 다르므로 이들을 이용하여 세포의 단백질 간 상호작용망에 대한 직교 정보 (orthogonal information, 교차 정보)를 구할 수 있다. 최근의 보고에 의하면, 효모와 초파리 등 여러 생물 종에 있어서 탈유비퀴틴화 효소, 인산화 관련 효소 그리고 자식 작용 (自食 作用, autophagy) 등의 여러 생물학적 과정에서의 단백질 간 상호작용에 관한 전체적인 구도를 친화 정제-질량 분석법을 통하여 확인할 수 있다. 한 연구에 따르면, 친화 정제-질량 분석법을 이용하여 인간의 숙주 단백질 및 복합체와 상호작용하는 총 18 개 HIV-1 (human immunodeficiency virus-1, 인체 면역결핍 바이러스 1) 단백질들의 장호 작용 지도를 그릴 수 있었다. 또한 계속된 연구를 통하여 HIV-1의 감염력 유지에 필요한 HIV-숙주 간의 새로운 단백질 간 상호작용을 찾아내었다.
친화 정제-질량 분석법에 있어서 ‘미끼’와 이에 동반되는 ‘먹이’ 단백질이 생리학적 조건에서 효율적으로 정제되는가 하는 것은 필수적인 사항이다. 인간의 보조 조절인자 복합체의 구성을 알아 보기 위해 내재 단백질에 대해 수행된 3,290 개의 면역 침전 실험의 경우를 보더라도 항체가 확보되어 있다면 대규모 실험과 연구가 가능하다. 항체라는 것이 다루기 까다롭고 모든 대상 단백질에 대해 확보하기 쉽지 않기 때문에, 필요한 항체가 현실적으로 이용 가능하지 않은 경우에 있어서, 일반적인 대안으로 이용되는 방법이 친화 표지법 (affinity tagging)이다. 이때, 단백질의 과발현 (overexpression)은 단백질의 위치 변동과 생리학적 환경에서의 비정상적인 결합을 일으킬 수 있기 때문에 표지된 미끼 단백질의 발현량을 조절하는 것이 중요하다. 연속 친화 정제 (tandem affinity purification, TAP) 방법은 효모의 전체 단백질 간 상호작용 지도를 작성하는 데 많은 기여를 하였다. 이 경우, 효모가 갖고 있는 상동성 재조합 (homologous recombination) 능력은 연속 친화 정제 꼬리표 (TAP tag)를 원하는 위치에 직접 도입할 수 있게 하여 자연 상태의 조절 기전이 연속 친화 정제 결합 단백질 (TAP fusion protein)의 발현을 제어할 수 있게 한다.
다른 많은 생물체에서는 재조합 방법이 효율적이지 않기 때문에 또 다른 접근 방법이 필요하다. 이 가운데 흥미로운 방법은 복제된 세균 인공 염색체 (bacterial artificial chromosome, BAC)를 사용한 이식 유전자 (transgene)를 이용하는 방법인데, 이 이식 유전자는 내재하는 조절 인자 서열들을 포함하고 있다. 인간 세포가 분열하는 동안 일어나는 단백질 간 상호작용은 세균 인공 염색체와 변형된 연속 친화 정제법의 조합을 이용하여 연구되었는데, 여기서 꼬리표 가운데 하나를 녹색 형광 단백질 (green-fluorescent protein, GFP)로 치환하여 위치 및 친화 정제 (localization and affinity purification, LAP)의 2 가지가 가능하게 하였다. 이를 통하여 중심체 (centrosome)와 방추사 (spindle), 그리고 궁극적으로는 세포 분열에 필수적인 복합체의 여러 새로운 소단위들의 발견에까지 이르게 되었다. 친화 정제-질량 분석법에 적용할 수 있는 수용성 단백질 복합체의 범위가 넓은 것에 비추어 볼 때, 세포막 단백질을 포함하는 복합체의 경우에는 적용된 친화 정제-질량 분석법과 막 단백질의 소수성 (hydrophobicity)에 기인한 적합성 문제로 인하여 연구가 아직 미흡한 실정이다. 그래도 효모에서는 친화 정제에서의 추출과 분리 과정에서 비변성 세제 (non-denaturing detergent)를 도입함으로써 이 문제를 극복하여 1,762 개의 막 단백질 간 상호작용에 관한 연구가 수행되었다.
좀더 전체적인 분석을 수행하기 위해서는, 단일 미끼 단백질의 친화 농축법이 고해상도의 정량적 질량 분석 (high-resolution quantitative MS)을 동반한 색층 분리 (chromatographic separa-tion)와 같이 좀 더 개선된 방식으로 진행되어야 한다. 이런 결합 방식을 통해 인간 상호작용체 내의 291 개 단백질 복합체를 분석할 수 있었고, 안정 동위 원소 표지 세포 배양 아미노산 (Stable Isotope Labeling by Amino acids in Cell culture, SILAC) 정량법으로 표피 성장 인자 (epidermal growth factor, EGF)의 자극에 의해 일어나는 전체적인 변화를 파악하기도 하였다. 또 다른 연구에서는, 여러 가지 생화학적 분획 기술의 조합을 통하여, 인체에서 3,006 개의 단백질로 구성되는 622 개 추정 복합체에 의해 생기는 13, 993 가지의 단백질 간 상호작용을 확인하였다.
히스톤 (histone)의 특정한 표식과 그 인식 인자 (reader)에 의한 전사 단계의 후성적 조절 (epigenetic regulation)이 보여 주는 바와 같이, 단백질의 번역 후 수식의 유무에 따라서 단백질 간 상호작용의 내용이 크게 달라진다. 이들 인식 인자와 각각의 복합체를 동정하기 위한 효율적인 방법으로, 변형 히스톤 펩티드를 이용하여 이 복합체를 허물고 친화 정제-질량 분석법으로 확인한 다음, 이를 다시 각 단백질 복합체로 할당하는 연구가 인간 세포주에 적용되었다. 게다가, 아세틸화 현상이 후성유전적 조절에 역할을 할 뿐만 아니라, 인간의 염색체 구조 유지 단백질 3 (Structural Maintenance of Chromosomes protein 3, SMC3)의 중복 아세틸화가 소로린 (sororin) 단백질을 결합 복합체 (cohesion complex)로 데려오는 데에 있어서 결정적인 역할을 한다는 것이 밝혀졌다.
5.2. 동적 및 정량적 친화 정제-질량 분석
정량적 친화 정제-질량 분석 (quantitative AP-MS)은 전체 시스템의 분석과 더불어 단백질 간 상호작용의 동역학과 관련성이 높은 정보를 제공한다. 예를 들면, 연구자들이 정제 과정에 존재하는 미끼 단백질의 정량을 위해서 시료 준비 과정에 동위 원소 표지 참조 펩티드 (isotope-labelled reference peptide)를 도입하는 방식으로 사람의 단백질 인산분해효소 2A (protein phosphatase 2A, PP2A) 망 하부 단위의 다양함과 역동성을 알아 보았는데, 서로 다른 조건에서 단백질 인산 분해효소 2A와 단백질 인산 분해효소 메틸에스터화 효소 1 (protein phosphatase methylesterase 1, PPME1) 간에 역동적인 연계가 일어나는 사실을 확인하였다. 마찬가지로, 정량적 질량 분석을 이용하여 NEDD8 단백질 제거 (deneddylation)7에 대한 쿨린-링 유비퀴틴 연결 효소 (cullin-RING8 ubiquitin ligase, CRL) [16] 망의 구조를 확인하고, 그 안에서 작용하는 각각의 하부 단위의 점유율을 결정하는 데 AQUA (Absolute QUAntification of proteins) [17] 펩티드를 사용하였다. 또한, 친화 정제-선택 반응 분석 (AP-SRM)이라고 불리는 목표 지향적 방법이 개발되어, 세포에서 표피 성장 인자 (EGF)에 의해 자극되는, 성장 인자 수용체 결합 단백질 2 (growth factor receptor bound protein 2, GRB2)과 상호작용하는 90 개의 단백질을 찾아내었는데, 이것은 이러한 복합체의 형성이 성장 인자의 자극 후에만 일어나는 근본적이면서도 한시적인 현상이라는 것을 밝힌 것이다.
세포질 β-카테닌 (β-catenin)을 분해하는 선종성 결장폴립증 (adenomatous polyposis coli, APC. 샘종폴립증)-AXIN1 파괴 복합체에 대한 정량적 친화 정제-질량 분석 (AP-MS)은 WNT 신호 체계에 의해서 조절되는 현상을 재조명하게 해 주었다. 이것은 기존에 제안되었던 모형 (model)과 달리 복합체가 WNT 활성화에 의해 분리되지 않고, 대신 β-카테닌의 분해를 억제하여, β-카테닌이 복합체 내에 축적되어 포화되도록 한다는 것을 의미한다. 이러한 예들은 단백질 간 상호작용의 역동성을 파악함에 있어서 친화 정제-질량 분석의 유용성을 보여주는 동시에 필수적인 생물학적 과정에 관한 새로운 통찰력을 제공한다.
5.3. 기술적 난제
친화 정제-질량 분석은 발전을 거듭해왔지만 아직도 개선의 여지가 있다. 예를 들면, 배경 단백질 (background protein)과의 동반 정제 (co-purification)와 실제 상호작용과의 구분은 여전히 어려운 부분으로 남아 있다. 이에 대한 일반적인 해결책은 미끼 정제와 동시에, 미끼가 없는 대조구의 정제를 함께 수행하는 것이다. 최근에는 단백질 상호작용의 진위 판정을 도와주는 전산학적 방법들도 개발되고 있다. 남아 있는 문제 가운데 더욱 복잡한 것들은 다음 사항들을 어떻게 정확하게 확인하는가 하는 것이다: 극히 일시적인 상호작용; 복합체와 직접 접촉하는 단백질과 단백질 결합 부위; 복합체의 화학량론; 그리고 상호작용의 방향성과 그 기능 등. 이러한 내용에 관한 정보는 어떻게 복잡한 상호작용 망이 작동하는가를 이해하는 데 필수적이다. 따라서, 서로 다른 조건 하에서도 상호작용하는 단백질들을 근본 상태대로 포획할 수 있는 가교제 (cross-linker)의 사용을 통하여, 서로 직접 작용하는 단백질들을 정확히 찾아 실제 작용 부위를 파악하고 온전한 복합체에 대한 질량 분석과 추가적인 구조 정보를 얻어낸다면 해답을 얻을 수 있을 것이다.
결국은 이러한 진전을 통해 질병의 저변에 숨어 있는 돌연변이나 단백질의 이상 발현, 번역 후 수식을 보완하는 상호작용을 찾아내야 한다. 또한, 정량적인 친화 정제-질량 분석 데이터로부터의 추론을 바탕으로 여러 가지 변화된 조건 하에서의 단백질 망의 행동의 모형화 (modelling)할 수 있는 (추가적인) 전산학적 도구의 개발이 필요하다.
6. 임상적 응용
6.1. 통합 오믹스 정보 분석
분자와 세포에 일어나는 수많은 과정이 대단히 복잡하기 때문에, 질병에 있어서의 분자 수준의 원인에 대한 동정과 해석이 어렵다. 예를 들면, 질병과 관련되어 있는 것으로 알려진 3000 개에 이르는 유전자 돌연변이와 대부분의 성인 암에서 발견되는 체세포 내 수천 가지의 유전체 치환으로 인하여 질병의 발전 혹은 치료제 개발에 있어서의 분자 수준의 기제를 이해하는 데에는 많은 어려움이 있다. 이 문제를 극복하려면 분자 수준에서 일어나는 과정에 대한 총체적인 시각을 가져야 한다. 이렇게 서로 얽혀 있는 여러 과정들을 풀기 위해서 다양한 기술들을 결합하는 방식이 강력한 힘을 발휘하는 예가 있다. 한 사람의 생리학적 상태를 14 개월 간 관찰하면서, 유전체, 전사체, 단백질체, 대사체, 그리고 자가항체 (autoantibody)에 대한 프로필을 종합하여 분석한 연구가 있다. 이 연구는 통합 개인 오믹스 정보 분석 (integrative personal omics profile)으로 일컬어지는, 통합적 개인 의약에 대한 원리 증명에 해당하며 제2형 당뇨의 발병을 포함하는 여러 가지 의학적 위험을 보여 준다.
다양한 기술을 성공적으로 결합한 또 다른 예로는 암 요법에 있어서의 약제 내성에 대한 개선책과 관련된 내용이 있다. 암은 그 기전이 대단히 복잡할 뿐만 아니라, 종종 증식과 생장을 조절하는 신호 전달 경로를 본질적으로 활성화하는 유전자 변이에 의해 발생한다. 이때, 경로의 한 지점을 억제해도 다른 경로가 재구성되기 때문에 이로부터 약제 내성이 유발된다. 이러한 역동적인 재구성은 신호망, 유전자 발현 정보 분석, 해당 세포의 표현형, 그리고 이들 데이터 간의 관계를 찾으려는 수학적 모형과의 조합을 통한 시스템 전체에 대한 관찰을 통해 알아 볼 수 있다. 연구자들은 이런 통합적인 자료 해석을 통하여, 최고의 효능을 보이는 두 부류의 항암제를 순차적으로 적용했을 때의 양상을 상세하게 확인할 수 있다.
6.2. 임상적 표지자 (clinical biomarkers)
단백질체학의 가장 도전적인 응용 가운데 한 가지는 질병의 예후 또는 진단에 유용한 단백질 생체 지표 (protein biomarker)를 동정하는 것이다. 최근에는 기술이 발전하면서, 서로 다른 종류의 질병을 구분할 수 있는 혈장 생체 지표를 찾는 등, 발견 및 검증 단계를 통합하여 포괄적인 파이프라인의 설계를 구체화하는 데 성공하고 있다. 그러나, 여러 생체 지표가 임상에 성공적으로 적용되고는 있지만, 대부분은 아닐지라도 많은 수의 생체 지표는 곧바로 임상에 이용하기에는 제한된 신뢰도를 갖고 있거나 적절한 검증 없이 도입된다는 비판도 있어, 임상의들 사이에서는 회의적인 경우도 있다. 많은 생체 지표 연구가 지니는 기본적인 단점은 발견 단계에서 적절한 대조구가 없고, 생체 지표를 정의하기 위한 적당한 통계학적 도구가 사용되지 않으며, 지표의 타당성을 명확하게 보증할 수 있는, 대량의 환자 집단에서의 독립적인 검증 단계가 미흡하다는 것이다. 이러한 약점으로 인해 관련 질병에 바로 적용되지 못한 채 비판을 받는 생체 지표들이 생긴다.
질병 생물학으로 성공적으로 연결되어 대량 환자 집단에서 검증된 생체 지표의 한 예로, 단백질 분해 효소의 저해제인 엘라핀 (elafin)이 있다. 이 단백질은 동종골수이식 (allogeneic bone marrow transplant) 후 급성 이식편대숙주병 (acute graft-versus-host disease)의 진단과 예후 모두에 유용한 것으로 확인되었다. 또 다른 예로는 폐암과 관련된 단백질의 특징을 들 수 있다. 이 연구는 종양 생물학을 뒷받침하면서도 생체 지표 탐색에 있어서 흔한 함정을 회피할 수 있는 엄격한 기준의 생체 지표 선정, 즉 건강한 대조군의 적용에 의해 성공할 수 있었다. 이렇게 질병에 동반되는 과정인 염증을 시료 간의 단백질 차이의 주된 원천으로 간주하여, 서로 다른 4 가지의 대체 암 (즉, 췌장암, 난소암, 전립선암, 그리고 유방암)의 생쥐 모델 (mouse model)에서 4 종류 폐암과 2 가지 염증 모델을 비교하였다. 이와 같이, 폐암의 종양 생물학에 함유된 특정 단백질의 특징이 독립적인 환자 집단에서 검증될 수 있을 것이다.
6.3. 암의 이질성과 동인 (動因) 분석, 그리고 개인화 암 치료
생체 조직 검사 (biopsy, 생검) 시료의 유전자 발현 분석은 질병의 분자적 특징을 반영하는 측면이 크기 때문에 개인화 처치를 설계하는 데 사용될 수 있다.
조직은 서로 다른 종류의 세포들로 이루어져 있어서 검사하고자 하는 세포 집단에 대한 연구를 어렵게 한다. 이에 대한 해결책으로, 특정 세포 집단을 분리하기 위한 레이저포획 미세해부 (la-ser-capture micro-dissection)를 결합한 초민감 단백질체학 (ultra-sensitive proteomics)을 생각해 볼 수 있다. 이미 질량 분석법이 이렇게 작은 양의 시료의 분석에도 활용될 만큼 발전해 왔으며, 수백 개의 세포로 이루어진 시료에 대하여 합리적인 수준의 단백질체 분석이 가능할 정도가 되어, 이제는 종양 내 비균질성 (intra-tumor heterogeneity)과 같은 현상도 연구할 수 있는 길이 열렸다.
시험관 내 (in vitro) 세포주는 체외 (ex vivo) 상태의 조건을 항상 그대로 재현하지는 못한다. 이 사안은 연구 대상인 세포 유형을 1차 조직 시료에 대해 형광 활성 세포 분리 (Fluores-cence-Activated Cell Sorting, FACS) 기반의 분리 방법을 적용함으로써 부분적으로 해결되었다. 이런 방식으로 체외 (ex vivo)에서의 생물학적 과정을 연구할 수 있게 되었는데, 소장 (small intestine)의 줄기 세포 특이적 유전자를 분명히 밝히는 데 사용한 것이 한 예가 될 수 있다.
번역 후 수식을 조절하는 기전의 완화는 치명적인 결과를 가져 오게 된다. 예컨대, 수용체 티로신 인산화 효소 (receptor tyrosine kinase, RTK)의 돌연변이는 그들이 조절하는 세포의 어떤 과정을 지속적으로 활성화할 수도 있다. 실제로, 많은 티로신 인산화 효소가 종양 유전자 (onco-gene)이며, 이상 기능 상태의 생존이나 분화 기전은 궁극적으로 악성 전환으로 이어지게 된다. 따라서, 이러한 활성화가 항상 유전적인 돌연변이에 의해 일어나는 것은 아니기 때문에 종양에 있어서는 활성화된 인산화 효소의 정확한 동정이 필수적이다. 면역 침전 과정을 거친 질량 분석법의 경우에는 41 가지 폐암 세포주와 150 개의 종양에 있어서의 인산화 티로신 펩티드의 동정에 사용되었다. 그 결과로 얻은 인산화 티로신의 특징은 시료의 분류에 사용되었고, 신종 ALK (Anaplastic Lymphoma Kinase) 및 ROS 융합 단백질을 포함한, 폐암에서 활성화된 몇 가지 새로운 인산화 효소를 찾아낼 수 있었다. 다른 접근법으로는 선택적 펩티드를 이용한 면역 침전 실험이 수행되었는데, 포스포이노시티드 3-인산화 효소 (phosphoinositide 3-kinase, PI3K)와 미토겐 (mitogen, 유사분열 촉진체) 활성화 단백질 인산화 효소 (mitogen-activated protein kinase, MAPK) 경로의 인산화 기질 (phosphorylated substrate)에 대한 것이었다. 여기서 PI3K-AKT 경로의 활성화는 해당 경로의 아래쪽 (downstream)에서 작용하는 인산화 위치를 관찰함으로써 밝혀졌다. 이처럼 새로운 접근법에 의해 밝혀진 인산화 단백질 지표는, 해당 경로의 여러 유전자의 서열 분석 없이 PI3K-AKT 경로의 활성화를 확인하고, AKT, 3-인산화 이노시티드 단백질 인산화 효소 1 (PDK1), PI3K나 포유동물 목표 또는 라파마이신 (rapamycin, mTOR) 등 약리학적 저해제의 효능을 예측하는 데 사용되곤 하는데, 이것은 개인화 치료의 잠재력을 보여 주는 것이다.
7. 정리 및 전망
차세대 단백질체 분석은 단백질체의 모든 면에 대하여 심층 분석을 가능하게 한다. 질량 분석은 그 핵심 기술로서 중심 역할을 계속 할 것이다. 질량 분석 기반의 단백질체학에 있어서 미래의 발전을 위해 주목해야 할 주요 영역은 다음과 같다: 좀더 짧은 시간 내 적절한 자료 확보; 요구되는 시료의 양 축소; 단세포 단백질체 분석 (single-cell proteome analysis)을 최종 목표로 하는, 균질 세포 집단 (homogenous cell population)이나 미세 해부 조직 (micro-dissected tissue)에 대한 심층 분석.
그 밖에 남은 도전 과제로는 실험실 수준의 세포 배양을 생체 내 조직이나 1차 세포로 이행하는 것인데 이것은 기술적으로나 생물학적으로 조절하기 훨씬 까다로운 문제이다. 미래에는 환자 유래 (patient-derived)의 유도 만능 줄기 세포 (iPSC)와 유사 기관 (organoid) 등도 단백질체 분석에 있어서 실험실 배양 세포와 환자 유래 조직 간의 간극을 메워 줄 잠재력이 있다.
앞으로는 맞춤 의학의 발전에 따라 개인화된 단백질체의 개별적 정보 또한 요구될 것이다. 비록 치우침이 없는 (unbiased) 질량 분석법이 빠른 속도로 고속화되고 포괄적인 방향으로 발전한다고 하더라도, 선택 반응 분석 (SRM)과 같이 목표 단백질 군에 집중하는 단백질체 분석법이 효소 면역 분석법 (Enzyme Linked ImmunoSorbent Assay, ELISA) 등의 시험 방법과 경쟁하는 형태의 다양한 방법론을 복합적으로 사용하게 될 것이다. 이런 맥락에서, 질량 분석을 동반한 질량 세포 측정법 (mass cytometry)이 이미 전통적인 FACS에 대하여 경쟁력 있는 고급 다중 플랫폼을 제공하기 시작했다.
지난 10년 간 고속 대량 처리 기술 (high-throughput technology)의 빠른 발전은 비용 절감과 함께 여러 조절 수준에서 생물학적 시스템의 정보를 얻을 수 있는 새로운 가능성을 열면서, 동시에 전례 없는 시야를 제공하고 있다. 남은 도전 과제는 앞으로 계속 생산될 단백질체 데이터와 유전체, 전사체, 그리고 대사체 등의 다른 영역의 데이터를 어떻게 통합하느냐는 것이며, 여기에는 생물정보학이 주요한 역할을 담당하게 될 것이다. 현재까지 단백질체 데이터와 심층 염기 서열 분석 데이터 (deep-sequenced DNA and RNA data) [18,19]에 대한 분석, 그리고 단백질체 데이터와 ribosome profiling 간의 비교 분석에 많은 노력을 기울였고, 단백질체 정보 분석보다는 핵산 염기 서열 분석이 빠른 속도로 발전하기는 했지만, 번역 후 수식과 같은 유전자의 발현 조절 및 망 생물학 영역에서는 아직 결정적인 역할을 하지는 못하고 있다. 따라서, 질량 분석 기반의 단백질체학은 미래에도 당분간 다른 유전체 이후 기반 영역 (post-genome platform)과는 다르게 상당히 보완적이면서도 독특한 역할을 하면서 많은 데이터를 제공하게 될 것이다. 시스템 수준의 생물학적 질문에 대한 답을 구하기 위해서는 통합적인 생물학적 접근법은 필수적이다. 그러나, 앞으로 통합적인 연구를 위해서는 서로 다른 영역의 과학 공동체 간의 소통뿐만 아니라 다양한 유전체 이후 (post-genome) 기술들의 성숙과 이에 따른 재배치가 요구될 것이다. 미래의 단백질체학은 이 모든 기술과 지식의 효율적인 결합을 통해 생물학적으로 유의미한 통찰을 제공하는 차세대 시스템생물학 (next-generation systems biology)으로 발전해 나가야 한다.
8. 참고문헌
=>PDF 참고
1111111111111111111
1 단백질 분해 효소도 아미노산으로 이루어진 단백질이기 때문이다.
2 리뷰 참조: [8] Rauniyar, N. and Yates, J.R., 3rd. (2014). Isobaric labeling-based relative quantification in shotgun proteomics. J Proteome Res 13, 5293-309.
3 인간의 단백질 합성 유전자의 수는 19,000에서 최대 21,000 사이일 것으로 보고 있다.
4 2015년 Science에 보고된 바에 따르면, 데이터 생산에 적용된 실험적 방법론과 이에 대한 통계적 분석 과정에서 발생된 오류를 보정하고 나면, 단백질의 발현에 대하여 지금까지 알려진 것만큼 단백질 번역 단계와 그 이후의 영향이 크지는 않다고 한다. [14] Li, J.J. and Biggin, M.D. (2015). Gene expression. Statistics requantitates the central dogma. Science 347, 1066-7.
5 단백질체 분석 대상의 특정 아미노산 영양 요구성 세포주 (auxotroph)를 사용하여, 배양 초기에 동위 원소로 표지된 아미노산을 최소 7 세대 이상 공급한 후, 다시 원래의 비표지 아미노산을 공급하여 단백질체의 변화 양상을 측정하는 방법. 문헌 참조.
6 이에 대해서는 전술한 바와 같이 논란의 여지가 있다.
7 단백질로부터 유비퀴틴 유사 단백질 (ubiquitin-like protein)인 NEDD8을 제거함을 의미.
8 RING (Really Interesting New Gene). 문헌 참조.
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
지식
동향