본문 바로가기

기술동향

홈 > BT정보 > 기술동향

scrap print facebook twitter me2day
글 읽기
시스템 생물학을 향한 Proteomics의 접근
분류 기술동향 > 생명과학 > 단백질체연구
출처 KISTI 조회 3621
자료발간일 2005-02-14 등록일 2004-10-12
내용바로가기
평점 평점이 없습니다.
시스템 생물학을 향한 Proteomics의 접근


                                                                                          전문연구위원 최재윤
 
1. 기술의 개요

□ Proteomics는 어느 생물이 가지고 있는 모든 유전자 집합(게놈; 유전형질)을 해석대상으로 한 genomics(유전체학)라는 언어처럼, 어느 생물이 가지고 있는 모든 단백질체(proteom)를 해석 대상으로 하는 연구에 대해 만들어진 조어(造語)이다. 한 개의 세포에 주목하면 그 중에는 모든 유전자로부터 단백질이 만들어지고 있는(발현) 것은 아니다. 단세포 생물에서도 그렇지만 특히 다세포 생물에서는 조직, 세포의 종류에 따라 일부 정해진 유전자만 발현하고 각각의 세포에 특유한 단백질 세트(proteom)가 만들어진다. 세포가 있었던 환경에 따라 동적으로 변화하는 proteom을 연구하는 것이 proteomics의 제일의 목표인 것이다.

□ 단백질의 기능과 그의 양을 밝히는 것만으로 세포를 기초로 하는 생명활동이 이해될 것이라고 하지만, 답은 그렇지 않다. 문제점의 하나는 단백질의 양과 그 기능(효소는 그의 활성)과의 사이에 상관이 결핍되기 때문이다. 단백질의 기능은 발현량 이외에 단백질 번역후 수식이나 작동체(effector)라 부르는 저분자나 다른 단백질 등의 조절분자(단백질간 상호작용)가 결합하는 것으로 조절되고 있다. 그러나 세포중에는 이들의 조절기능이 복잡한 network을 형성하고 있게 된다. 본 문에서는 이들의 조절기구를 대규모로 해석하기 위한 기술과 그 해석을 통해 시스템 생물학에의 접근에 대해 소개한다.

 

2. 기술의 내용
 
□ 단백질의 활성조절기구
 
○ 단백질의 활성조절기구에서 단백질의 양이 중요하며 이것은 합성속도와 분해속도에 따라 조절된다. 합성속도는 DNA칩을 사용한 mRNA수준의 해석(tranome 해석)에 따라 거의 포괄적으로 해석하는 것이 된다. DNA칩의 문제점은 절대량에 관한 정보를 얻을 수 없는 것
유전형질상의 유전자에 관한 정확한 정보가 필요한 것이다. 유전형질 배열이 밝혀져도 “어디가 유전자인가”라는 것을 예비 지식없이 배열정보만으로는 알 수 없기 때문이다. 따라서 “유전자 발굴”작업이 필요하게 된다. “거의 포괄적으로”라는 한정이 붙는 것은 이런 것 때문인
것이다.

 
○ 단백질의 분해속도는 진핵생물에서는 각개의 단백질에 대해 세밀하게 조절되고 있어, 사용되지 않게 된 단백질만을 선택적으로 분해하는 기구가 존재한다. 단백질의 분해속도(turn-over라 부름)의 대규모적인 해석은 proteomics의 중요한 연구대상이다. 합성속도와 분해속도의 해석으로 단백질의 양과 그 조절에 관한 정보를 얻을 수가 있다.

○ 다음 문제는 활성조절로서 효소활성은 기질의 농도에 따라 변하며 기질에 가까운 구조를 갖는 분자에 의해 길항적(拮抗的)으로 저해된다(같은 기질 결합부위에 경합적으로 결합함). 다시 기질 결합부위와 다른 부위가 전혀 다른 분자(저분자 작동체)가 결합하여 활성이 조절되
는 경우(allosteric 효과)도 있다. 이들의 저분자에 의해 활성조절 외에 단백질간 상호작용에 의한 활성조절이 있다.

 
○ 칼슘결합 단백질인 calmodulin은 그 자체로서 효소활성을 갖지 못하나 단백질에 결합되어 그 활성을 조절한다. 이 단백질간 상호작용은 calmodulin로서의 칼슘결합에 의해 억제되기 때문에 저분자의 조절분자가 단백질간 상호작용을 통해 단백질의 기능을 조절한다고 하는 두
단계의 억제이다.

○ 단백질의 수식에 의한 활성조절이 알려져 있으며 그 대표적인 예는 단백질의 인산화(燐酸化)이다. 단백질인산화효소(protein kinase)에 의한 다른 단백질이 인산화되어 그 활성이 변화한다. 인산화의 경우에 탈인산화효소(phosphatase)에 의한 탈인산화되기 때문에 가역적인 조절이 이루어진다.

 
○ 일반적으로 순방향/역방향이 각기 속도가 저분자 영향의 경우하고는 크게 다르며 그들의 각기 반응도 개별적으로 조절되고 있는 점이 번역후 수식에 의한 활성조절의 특징인 것이다. NO(일산화질소)와 같이 비공유결합에 의한 단백질의 활성을 조절하면 동시에 공유결합에 의한 단백질을 수식하는 중간적인 경우도 존재한다. 지질 수식과 같이 효소활성 뿐만 아니라 단백질의 세포내 국재(局在)를 조절하는 경우도 있다.

○ 단백질이 기능을 발휘하는 “장(場)”도 중요한 포인트로서 효소와 기질, 단백질과 단백질, 각각 상호작용하는 상대가 같은 장소가 아니면 반응은 일어나지 않는다. 신호전달계 단백질과 같이 세포막에서 핵이나 그 외의 장소에 신호를 전달하는 역할을 갖는 단백질은 특정의 장
소에서 별도의 장소로 이행하는 것도 있다.

 

□ 포괄적(comprehesive) 해석기술
 
○ 활성 및 기능조절기구는 개개의 단백질에 있어 개별연구로서 전부터 연구가 진행되어 왔으나, 그것을 가능한 한 대규모로 해석하는 연구가 proteomics이며 또한 포스트게놈시대의 생명과학을 취하는 자세이다.  전체적(global)인 해석은 달성가능하나 포괄적 해석은 proteom수준에서 곤란하다. 유전형질 배열 해석은 5‘말단에서 3’말단까지의 배열을 거의 해독하는 것으로 포괄적인 해석이 가능하다. 세포가 놓인 환경에 따라 그 proteom은 동적으로 다양한 변화를 나타낸다.

 
○ 다세포 생물에서는 수정란이 분열을 반복하여 성체로 되는 개체발생의 과정만이라도 하나하나의 세포의 proteom은 연속적으로 변화되어 간다. 따라서 원리적으로도 proteom의 모든 것을 해석한다는 것은 어려우며 실제로 이용되는 해석기술에 있어서도 또한 한계가 있다. 그러므로 여기에서의 포괄적인 해석은 종래의 개별연구를 초월한 대규모적으로 세포전체를 들여다보는 전체적인 해석을 추구할 것이다.

○ proteomics에 의한 발현해석
단백질 동정에는 단백질의 질량분석과 유전형질 해석을 중심으로 하며 충실히 유전자 배열 데이터베이스를 조합하여 비약적으로 용이하게 되었다. 종래의 단백질 해석법에 비해 고감도이며 또한 고속이다.  더군다나 단백질의 복잡한 혼성물도 그대로 해석이 된다는 것이다.

○ 최근에는 단백질 펩타이드를 분해하지 않고 그대로 질량분석계에 주입시켜 배열정보를 얻음으로써 동정하는 기술도 현실화되고 있다 (Top-down proteomics라 부름). 이들의 수법에 의해 어느 세포에서 발현하고 있는 1,000~2,000 종류정도까지의 단백질을 하루에서 수일간의
해석으로서 동정한다는 것이 일상화되었다.

○ 안정 동위체 표식(12C 대신에 13C 사용하면 질량분석으로 구별할 수있음)으로 상대적인 양의 변화를 해석하는 기술도 개발되고 있다.  Tranome 해석에 비해 해석할 수 있는 단백질의 수는 많지 않으나(1,000종류+α정도), 측정정도가 높아서 수십% 정도의 변화를 유의적
으로 검출할 수 있을 것으로 생각된다.

 
□ proteomics에 의한 분해속도의 해석
 
○ 짧은 시간동안 방사선 동위원소로 표지함으로써 그 감소를 추적하여 각각의 단백질 turn-over를 해석하는 것이 종래의 개별연구 방법이다.  세포를 안정 동위체 표식(예로서 아미노산의 하나인 leucine의 수소원자를 중수소로 치환한 것을 사용함)하여 완전하게 치환된 단계에서보통의 leucine을 대과잉(大過剩)으로 가한다. 희석후의 시간경과에 따라 샘플을 2차원 겔전기영동으로 전개하고 단백질이 포함한 중수소 라벨의 감소를 추적함으로써 proteome scale의 분해속도해석이 가능해 진다.

○ 이 방법을 사용하면 효모의 50여개의 단백질 분해속도가 측정되며 단백질에 따라 크게 차이가 난다는 보고도 있다. 같은 양상의 방법을 사용함으로써 대규모적인 해석이 이루어지는 것이 가능하다.

 
□ 번역후 수식의 proteomics
 
○ 단백질의 번역후 수식의 해석에도 질량분석은 중요한 역할을 하게 된다. 그것은 시료조제(試料調製)의 단계를 포함한 해석의 과정으로 안전한 수식이라면 그 종류에 관계없이 수식의 종류와 부위에 관한 정보가 같은 해석기술을 사용하여 얻어지기 때문이다.

 
○ 2차원 겔전기영동의 점(spot)을 인산화단백질 등 수식에 어느 정도 특이적인 염색을 함으로써 검출되는 기술도 실험되고 있으나 수식기(修飾基)에 특이적인 화학반응이나 특이적 항체 등을 이용하여 수식된 단백질이나 펩타이드를 특이적으로 분리하는 기술도 개발되고 있다.

○ 어느 경우에도 특이성과 수율(收率)이 문제가 되고 있다. 수식 특이적 항체를 이용하는 것은 친화성이 높은 항체가 얻어진다면 그 수식을 갖고 있는 단백질을 대규모로 분리하는 것이 되어 유효한 수법의 하나인 것이다.

○ 인산화(燐酸化)와 같이 세포를 자극하여 수용체에 시작하는 신호전달계가 활성화하는 경우에는 자극에 의한 수식변동을 정량적으로 해석 하는 것이 바람직하다.

 
○ FT-MS라 하는 고분자 가능, 고정도(高精度)의 질량분석계를 사용하며 개개의 단백질의 N말단에서 C말단까지 모든 것의 수식을 밝히는 접근(top-down proteomics)도 포괄적인 해석후 수식의 해석을 하는 길을 여는 것이다.

□ metabolom 해석
 
○ metabolom해석이란 proteomics가 되려면 metabolomics이며 대사산물 (metabolite)의 포괄적 해석이다. proteomics의 해석기술과 같이 우수한 해석․동정 수단인 질량분석과 분리수단[액체 크로마토그래피(LC)이나 모세전기영동(CE)]을 온라인으로 조합시킨 해석법인데, 다양한 성질을 갖는 여러 가지 대사물의 동정․정량에 사용되고 있다.

 
○ metabolom 과제는 세포라는 복잡계(複雜系) 중에서 연속된 반응경로의 전체상(全體像)을 추구하는 것이다. 저분자의 대사물 중에서도 지질대사에서 나오는 많은 저분자 대사물은 지질 전달자로서 신호전달계 중에서도 중요한 위치를 차지하고 있다. 이 수용성의 저분자와 다
른 성질(소수성(疏水性) 분자량)을 갖고 독자적 해석방법이 필요하다.  여기도 질량분석을 중심으로 한 포괄적인 해석법이 개발되어 있다.

 
□ 세포내 국재(局在), 상호작용의 대규모 해석
 
○ 세포내 국재는 형광단백질 GFP와 융합단백질을 세포내에서 발현시키는 것으로 비교적 용이하게 해석할 수 있다. 유전자의 지식을 이용하므로 게놈해석에 의해 밝혀진 모든 유전자에 대해 포괄적으로 해석하는 것이 가능한 것이다.

○ GFP 융합단백질을 사용하는 방법은 생리적인 발현량과는 다른 대량발현에 의한 가공물의 가능성이 문제가 되며, 내재성 단백질의 국재를 해석하는 다른 방법과 조합시킨 해석도 필요할 것이다. 복합체 해석으로 동정된 단백질의 공국재(共局在)의 해석도 같은 양상의 해석이나
형광라벨간의 거리를 FRET(Fluorescence Resonance Energy Transfer) 법 등에 의해 세포 레벨에서 대규모적으로 해석할 필요가 있다.
 
3. 결론
 
□ 대규모 해석에서 Network해석으로
 
○ 하나의 효소는 한 종류의 기질만을 특이적으로 결합하며 반응산물을 생성하는 것은 아니다. 효소는 매우 특이성이 높은 촉매라는 기성개념하고는 일치하지 않지만 실제로 기질과 구조가 닮은 화합물은 친화성이 낮은 것과도 결합하며 대사가 된다. 이와 같이 세포중에서 일어나는 반응의 일부가 이해되지 않지만 이를 효율적으로 하는 방법으로는 network의 전체상을 시뮬레이션(모의실험)과 대규모 해석을 조합하여 해석하는 것이다. network에 어떠한 섭동(攝動)을 부여하고 그 반응을 해석한 결과로부터 블랙박스 내의 반응경로를 시뮬레이트한다.
○ 단순한 network로서는 없지만 network 구성하는 개개의 요소, 반응에 관한 대규모적인 재료 수집은 필수적이다. 이와 같은 지식으로 여러가지 섭동에 대한 반응을 모의 실험하는 것으로 network를 밝혀서 접근하게 한다. 개개의 구성요소를 특이적으로 활성화하고 또한 불활성
화하여 작동체를 조직적인 것으로 해석할 필요가 있다.

○ 전에는 저해제를 사용하여 어느 효소의 활성을 특이적으로 저해하여 왔으나, 최근에는 RNAi(RNA interference)의 발전에 힘입어 개개의 단백질을 특이적으로 Knock-out하는 것이 가능해져서 RNAi의 사용이 용이한 선충(線虫)에서는 대규모 해석이 이루어지고 있다.

 
○ protein kinase의 세포내에서의 기질단백질도 어느 의미에서는 거의 알지 못하나 세포에 들어 있는 단백질의 인산화를 대규모로 해석되면 특정한 protein kinase를 활성화 혹은 불활성화 하였을 때에 인산화패턴의 변동에서 생체내의 기질 단백질의 스펙트럼을 밝히게 될 것이다. 이 경우도 직접 기질이 되는 단백질뿐만 아니라 간접적으로 영향을 받는 경우도 생각하여서 network의 모의실험을 해가면서 해석을 진행하는 것이 필요하다.

○ Informatics는 대규모 데이터를 수집하고 여기에서 정보 추출에도 필수적인 것이다. proteomics 분야에서도 해석기술의 진보와 높은 정보 처리량으로 인해 얻어지는 많은 양의 데이터베이스와 관련된 data-mining 등에 관심을 기울이고 있다.

 

◁전문가 제언▷
 
□ 생명현상을 이해하기 위해서는 단백질의 활성조절 기능과 단백질 양의 중요성과 이에 따른 단백질의 합성과정, 속도 및 분해과정 등이 이해되어야만 하며 이와 같은 기능을 포괄적으로 취급하는 융합된 새로운 학문으로 proteomics는 “유전형질학” 또는 “유전형질연구”라는 합성된 생명과학분야 학문으로서 현재 세계적으로 성황리에 기술개발이 진행되고 있다. 앞으로 proteomics의 발전은 생명과학 관련 산업과 연계되어 지대한 영향이 기대되는 연구분야이다.
 
□ 생명과학, 정보과학 등이 융합된 학문분야로서 유전자 해석정보를 computer로서 각종 유전자의 기능과 예측실험 등을 통하여 데이터베이스화하여 실험결과를 본래의 유전자간의 상호작용을 예측한다든가 하는 유전자에 관한 정보를 network를 이용하여 분석하는 것으로 “생명분석학” 또는 “생물정보학” 등으로 부르며 각국의 연구기관이나 민간 기업에서 연구경쟁이 격화되는 있는 실정이다.