BioINpro
(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공네트워크 기반 단백질 새포내 위치 정보 예측
- 등록일2011-03-22
- 조회수9687
- 분류생명 > 생물공학, 플랫폼바이오 > 바이오융합기술
-
저자/소속
이기영 /아주대학교 의과대학
-
발간일
2011-03-22
-
키워드
#바이오융합
- 첨부파일
-
차트+
?
차트+ 도움말
Bioin스페셜 WebZine 2011년 21호 [바이오 융합기술]
네트워크 기반 단백질 새포내 위치 정보 예측
이기영 /아주대학교 의과대학 의료정보학과 조교수
1. 서론
우리 몸에 존재하는 수많은 단백질은 올바르게 동작하기 위해서는 합성된 이후에 세포내의 특정위치로 바르게 이동되어야 한다 (그림 1A-B). 따라서 단백질의 세포 내 위치정보(subcellular localization)를 아는 것은 그 단백질의 기능을 이해하는데 아주 중요한 역할을 한다 (1,2). 출아 (budding) 및 분열 (fission) 효모에서는 단백질의 3’ (또는 5’) ORF에 형광물질인 GFP를 융합하는 방식을 사용하여 좀 더 체계적으로 단백질의 위치 정보를 예측 할 수 있었다 (1-4). 하지만 그런 연구방법은 예쁜꼬마선충, 초파리, 또는 포유동물과 같은 고등동물에서는 방대한 단백질의 수와 태깅(tagging)에서 오는 기술적인 어려움으로 게놈 수준으로 체계적으로 밝혀내기 어려웠다 (5-7). 그러는 동안에 생물학적 실험 대신 생물정보학 기법들을 사용해서 위치 정보를 예측하는 방법들이 개발 되어 오고 있고, 이 방법들을 이용해서 새로 알려져 있지 않은 위치 정보를 십 수 연간 예측 해 오고 있었다.
현재까지 상당한 수의 생물정보학 기법들이 위치정보를 예측하기 위해서 개발되어 왔다 (5-24). 전형적으로, 이런 방법들에서는 단백질의 특징을 나타내는 값을 입력으로 받아 들여서 그 단백질의 예견되는 위치 정보를 출력한다. 단백질의 특징으로는 서열정보, 무게, 구조, 도메인, 또는 유전자 온톨로지(Gene Ontology)와 같은 좀 더 기능에 가까운 정보들을 하나 이상 융합해서 사용하고 있다. 학습 과정에서는, 위치정보가 알려진 단백질을 이용해서 위에 언급한 특징들을 벡터형태로 표현하고, 그 중 좋은 특징벡터를 추출하는 과정이 특정 위치정보마다 있을 수 있다. 이렇게 위치정보마다 예측을 위한 모델을 완성 되면, 위치 정보가 알려지지 않은 단백질을 입력 받아 특징벡터로 표현한 후, 가장 높은 가능성으로 예측된 위치정보로 하나 이상 할당하게 된다.
................계속
* 로그인 하셔야 자세한 정보를 모두 보실 수 있습니다.
지식