본문으로 바로가기

인프라동향

미국, 전 세계 단백질 데이터베이스 통합을 위한 연구비 지원 결정

  • 등록일2002-10-23
  • 조회수7375
  • 분류인프라동향 > 기타 > 기타
  • 자료발간일
    2002-10-23
  • 출처
    NIC News Release
  • 원문링크
  • 키워드
    #단백질 데이터베이스#단백질

미국, 전 세계 단백질 데이터베이스 통합을 위한 연구비 지원 결정

 
단백질 자료들을 하나로 모으기 위해 미국 국립 인간 유전체 연구소(National Human Genome Research Institute ; NHGRI)와 국립보건원(National Institutes of Health ; NIH) 산하 다섯 곳의 연구 기관이 공동으로 미화 1,500만 달러를 3년에 걸쳐 출연해 전 세계의 3대 단백질 데이터베이스를 하나로 통합하게 됐다.
 
연합 단백질 데이터베이스(United Protein Database), 약어로 UniProt이라 명명된 새로운 공개 데이터베이스는 현존하는 세 개의 단백질 데이터베이스인 SWISS-PROT, TrEMBL, PIR(Protein Information Resource) 등을 하나로 묶게 된다. 그 목적은 인간의 질병 연구에 유용한 수단을 마련하는 동시에 전 세계 연구원들이 포괄적이면서도 쓰레기 정보가 포함되지 않은 고급의 단백질 정보원을 무료로 자유롭게 사용할 수 있도록 하는데 있다.
 
NHGRI의 연구소장인 프란시스 콜린즈(Francis S. Collins) 박사는 이번 결정의 의의를 다음과 같이 밝혔다. 오늘 날 과학자들이 도전해야 할 중요 과제 가운데 하나는 인간 유전체 프로젝트(Human Genome Project) 및 관련 연구들을 통해 얻어진 엄청난 양의 자료들을 해석하는 것이다. UnitProt 데이터베이스는 생물학 이해의 폭을 넓히려는 노력 뿐만 아니라 기초 과학 성과를 임상적으로 응용하려는 목적을 갖고 있는 모든 과학자들에게 훌륭한 자원이 될 것이다. 이번 연구비 지원 결정은 NHGRI와 NIH가 전 세계 과학계를 위한 생물정보학 인프라 구현에 자금 지원을 계속한다는 의지의 표명이기도 하다.
 
단백질과 이들의 상호작용을 포괄적으로 다루는 단백체학(proteomics)은 단백질 과학 기술의 발달과 인간 유전체 프로젝트를 통해 대량의 유전체 정보가 얻어진 덕분에 근래 들어 빠르게 발전하고 있다. 이 같은 변화로 인해 사람의 손으로 하나하나 구축해 관리되고 있는 SWISS-PROT 단백질-서열 데이터베이스 단 하나의 능력만으로는 전 세계 과학자들의 요구를 만족시키기 어려워졌다. 현재 스위스 생물정보학 연구소(Swiss Institute of Bioinformatics ; SIB)에서 SWISS-PROT의 책임자로 있는 아모스 바이로치(Amos Bairoch) 박사에 의해 지난 1986년에 만들어진 SWISS-PROT의 정보화 과정은 자동화 되지 못한 탓에 수동적이면서도 고도의 기술을 필요로 한다. 이 때문에 SWISS-PROT만으로는 고용량의 DNA 염기 서열 분석을 통해 쏟아지는, 사람을 포함한, 여러 생물체의 새로운 단백질 수십만 가지에 대한 엄청난 정보들을 충분히 소화할 수 없었다.
 
TrEMBI는 SWISS-PROT를 구축, 관리했던 경험을 같고 있었던 SIB와 유럽 생물정보학 연구소(European Bioinformatics Institute ; EBI)의 연구팀이 SWISS-PROT의 한계를 보충하기 위한 목적으로 컴퓨터 기술을 활용해 만들어 관리하고 있는 데이터베이스이다. TrEMBI는 대규모 유전체 프로젝트를 통해 확보된 대량의 자료를 다룰 수 있도록 개발되었기 때문에 새로운 단백질 서열이 수동 작업을 거쳐 SWISS-PROT에 추가되기 전에 과학자들이 좀 더 신속하게 단백질 서열 정보에 접근하는 것을 가능하게 만들었다.
 
이 시기에 이르러 단백질 데이터베이스 정보를 중앙 집중화 하려는 목적이 NHGRI에 의해 세워지게 되고 국립종합의학연구소(National Institute of General Medical Sciences ; NIGMS) 및 국립의학도서관(National Library of Medicine ; NLM)과 함께 2002년이나 2003년부터 시작해 매년 미화 450만 달러의 연구비를 3년에 걸쳐 지원하자는 제안이 2001년에 처음으로 마련된다.
 
이 같은 중앙 집중식 단백질 데이터베이스 계획을 달성하기 위해 NHGRI는 UniProt 프로젝트를 지원하기로 결정했으며, SWISS-PROT와 TrEMBL, 그리고 미국이 구축한 PIR을 통합해 UniProt를 구현할 예정이다. PIR은 조지타운대학병원(Georgetown Univ. Medical Center)과 국립생의학연구재단(National Biomedical Research Foundation)이 공동으로 일궈낸 성과물이다. PIR은 마가렛 데이호프(Margaret Dayhoff) 박사의 노력이 결실을 맺어 지난 1984년에 구축되었다. 그녀는 지난 1965년부터 1978년에 걸쳐 단백질 아미노산 서열과 구조 도해서(Atlas of Protein Sequence and Structure)를 출판했는데, 이것은 단백질 서열에 대한 최초의 종합 성과물이었다. 1974년에는 데이호프 박사가 단백질 서열의 유사성을 기준으로 단백질과(protein family)와 그 상과(super-family) 개념을 고안해 이를 단백질 계통 정리와 분류 방법으로 활용했다. PIR에 등재된 목록은 이 같은 방법과 단백질 기능 및 구조에 대한 자료를 컴퓨터로 분석한 결과를 토대로 정리된 것이다.
 
정확히 말하자면 새로운 UniProt 데이터베이스는 두 부분으로 구성될 예정인데, 사람의 손을 거쳐 완전히 동정된 목록을 포함하는 SWISS-PROT 부분과 컴퓨터 동정은 완료되었지만 아직 사람이 직접 분석하지 않은 목록이 포함된 TrEMBL 부분들이 그것이다. PIR 데이터베이스 자체를 더 이상 유지하지는 않을 예정이지만 TrEMBL 자료를 SWISS-PROT 기준에 적합하게 보강하는 작업에 PIR 자료가 활용될 계획이다. 기존의 모든 PIR 목록은 UniProt에 통합된다. 현재 SWISS-PROT에는 114,000개의 단백질 목록이 있으며 TrEMBL에 700,000 개, PIR에 283,000 개의 단백질 정보가 포함되어 있다. 이번 3년의 연구 과제가 마무리될 쯤이면 UniProt 데이터베이스에 약 200만 개 이상의 단백질 정보가 확보될 것으로 EBI 과학자들은 전망했다.
지난 1994년부터 EBI의 조정자 자격으로 SWISS-PROT 그룹을 주도해 온 롤프 압웨일러(Rolf Apweiler) 박사가 본 프로젝트에 과제 책임자가 될 예정이다.
 
압웨일러 박사는 단백질 서열과 기능에 대해 점차 다양한 정보들이 늘어가고 있는 실정에서 UniProt가 단백질 서열에 관한 중앙 데이터베이스로서 현대 생물학, 특히 단백체학 분야의 여러 과학자들을 위한 초석이 될 것이라고 밝혔다.
 
압웨일러 박사 외에 바이로치 박사와 PIR을 책임졌던 캐시 우(Cathy Wu) 박사가 공동 책임자로 내정됐다. 우 박사 또한 워싱턴 D.C.에 위치한 조지타운대학병원의 생화학 및 분자생물학 교수이자, 국립생의학연구재단의 부회장, 그리고 생물정보학 소장을 맡고 있다. 바이로치 박사는 기존의 자원들을 하나로 결합하는 것이 단백질 동정 작업의 자동화와 발전을 꾀할 새로운 도구를 우리에게 선사할 것이라고 그 의의를 밝혔다. 이를 통해 모든 것을 하나의 집중된 자원으로 통합하게 될 것이고 특히 캐시 우 박사가 개발한 도구들까지 통합된다는 점이 고무적이라는 설명이다.
 
NHGRI는 UniProt의 책임 지원 기관으로 미화 300만 달러를 출연한다. 기타 다른 NIH의 참여 기관들을 지원금 규모 순서대로 살펴 보면, NIGMS가 100만 달러, NLM이 46만 달러, 국립정신보건연구소(National Institute of Mental Health)가 30만 달러, 국립연구자원센터(National Center for Reseach Resources)가 10만 달러, 국립치과?두개안면연구소(National Institute of Dental and Craniofacial Research)가 5만 달러 등이다.
 
공적 자금을 지원받는 프로젝트인 관계로 UniProt의 자료는 무료로 이용할 수 있으며, 시기적절한 방법을 통해 그 내용들이 공개될 예정이다. UniProt의 새로운 웹사이트도 마련될 예정이며 주소는 http://www.uniprot.org이다.
 
NHGRI는 미국 보건복지국(Dept. of Health and Human Services)의 정부 기관인 NIH의 산하 27개 연구 기관 가운데 하나이다. 미 전국에 걸친 연구 및 교육, 직업 개발 사업 지원은 NHGRI의 대외연구부(Division of Extramural Research)가 맡고 있다.
관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용