생명공학 오믹스 데이터의 표준화
Standardizations in Bio-Omics
질병관리본부 국립보건연구원 유전체센터 바이오과학정보과
Ⅰ. 들어가는 말
생명공학자들의 유명한 우스갯소리 중에 ‘칫솔은 같이 사용해도 같은 유전자 이름은 사용하지 않는다’는 이야기가 있다. 이처럼 유전자가 여러 가지 별칭을 가지고 있을 만큼 다른 분야에 비해 생명공학 분야의 표준화 속도는 느린 편이다. 그러나 근래에 들어와서 생명공학분야에서 표준화가 큰 이슈가 되고 있으며 표준화만을 주제로 하는 학회가 열리고 소모임이 활성화 되고 있다.
표준화가 활발히 추진되는 배경에는 생명공학 오믹스1) 데이터의 공유가 큰 몫을 하고 있다[1]. 과거에는 개개의 실험실에서 소규모의 연구를 진행하였으며 연구자들이 본인 데이터 외에는 관심을 가지지 않았다. 그러나 대규모의 연구가 진행되면서 데이터를 생산하는데 많은 시간과 비용이 소요되고 여러 데이터 세트를 통합하여 분석하려는 연구자가 늘어나면서 데이터를 공유하려는 움직임이 활발해지고 있다. 데이터 공유에 대한 움직임은 연구비 지원기관(funding agencies)과 학술지 발행처(journal publisher)를 중심으로 이루어지고 있다. 많은 연구비 지원기관에서는 연구비 지원시 데이터 공유를 의무화하고 있으며 학술지 발행처에서는 학술지에 게재 승인을 요청하기 전에 데이터 공개를 유도하고 있다. 많은 연구비 지원기관에서는 해당 기관의 연구비를 받아서 생산되는 데이터에 대한 정책을 수립 중이다[2]. biosharing 웹사이트에서는 데이터 공유관련 정책 및 표준화 등의 정보를 얻을 수 있다[3].
효과적으로 데이터를 공유하기 위해서는 다른 연구자들이 필요로 하는 데이터 관련 정보들이 표준화된 용어로 제시되고, 공유되는 데이터도 표준화된 형식을 사용하여야 할 것이다. 따라서 데이터를 공유하기 위해서는 크게 데이터 정보 기술형식(data informing checklists), 용어의 표준화(ontology)와 데이터 형식(data format) 등 세 분야에서 표준화가 이루어져야 한다.
|
.......(계속)
☞ 자세한 내용은 내용바로가기를 이용하시기 바랍니다.