본문으로 바로가기

기술동향

식물유전체학의 가능성과 기술적 문제

  • 등록일2004-11-03
  • 조회수12050
  • 분류기술동향
  • 자료발간일
    2005-02-26
  • 출처
    KISTI
  • 원문링크
  • 키워드
    #식물유전체학#식물 유전체학

식물유전체학의 가능성과 기술적 문제


전문연구위원 / 임번삼 

 


1. 식물 유전체학과 메타볼로믹스

□ 식물게놈의 정보를 전사·번역의 결과로 나타난 표현형의 한 형태인 대사물총체(metabolom)를 해석함으로써 프로테옴(proteome)과 트란스크립톰(tranome)의 게놈정보 매체의 흐름에 대한 기작이 조만간 해명될 것으로 보인다. 특히 메타볼롬의 해석방법인 메타볼로믹스(metabolomics)가 게놈 이후의 유망기술로 부각되고 있다. DNA의 게놈정보를mRNA가 전사해 리보좀으로 이동하는 tranome, 리보좀에서 단백을 합성하는 proteome, 그렇게 합성된 기능성 단백에 의해 대사작용이 일어나는 정보가 metabolome이다. 앞으로 대사작용에서 나온 생리현상에 대한 physiome이 등장할 것으로 전망된다.  따라서 tranome에서 proteome까지가 게놈정보의 실행을 위한 매체의 흐름이라면, metabolome은 게놈정보의 실행결과 나타난 표현형의 일부라 할 수 있다. Metabolomics의 특징은 ①이종생물간에 호완성이 있고, ②게놈정보가 필요치 않으며, ③여러 기술을 필요로 하는 것이다.

□ 식물의 메타볼롬은 환경·영양상태·유전형 등의 변화에 의해 변동된다는 보고가 있다. 메타볼로믹스와 관련과학(tranome·proteome)의 통합해석에 대한 기대가 높지만, 식물의 거동은 아직 밝히지 못했다. 과거의 기술로는 식별하기 어려운 미세한 표현형을 해석하기 위한 시도가 메타볼로믹스에 의해 이루어지고 있다. 구미 벤처기업에서는 실용화된 변이식물체 라이브러리의 대량 검색법의 목적은 유용형질과 원인 유전자의 관계를 밝혀 상업적으로 이용하려는 것이다. 메타볼로믹스는 유전자배열 정보와는 독립적으로 운용되며, 게놈분석이 안 된 식물에 적용된다는 점이 -ome과학과 다르다. 따라서 메타볼로믹스 기술의 표준화가 필요하다.

□ 메타볼로믹스의 최종목표는 대상 생물에 함유된 모든 대사물질의 총체에 대한 확인이다. 수만 개에 이르는 대사물질은 일시분석이 불가능하므로, 혼란을 피하기 위해 Fiehn(2002)의 분류기준을 널리 이용한다.


○ 표준화합물분석(Target analysis): 특정 대사물질에 대한 해석법으로, 특정한 생합성계 효소유전자의 기능을 해석하는데 이용한다.

 

○ 대사물 프로파일링(Metabolite profiling): 시료 제조법과 분석법에 의해 제한받는 특정 대사물군에 대한 동정 및 정량법으로, 보통 수십개 대사화합물을 실험대상으로 한다. 특정대사의 전체 및 교차경로의 기능해명에 이용한다.

○ 대사물총체 해석(Metabolomics): 분석법으로 관찰되는 모든 대사물의 정량분석 결과에 기초한 해석법으로, 수십 내지 수천 종을 대상으로 한다. 핑거프린팅(Finger printing: FP)이 대표적이며, 유전형의 해석에 이용한다.


○ 대사물지문 해석(Metabolic finger printing): 대사물 총체에 근거한 패턴을 해석하는 방법이다. 주로 스펙트럼법을 이용하지만, 대사화합물의 정보는 얻어지지 않는다. 고용량처리법의 비교·해석이나 분류에 이용하며, 다른 메타볼로믹스법과 병용해 비교한다.
 
2. 메타볼로믹스의 기술요소
 
□ 메타볼로믹스의 다양한 구성요소에서 발생하는 오차를 줄이기 위해 각단계마다 생물·유기화학·분석화학·생물정보·생명과학 분야의 고도의 기술이 필요하다. 식물 메타볼로믹스는 식물의 재배→시료채취→유도체화 및 전처리→분리·분석→데이터의 변환→다변량해석(多變量解釋)에 의한 데이터 마이닝의 순서로 진행된다.


○ 식물의 재배: 메타볼로믹스의 재현성에 영향을 주는 것이 분석대상 생물의 개체 간의 편차이다. 식물은 미생물이나 세포의 배양에 비해 균일성이 부족하다. 온도와 빛을 조절하는 인공 기상기기의 내부 위치에 따라 미묘한 환경변화가 일어나므로 개체 생육에 영향을 준다.  식물재배용 흙은 로트 별로 다르며 수분조절이 어려워 스트레스의 요인이 된다. 막스프랑크연구소에서는 온도·빛·수분을 정밀히 제어하는 온실에서 식물을 배양한다. 개체 편차를 줄이는 방안으로 정기 교체와 수경재배를 생각할 수 있다. Fukusaki 등(2004) 등은 세라믹 튜브로 뿌리에 물을 공급해 재배한 식물체를 시료로 사용했다.

○ 시료채취: 시료채취의 시기·채취 부위·채취량 등을 일정하게 해야 재현성이 향상된다. 해석대상은 대사물의 종류·함수량 등에 따라 분석기기를 선택한다. 예컨대 표준화합물 분석시 추출 후 용매 분획과 미니컬럼으로 정제해 대사물질을 분리·농축할 경우, 추출·분획에 여러 단계가 있으므로 목적대사물질이 결실될 우려가 있다.  대사물 프로파일링에서는 친수성·저분자·고분자 등의 대사물질군의 해석이 중심이 되므로, 추출·분획 조작이 적지만, 여러 종류를 다량 취급할 경우 표준물질 분석에서와 유사한 실험오차가 발생한다. 추출율과 재현성을 높이려면 시료를 믹서나 볼 분쇄기로 균질하게 파쇄해야 한다.  식물의 이차대사물질은 표준물질 분석법으로 하며, 친수성 저분자나 일차대사물질의 추출은 대사물질 프로파일링에 의한다. GC/MS분석용 잎의 대사물의 시료조제는 Oliver Fiehn(막스프랑크연구소)의 방법에 따른다.
 
○ 유도체화 및 전처리

- 기기분석으로 대사물질의 유도체화가 필요한 경우 휘발성분은 GC/MS로 분석하지만, 실리카화 등의 유도체화가 필요하다. HPLC분석에서 자외선이나 형광에 검출할 경우에도 유도체화가 필요하다. 이 경우, 특이성과 재현성 유무가 중요하므로 유도체화 조건과 안정성에
대한 검토가 필요하다.

- 안정 동위체에 의한 유도체화 과정은 다음과 같다.  이 실험에서 가장 많이 사용하는 질량분석은 협잡물이 있으면 시료의 이온화율이 저하되는 이온억제(ion supession)로 정량치가 치명적 손상을 받으므로 안정 동위체희석법에 의한 상대정량분석법이 검토되고 있다. 안정 동위체 표지화물과 비표지화물을 질량분석계로 분리한 후, 각 피크를 면적비에서 상대적으로 정량한다. 대사물질의 해석에 안정 동위체희석법을 이용한 사례는 34S를 이용한 유황대사 연구, 메틸화에 의한 포스트 라벨링 및 15N-질소원을 이용한 in vivo표지법 등이 검토단계이다.
프로테옴에서는 isotope coded affinity tag(ICAT)을 이용한다.

○ 분리 분석

- 이 과정은 메타볼로믹스에서 중요한 단위조작으로, 크로마토그래피나 전기영동에 의한 분리와 질량분석·자외선분광·전기화학검출 등의 정량분석을 결합해 실시한다. 메타볼롬의 데이터로서의 품질은 해상도와 정량성에 의해 정의된다. 해상도의 순서는 모세관전기영동
(CE)>GC>LC의 순서이다. CE를 많이 이용하지만, 향후 모든 시료의 분석이 가능한 LC가 주목을 받을 전망이다.


- Nakanishi 등(2002)은 입자충전형이 아닌 일체형 실리카겔 컬럼을 개발했는데, 공극율이 80% 이상이므로 배압이 낮고, 고속분석이 가능하다. Fukusaki 등(2004)은 여기에 모노리스 실리카겔 컬럼을 연결해 폴리프레놀의 검출에 성공했다. 50∼200 μm(ID)의 실리카 튜브에서도 형성되며, 1m 이상의 모세관 모노리스 실리카겔 컬럼으로 Tanaka 등은 이차원 마이크로 HPLC시스템을 개발해 10배 이상의 피크용량(>1,000)을 실현해 곧 실용화할 계획이다.

- 초임계 유체를 매개로 한 크로마토그래피(SFC)가 소수성 화합물의 분리에 효과적이며, 다차원 검출계로 중복 피크를 다변량해석을 하여 분리한다. 최근에 개발된 FT-ICR-MS은 질량을 정밀 분석하고, 크로마토그래피를 이용한 분리조작이 없이 여러 대사물질을 동시에 분석할수 있다. 정량성은 검출계의 작동범위에 의존한다. 가장 많이 이용되는 질량분석기는 크로마토그래피를 이용한 협잡물의 사전제거가 필수적이다. FT-ICR-MS는 해상도를 우선하므로 정량성이 떨어지며, 자외선검출법은 감도는 낮으나 협잡물의 영향을 거의 받지 않는다.

- 구조결정에 많이 이용되어 온 NMR은 크로마토그래피에 의한 분리과정을 제거하고 대사물질을 총체적으로 평가하는 대사물 지문해석법(metabolic finger printing: MFP)으로 바뀌고 있는데, 시료를 다량 필요한 것이 단점이다. 최근, 각종 크로마토그래피에 연결한 LC-NMR
이 개발되어 상세한 해석이 가능하므로, 표준물질분석이나 대사물질 프로파일링에 이용될 것으로 보인다.


- 혼합물 측정용 DOSY는 펄스자장경사 NMR을 응용한 이차원 NMR로, 각 물질의 확산계수(D)의 크기에 따라 NMR의 흡광도를 분리한다. 즉, 분자량에 의한 분리가 가능하다. FT-IR은 화합물의 적외선 흡광도를 측정하는 것으로, MFP에 이용된다. 조작이 간편하고 처리용량이 많아 클러스터링(clustering)에 효과적이다. 현미경을 결합한 현미FT-IR은 조직절편 상에서 맵핑(mapping)과 영상화가 가능하다.

 

○ 데이터의 변환: 여러 변량데이터를 동시 취급하는 메타볼로믹스에서 데이터해석은 복수 변량간의 관계를 해명하는 다변량해석법을 많이 이용하지만, 사전에 여러 분석법에서 얻은 자료들을 수치로 변환시켜야 한다. 또한 각 시료의 데이터 수가 같지 않으면 해석할 수 없으므로 데이터의 일치화가 필요하다. 분광 데이터로 해석하는 경우, 분광장치의 특성이나 환경에 의해 영향을 받으므로 전처리가 필요하다.  데이터의 전처리법은 ①소음제거법, ②베이스라인 보정법, ③분석촉진법, ④규격화법 등으로 나눈다. 분광데이터를 이용하는 대표적 전처리법은 스무싱(smoothing)·분광 차이·미분처리·베이스라인 보정·파형(波形)분리·중앙화·스케일링 등이 있다.


○ 다변량해석에 의한 데이터 마이닝
- 다변량해석에는 중회귀분석·판별분석·주성분분석·클러스터분석·인자분석·정준(正準) 상관분석 등이 있는데, 데이터의 구조나 목적에 따라 선택한다. 식물 메타볼로믹스에서 많이 사용하는 탐색적 데 이터해석(explanatory analysis)은 많은 데이터 특성을 조사해 데이터가 가진 정보를 판독하려는 것이 목표이다.

- 다변량해석은 간단한 원리이지만 통계지식을 요구하며, 메타볼로믹스를 이해하기 위한 필수항목으로, 주성분분석(PCA)·계층적 클러스터분석(HCA)·계층적 클러스터의 해석에 대해 잘 해설해 준다.  PCA의목적은 가능한 한 적은 변수로 될 수 있는 한 많은 정보를 파악해 집약시키려는 것이다. 즉 상호 관련된 p개의 관측변수로 된 다변량 데이터에서 “상호 교차하는 p개의 합성변수로 된 다변량 데이터를 만드는 수법”이다. 처음의 P개 변수 간에 상관성이 강할수록 새 합성변수를 만들 때 적은 합성변수로 원 데이터의 변동을 기술할 수 있게 된다. 즉, PCA는 가능한 한 적은 주성분으로 원 데이터의 변동을 설명할 수 있는 주성분을 합성하는 방법이다.


- 실제로 PCA의 계산결과가 이용되는 분야는 코스트와 로딩(loading)의 산포도이다. 코스트는 주성분 공간에서 각 시료의 좌표인데, 이들을 플로트한 산포도는 시료 간의 관계를 나타낸다. 가까이 있을수록 비슷한 성질을 나타내므로, 몇 그룹으로 나눌 수 있다. 로딩은 주성분 축(고유 벡터)의 계수로, 각 주요 성분에 대해 어느 변량이 가장중요하며 불필요한지 보여준다. 양자를 비교하면 특정성분에 의한 데이터의 특징을 판독할 수 있게 된다.


- PCA 다음으로 HCA는 유전계통수의 작성에 많이 이용된다.  유사성에 따라 데이터를 계층 분류하는 방법으로, 세분류에서 대분류까지 클러스터 사이의 관계를 이해하기 쉽게 만든다. 데이터의 세팅 중에 두 시료간의 거리를 비교해 수형도(樹形圖)를 작성한다. 클러스터의 통합계산은 최단거리법·최장거리법·중심법·점증법 등이 있다. 클러스터의 분리가 명확한 경우, 링크법에 의한 결과가 달라지지만, 수형도에는 거의 양향이 없다. 희박한 클러스터를 최장거리법이나 중심법(重心法)에 적용하면 서로 다른 분류를 나타내므로 전자를 위주로 한다. 두 클러스터가 접근한 경우는 점증법이 적합하다. 중심법으로 클러스터의 결과가 다르게 나오면 더 광범위한 비교를 한다.
 
- HCA의 결과는 시각적으로 이해하기 쉬운 수형도로 나타나지만, 가지(枝)의 길이는 링크된 가지 간의 거리에 비례하며, 그 길이는 양자의 유사성을 나타낸다. 비계층 클러스터의 해석에 종종 이용되는 자기조직맵핑(SOM)은 탐색적 데이터의 해석법으로 유용하다. SIMCA법은
기지 시료의 각 분획별 주성분의 모델로 미지 시료를 분석하는 방법인데, 식물 메타볼로믹스에 유용한 수단이 된다. 그 밖에 KNN·PCR·PLS 등의 회귀분석법이 있다.


○ 메타볼로믹스의 도구로서의 가능성: 메타볼로믹스와 다른 “옴” 과학(-ome science)의 연관해석으로 유전자 기능을 고용량으로 처리하는 기술이 표준화 단계에 와 있다. 목적을 한정시킨다면, 이미 메타볼로믹스는 유용한 분석도구로 이용할 수 있는 단계에 와 있다


- 정량성과 해상도는 어느 편이 더 중요한가?  이 문제는 분석목적이 생물표지(biomarker)와 지문해석(finger printing)의 어느 쪽을 우선할지에 따라 달라진다. 표현형이 다르게 연동되는 대사물질(biomarker)을 탐색하려면 해상도와 용량을 우선해야 하며, 이 경우 시스템은
FT-ICR-MS가 가장 적합하다. 지문해석을 우선해 미지 검체의 클러스터를 분류하려면 정량성과 재현성을 중시해야 하며, 이 경우 시스템은 GC-MS 및 FT-IR이 적합하다.

- 집중화할 것인가, 전체적으로 할 것인가? 대사물의 표준이 설정된 경우는 집중화를 하며, 표준화합물분석과 대사물 프로파일링이 적합하다. 필요에 따라 배양조건을 변경하거나 경시적으로 시료를 채취한다. 표현형의 차이가 명확하지만, 대사가 명확치 않으면 전체적인 바
이오표지법으로 검색하는 편이 유리하다.


- 지문해석법은 어떤 경우에 유용한가? 표현형이 불분명한 변이주나 형질변이체의 해석은 메타볼로믹스가 유용하다. 지문분석으로는 클라스를 분류할 수 있다.

- 메타볼로믹스의 데이터 재현성: 재현성에는 같은 실험실에서 같은 측정기기로 같은 규격을 분석해 같은 결과를 얻는 repeatability, 실험장소·실험자·측정기기 등은 변경하더라도 같은 규격을 분석하면 같은 결과가 얻어지는 reproducibility의 두 가지가 있다. 전자는 실험과학의 필수조건이므로, 부거치(敷居値)를 높게 설정하든가, 관측지수 화합물을 줄이고, 정량분석치의 정확도를 떨어뜨려야 한다. 메타볼롬은 해상도가 높아 실험에 세심한 주의가 필요하다. 후자는 각 질량분석기 간에 표준규격이 설정되지 않은 한 해상도가 떨어지며 에러가 많이 발생한다.


- 메타볼로믹스의 추구방향 : 메타볼로믹스에는 편차가 발생한다. 지질(lipidomocs)·펩티드(peptidomics)·RNomics 등이 대표적인 사례이다. 앞으로 실험목적에 따라 다양한 -omics가 더 탄생할 것으로 보인다.
 
3. 결론
 
□ 메타볼로믹스는 장래의 유용한 기술이지만, 아직 표준 운용법이 설정되지 않은 상태이므로 식물분석에 이용하려면 과거의 방법으로는 해결되지 않는 과제를 연구대상으로 삼는 것이 바람직하다. 하드웨어는 개발되고 있지만, 아직 소프트웨어가 개발단계에 있기 때문이다. 이 기법은 확립된 방법이지만, 각자가 독립적인 운용방법을 개발해 사용하는 것이 연구의 독자성을 확보는 기회가 될 것이다.

 
전문가 제언
□ 21세기에 밝혀진 인간게놈에 대한 구조연구는 다른 동식물과 미생물로 대되고 있다. 동물은 쥐·생쥐·멍게·원숭이 등을 포함해 20여 종, 물은 애기장대·벼 등을 포함해 10종 이상, 미생물은 코리네형 세균을 위시해 100여 종이 넘는다. 바야흐로 게놈시대에 들어선 느낌이다.
이러한 게놈의 구조가 밝혀지면서 포스트게놈 과제는 당연히 게놈의 능을 규명하는 구조유전체학(structural genomics)에서 기능유전체학 (functional genomics) 및 유전정보(bioinformatics)를 해석·저장·이용하는 생물정보학(bioinformatics)으로 연구 대상이 바뀌고 있다.


□ DNA는 유전정보를 가진 엑손과 유전자쓰레기로 일컬어지는 인트론으로 구성돼 있으며, 엑손은 5% 정도에 불과하다. 인트론의 존재이유에 대한 규명 연구가 활발히 진행되고 있으나, 아직 거의 밝혀지지 않은 상태이다. 이러한 DNA 전체를 게놈이라 하는데, 이 속에 생명의 신비를 간직한 유전정보가 모두 포함돼 있다. 게놈정보는 mRNA에 전사되고, 다시 리보좀에서 해석되어 효소 등의 기능성 단백질과 생체를 구성하는 핵심적인 구조단백질을 합성하게 된다. 이러한 단백질의 종류는 인간게놈프로젝트를 주도했던 피터 콜린스는 100만여 종을 상회할 것으로 전망했다. 이토록 많은 단백질 분자들이 상호작용하면서 신비한 생명현상을 연출하는 것이다.

□ 게놈정보의 산물인 대사물질 전체를 가리키는 메타볼롬에 대한 연구가 오늘날 생명과학분야의 핵심과제로 부상하고 있다. 특히 식물 메타볼롬에 대한 연구는 인류가 당면한 식량문제와 에너지 부족을 해결하기 위한 해결되어야 할 근본과제라 생각된다. 이 보고는 이러한 첨단 분야에 대한 기술적 진척상황과 문제점을 중심으로 소개하고 있어 매우 흥미있는 내용을 담고 있다.
 

자료 추천하기

받는 사람 이메일
@
메일 내용