본문으로 바로가기

정책동향

합성생물학과 글로벌 환경 거버넌스 동향

  • 등록일2025-10-20
  • 조회수187
  • 분류정책동향 > 플랫폼바이오 > 바이오기반기술

 

 

합성생물학 지식·정보 허브

 

◈본문


1. 서론: 합성생물학의 등장


□  합성생물학은 유전자 편집, 유전체 해독·합성, 자동화, 데이터베이스, 기계학습·인공지능을 결합해 생물시스템을 설계·재설계하는 접근으로, 기존 생명공학의 점진

적 개선을 넘어선 설계공학적 패러다임으로 부상


□  지난 20여 년간 생명공학은 CRISPR/Cas9 같은 유전자 편집 도구의 발전으로 급변하며, 과거보다 훨씬 정밀하고 비용 효율적인 유전자 조작이 가능하게 변화

○  유전체 분석 비용은 1990년대 대비 백만 배 이상 하락했고, ENA(유럽핵산아카이브)는 54억 개 서열/30.7조 염기, GenBank는 2억5천만 게놈 수준의 데이터를 축적 중

○  수십억 개의 유전적 서열을 포함하는 디지털 데이터베이스가 구축되었고, 기계 학습 기술이 이를 활용해 유전 질환 식별이나 백신 개발 등을 가속화


□  이러한 모든 발전을 일반적으로 ‘합성생물학’이라는 용어로 포괄적으로 분류하며, 현대 생물공학의 다양한 기술, 응용 분야, 제품들을 지칭하는 포괄적인 개념으로

인식

○  유전 물질, 생물학적 시스템을 설계, 제조, 개량하는 모든 활동을 포함하고, 기후 변화 대응이나 생물다양성 손실 완화와 같은 환경 문제 해결에 기여할 잠재

력과 함께 이중용도의 환경적 위험도 내포하고 있다고 인식

○  합성생물학의 명확히 정의하거나 개념적 경계를 구분하기는 쉽지 않지만, 일부에서는 특정 응용 분야나 특정 유형의 유전자 변형 생물체(GMO)를 가리키는

좁은 범위의 용어로 인식하는 한편, 다른 일부는 생물기술 자체와 거의 동어로 사용

○  이러한 정의상 문제를 해결하기 위해 CBD 당사국총회 결정 XIII/17은 합성생물학을 “현대 생명공학의 추가 발전이자 새로운 차원”으로 정의하며, 유전물질·

생물체·생물시스템의 이해·설계·제조·수정을 가속·용이화하는 과학·기술·공학의 결합으로 설명




2. 생성형 AI와 디지털 시퀀스 정보(DSI)


□  유전적 코드가 유전적 시퀀스 데이터베이스에 저장되면서 생물학적 다양성의 기반이 디지털화되며, 과거에는 고비용이었던 DNA 시퀀싱은 이제 며칠 만에 수십억 달러 규

모의 인간 게놈 프로젝트의 40배에 달하는 유전 정보를 해독할 수 있을 정도로 비용 효율적이자, 방대한 양의 데이터를 생산하는 수준에 이르게 됨

○  최근 몇 년간 대규모 언어 모델(LLM)의 개발과 확산은 과학적, 상업적, 규제적 환경을 전례 없는 방식으로 변화

○   단백질 구조를 아미노산 시퀀스에서 예측할 수 있는 AI 모델인 AlphaFold는 수십 년간 현대 생물학을 괴롭혀온 난제인 단백질 구조 예측 문제를 해결


LLMs의 주요 응용 사례:

▶ AlphaFold: 단백질 구조 예측 문제를 해결한 AI 모델로, 공개 저장소의 단백질 데이터로

훈련되어 단백질 설계 분야를 혁신하고 상업적으로 빠르게 응용

▶ GenSLMs: 수백만 개의 원핵생물 유전자 시퀀스로 훈련된 유전체 규모 언어 모델로,

SARS-CoV-2 바이러스의 진화 동력을 예측하는 데 사용

NVIDIA, Meta, Alphabet과 같은 산업 거인들이 이러한 유전체 언어 모델의 개발을

주도하고 있으며, 이는 광범위한 상업적 잠재력을 가지고 있지만 정치적 위험도 증가



1) 디지털 시퀀스 정보(DSI)와 접근 및 이익 공유(ABS)

□  유전 물질의 활용은 생물다양성 보전을 위한 자원 동원 문제와 오랫동안 연결되어 옴

○  1992년 생물다양성 협약(CBD)은 유전자 자원 제공자(국가, 지역 사회)와 사용자 (제약 산업, 식물 육종 등 상업적 사용자, 비상업적 공공 연구자) 간의 양자 협정을 중심으로 한 접근 및 이익 공유(ABS) 규제 프레임워크를 수립

○  국제법은 유전자 자원 이용이 공정한 이익 공유를 가능하게 하는 법적 및 제도적 체계와 연계되어야 한다는 원칙을 널리 규정


□  지난 10년 이상 디지털화가 국제 ABS 체제에 미치는 영향에 대해 고민해오고 있으며, 일반적으로 관련 국제 협약은 물리적 표본에만 적용되며, 그 디지털 표현에는 미적용

○  CBD 제2조는 유전자 자원을 "유전적 기능 단위를 포함하는 물질"로 정의하지만, 디지털 시퀀스 정보는 "물질"로 간주되지 않고 있으며, 생물기술 연구 및 개발이 물리적 표본에서 디지털 표현으로 이동함에 따라 국제 ABS 체제는 점차 관련성을 잃어가고 있었고, 최근에야 정책 입안자들은 ABS와 디지털 시퀀스 정보의 도전 과제에 대한 해답을 찾기 시작

○  이러한 발전은 빅테크 기업들이 차세대 AI 모델 훈련을 위해 공공 유전 데이터베이스의 상당 부분을 이미 확보한 시점에 이루어지고 있으며, 이는 잠재적으로 상당한

상업적 이익을 창출할 수 있으며, 이 중 일부는 보존에 할당될 수 있고, AI 모델의 존재 자체가 훈련 데이터를 제공하기 위해 충분한 생물다양성을 필요로 하기 때문

-  미국은 CBD나 BBNJ 협정의 당사국이 아니기 때문에, AI 모델 훈련에 사용되는 디지털 시퀀스 정보의 미래 규제는 유럽 연합이 취할 조치에 크게 좌우

-  또한, 일부 공공 유전자 데이터베이스가 호스팅하는 데이터의 무제한 상업화를 허용하지 않는 등 지적 재산권 관련 미해결 문제가 존재

-  LLM이 대부분 블랙박스이기 때문에, 특정 모델의 훈련에 사용된 DSI의 출처와 적용 법적 조건을 증명하는 것은 실질적으로 어렵거나 불가능할 수 있어, 이러한 이유로 유전체 LLM을 생물다양성 보존에 활용하는 데 따른 규제적 도전은 방대



2) 생물안전성

○  유전체 LLM은 매우 특정한 생물안전성 문제를 제기하며, 대부분의 관할 지역은 불확실한 특성 및 환경적 영향을 가진 유전자 변형 생물체(GMO)의 환경 방출 전에 의

무적인 위험 평가를 실시

※  유럽 연합의 2001년 고의적 방출 지침(2001/18/EC)에 따르면 GMO 위험 평가는 위험 요소 식별, 노출 평가, 위험 특성 분석을 포함하며, 비교 대상의 사용이 핵심 원칙


○  그러나 유전체 LLM으로 설계된 GMO에는 이 접근 방식이 반드시 적용될 수 없으며, 사용자는 환경 복원을 위해 특정 특성을 가진 유기체의 유전적 서열을 생성하도록 LLM에 요청할 수 있지만, 모델 출력을 안내하는 논리를 반드시 이해할 수 있는 위치에 있지 않을 수 있음


○  더욱이, 환각(hallucination)은 LLM의 내재적 특성으로 나타나며, 이는 유전적 환각으로 이어져 예측 불가능하고 바람직하지 않은 결과를 초래할 수 있고, 사용자가 모델의 내부 작동 원리를 완전히 이해하지 못할 경우, 해당 GMO와 관련된 위험을 방출 전에 평가하기 어려움도 존재


...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용