기술동향
[마약류과학정보지] 바이오 연구를 위한 인공지능의 활용
- 등록일2023-11-03
- 조회수2905
- 분류기술동향 > 플랫폼바이오 > 바이오융합기술
-
자료발간일
2023-11-01
-
출처
식품의약품안전평가원
- 원문링크
-
키워드
#바이오 연구#인공지능#딥러닝#신경망
바이오 연구를 위한 인공지능의 활용
[마약류과학정보지] 특별기고 2
KAIST 뇌인지과학과 김대수 교수
◈ 목차
1. 특별기고
1) 마약 중독과 치료·재활의 중요성 - KIST 뇌기능연구단 임혜인, 배진희 박사
2) 바이오 연구를 위한 인공지능의 활용 - KAIST 뇌인지과학과 김대수 교수
3) 사마리탄 데이탑 빌리지를 다녀와서: 대한민국이 다시 바라보아야 할 ‘마약류 중독과 치료 재활’ - 아주대학교 이범진 교수, 제주대학교 박철훈 교수
2. 임시마약류 지정현황 분석
’11~’23년도 연도별 지정현황 및 효능군별 분류 등
3. 제66차 UN 마약위원회 회의 결과
UN 지정 국제 통제물질 소개 등
4. 2023년 신규 지정(예정) 마약류 정보
5. 마약류과학정보연구회 소식
마약류과학정보연구회 워크숍 개최
마약류과학정보연구회 세미나 개최
6. 마약류과학정보연구회 안내
◈본문
특별기고 2 바이오 연구를 위한 인공지능의 활용
바이오 연구의 한계와 인공지능
생명현상은 복잡계 유전자 및 환경 등 다양한 변수들이 세포, 조직, 개체, 생태계 등 다양한 차원에서 상호작용한 결과로 나타나는 복잡계(complex system)이다. 과학자들이 모든 복잡계 변수들을 논리적으로 이해하고 실험적으로 검증하기란 불가능하다. 따라서 전통적인 생명과학 연구기법에서는 다양한 변수를 통제하여 비교군과 대조군은 한가지만 다르게 실험조건을 만든다. 그러나 이렇게 변수 통제를 하는 과정에서 중요한 데이터가 유실되거나 인과론적 관계를 왜곡될 수 있다. 또한 현실적으로 실험현장에서 수많은 변수를 제대로 통제하는 것은 거의 불가능하다.
복잡계 바이오 연구에 인공지능의 활용은 크게 두 가지 측면에서 기여할 수 있다. 첫째, 데이터 분석의 자동화이다. 생명과학은 연구자의 노동력이 많이 든다. 특히 주석달기(annotation) 등 인간의 인지능력에 의존한 데이터 분석의 경우 주관적 오류를 줄이기 이중맹검(double blind)과 서로 다른 연구자의 중복분석을 통한 통계를 적용하므로 시간과 노력이 많이 든다.
또한 이렇게 분석을 해도 데이터의 신뢰성은 늘 도마위에 오르며 의심이 생겨도 데이터의 규모가 크기에 재검증도 어렵다. 반면 인공지능의 객관성과 정확성 그리고 신속성으로 인해 위의 모든 문제를 한번에 해결할 수 있다. 신약개발과 전임상 및 임상시험에서 발생하는 데이터를 인공지능을 통해 자동화한다면 시간과 자원을 절약하여 의미있는 결론에 빨리 도달할 수 있다.
둘째, 인공지능은 인간이 보지 못하는 것을 발견하는데 활용할 수 있다. 예를 들어 인간은 다차원 다변수 복잡계 데이터에서 그룹간 차이나 규칙성을 찾아낼 수 없으나 인공지능은 인간의 인지능력으로 무시될 만한 차이도 찾아낼 수 있다. 다만, 새로운 결과를 설득하기 위해서는 인공지능이 찾아낸 차이를 인간이 이해할 수 있는 형태로 재구성해야 한다는 문제가 있다. 그리고 재구성과정에서 앞서 언급한 scale-down 문제가 또 다시 제기될 수 있고 이러한 기술적 문제보강하기 위한 논의가 뒷받침되어야 한다. 결국 인공지능이 팩트를 찾아내면 이후 인간은 그 팩트의 실체와 구성요소에 대한 새로운 연구테마가 생기는 셈이다. 바이오 연구는 인공지능으로 인해 축소되는 것이 아니라 오히려 폭넓게 확장될 것이다.
인공지능의 탄생과 발전
인공지능은 1950년대부터 개발되기 시작한 컴퓨터 기법으로 기계가 인간과 유사한 지능적 행동을 수행하는 것을 목표로 한다. 인공지능은 이러한 인간의 지능을 모방하여 다차원 변수를 계산하는 기계이다.
일상적인 의미에서 지능적이란 여러가지 조건을 고려하여 자신에게 유리한 판단을 하는 것을 말한다. 이런 능력은 경험이나 학습 의해서 발전되고 축적되는데 마찬가지로 인공지능도 기계학습(machine learning)을 통해 지능을 갖게 된다.
컴퓨터가 세상을 이해하기 위해서 Marvin Minsky 등은 프레임(Frame)이란 개념을 제안한다. 프레임은 객체를 다양한 변수들로 정의하는데 현실 세계의 객체나 상황을 특정한 구조로 표현하여 컴퓨터가 이해하고 처리할 수 있도록 도와준다. 예를 들어, "사람"이라는 프레임은 이름, 나이, 성별, 직업 등의 속성을 가지며, "배우자 선택” 프레임은 학력, 외모, 재산, 부모, 성격 등의 속성을 가질 수 있다. 이런 프레임들은 객체의 특성을 저장하고 추출할 수 있는 구조를 제공하여 컴퓨터가 현실 세계의 지식을 모델링하고 처리할 수 있도록 한다. 세상에서 가장 복잡하다고 알려진 생명현상을 분석하는 데 적합한 이유다.
전통적인 기계학습 방법론들인 서포트 벡터 머신, 의사 결정 트리 등은 주로 수동으로 특징을 추출해야 하는 한계가 있었다.
그러나 문제 해결을 위한 데이터를 최적으로 표현하는 특징을 컴퓨터가 스스로 학습하는 것이 논리적으로 다음 단계였다. 이러한 목적으로 개발된 기법이 딥러닝이다. 딥러닝의 구조는 뇌의 신경망을 닮아 있다. 신경은 100개 이상의 입력 신호를 받을 수 있으며 이를 종합하여 하나의 출력 값을 낼 수 있다. 신경과 유사하게 딥러닝 신경망은 여러 계층(Layers)으로 구성된 모델을 통해 입력 데이터로 변환하면서 점점 더 고차원의 특징을 학습한다(Shen et al., 2017).
|그림 2| 신경의 입력-출력 계산과 딥러닝 신경망의 구조
신경망은 딥러닝 방법론의 기초적인 구조 중 하나로 꼽힐 수 있다. 이 구조는 입력층에서 출력층으로의 단방향 정보 흐름을 기반으로 하며, 복잡한 함수를 모델링하고 데이터를 기반으로 예측을 수행하는 데 있어 초기의 성공적인 사례 중 하나였다. 특히 역전파(Backpropagation) 알고리즘을 통한 훈련 방법은 더 복잡한 신경망 구조의 개발에 있어 중요한 역할을 하였다. 따라서 순방향 신경망은 딥러닝의 발전과 현대적인 신경망 아키텍처에 기반을 제공하는 기초적인 요소로 볼 수 있다(Rosenblatt et al., 1958).
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
지식
- BioINpro [KRIBB 워킹그룹] 2024 인공지능을 활용한 신약재창출 연구동향 2025-01-15
- BioINpro [첨단 바이오 연구장비] 첨단바이오 R&D 장비 개발동향과 국산화 제고 방안 2024-10-16
- BioINpro [첨단 바이오 연구장비] UK Biobank: 글로벌 연구협력을 위한 플랫폼 2024-10-15
- BioINpro [바이오 신약] 인공지능과 구조 기반 신약개발: 기회와 도전 과제 2024-08-23
- BioINwatch 전 세계 바이오 연구 커뮤니티를 위한 강력한 리소스, 영국 바이오뱅크(UK Biobank) 2024-06-20
동향