부처연구성과
결과보다 원인이 중요, 인공지능 암진단 알고리즘 개발
- 등록일2021-01-05
- 조회수3525
-
성과명
결과보다 원인이 중요, 인공지능 암진단 알고리즘 개발
-
연구자명
김성영, 박경식
-
연구기관
건국대학교 의과대학
-
사업명
기본연구사업, 바이오의료기술개발
-
지원기관
과학기술정보통신부
-
보도자료발간일
2021-01-05
- 원문링크
-
키워드
#인공지능 #생물정보학 #정밀의학
- 첨부파일
핵심내용
결과보다 원인이 중요, 인공지능 암진단 알고리즘 개발
일관성과 높은 해석력 확보할 수 있는 인공지능 암진단 플랫폼 실마리
□ 국내 연구진이 미국 메모리얼 슬로언케터링 암센터 연구진과 함께 새로운 형태의 암진단 인공지능 플랫폼을 소개했다.
□ 한국연구재단(이사장 노정혜)은 김성영 교수(건국대학교) 연구팀이 메타 분석 기반 기계학습 알고리즘을 이용해 높은 신뢰도로 암을 구별할 수 있는 인공지능 플랫폼을 개발했다고 밝혔다.
□ 의학 분야에서는 동일한 주제에 대한 다양한 연구결과를 통합해 결과의 일관성을 평가하고 통계적 정확성을 높이는 기법으로 메타분석 연구가 활발하게 이루어지고 있다.
※ 메타분석은 유사한 주제로 실시된 개별연구에 나타난 연구 추정치를 공통된 효과크기로 전환하여 실험결과를 객관적이고 일반화시키는 방법으로 근거중심의학의 핵심이 되는 통계기법이다.
□ 건국대 연구팀은 암조직의 유전자 발현 및 관련 생물경로를 메타분석 기반의 알고리즘을 이용해 통합하고 이를 인공지능을 위한 학습재료로 사용하였다.
○ 연구팀은 기계학습 알고리즘을 메타분석과 결합시켜 보다 강건한 모델(MLMA, machine learning-based meta-analytic methods)을 구축하였다.
□ 유전체 빅데이터는 보통‘차원의 저주'라 불리는 고차원 문제에 직면하는데 연구팀은 비선형 주성분 분석과 생물경로를 이용한 차원축소 방법이 모델의 일반성과 해석력을 크게 끌어올리는 것을 확인했다.
□ 이렇게 만들어진 알고리즘을 실제 암맹 갑상선암 샘플에 검증한 결과 거의 완벽한 분류 성능을 나타냈다. 갑상선암의 여러 아형을 테스트한 결과 높은 정확도로 이들 아형까지도 구분해냈다.
○ 노화관련 질환인 점을 고려하여 노화인자를 교정한 고위험군에서도 이 모델의 성능을 확인하였다.
□ 유전체 발현 데이터는 연구자 및 수행기관, 분석플랫폼 별로 예측인자와 모델이 상이해 메타분석 및 생물경로 기반의 알고리즘은 보다 객관적이고 해석력이 뛰어나다는 설명이다.
○ 실제 연구팀은 다중오믹스 분석을 통해 갑상선암 관련 생물경로의 조절인자를 찾아내 모델의 해석력을 극대화했다.
상세내용
논문명 |
Highly accurate diagnosis of papillary thyroid carcinomas based on personalized pathways coupled with machine learning |
저널명 |
Briefing in Bioinformatics |
키워드 |
인공지능(machine learning), 생물정보학(bioinformatics), 정밀의학(precision medicine), 갑상선암 (papillary thyroid carcinomas) |
DOI |
https://doi.org/10.1093/bib/bbaa336 |
저 자 |
김성영 교수(교신저자/건국대학교), 박경식 교수(제1저자/건국대학교), 김성훈 (공저자/건국대학교), 오정헌 교수 (공저자/메모리얼 슬론 캐더링 암센터) |
1. 연구의 필요성
○ 최근 인공지능 의학의 관심이 크게 증가하고 다중오믹스 데이터와 기계학습을 활용한 예측 기술은 암 진단 및 치료의 혁신적인 미래의료 기술로 기대되고 있으나 예측 인자 및 모델이 연구자별, 센터별 그리고 분석 플랫폼 별로 상이해 보다 객관적이고 신뢰할 수 있는 모델의 발굴 및 검증 요구가 높아지고 있다.
○ 또한 기계학습을 통한 모델링은 대부분 해석이 어려운 경우가 많아 예측의 정확도 뿐 아니라 모델의 해석력 또한 모델의 성능을 평가하는 데 매우 중요한 요소로 인식되고 있다.
2. 연구내용
○ 메타분석은 독립적이지만 유사한 관련 연구들의 데이터의 통계량을 통합해 결과의 일관성을 평가하고 통계적 정확성과 검정력을 높이는 기법으로 개별 연구들에서 간과했던 중요한 다른 결과변수에 대한 효과 추정치를 산출할 수 있게 된다.
○ 메타분석은 근거중심의학의 핵심이 되는 통계기법이다. 본 연구팀은 자체 개발한 생물경로 기반 기계학습 알고리즘을 메타분석과 결합시켜 보다 강건한 모델(MLMA, machine learning-based meta-analytic methods)을 구축하였다
※ 근거중심의학 (Evidence-based medicine) : 임상적인 의사결정의 근거로 단편적인 임상 경험이나 질병 메커니즘에 근거한 추론보다는 정교하게 설계되고 잘 수행된 연구 즉, 무작위 대조시험(randomized controlled trial)이나 메타 분석(meta-analysis) 등의 결과를 바탕으로 한 과학적 근거에 기반을 둔 의학적 방법론
○ 우선 다중 코호트를 표준화시킨 후, 비선형 주성분분석을 이용해 개별 생물경로에 매핑, 벌점 기반의 기계학습과 파라미터 최적화 알고리즘을 이용해 갑상선암의 핵심 생물경로 예측인자를 추출하였다.
○ 다중 코호트 병합과 개별 생물경로를 이용한 차원축소 방법이 학습 모델의 일반성과 전이성을 크게 증가시키는 것을 확인하였고 실제로 이 모델은 갑상선 암의 여러 아형을 암맹코호트에서 거의 완벽하게 분류하였다.
○ 갑상선 암은 대표적인 노화관련 질환으로 노화인자를 교정한 고위험군 분류에서도 이 모델은 탁월한 성능을 보였다.
○ 또한 다중오믹스 및 생존분석을 통한 생물경로의 조절인자 및 예후인자를 찾아내 모델의 해석력을 극대화했다.
3. 기대효과
○ 인공지능 알고리즘이 새롭게 찾아낸 핵심 갑상선암 관련 생물경로는 갑상선암 신약개발에 중요한 단초를 제공할 것으로 보인다.
○ 개발된 알고리즘은 다른 암에 쉽게 확대 가능하고 딥러닝 등 결과 해석이 어려운 다른 기계학습 알고리즘과는 달리, 회귀 및 경로 분석 기반의 알고리즘으로 원인 분석 및 결과의 일관성을 중시하는 임상에서 선호하는 인공지능 솔루션을 제공할 것으로 기대된다.
연구 이야기
□ 연구를 시작한 계기나 배경은?
정밀의학은 모델의 정확도도 중요하지만 일관성과 해석력이 중요하다. 또한 공개된 빅데이터를 이용해 연구자별, 센터별 차이를 교정해 보다 신뢰할 수 있는 결과를 도출하는 것이 중요하다. 최신의 인공지능 알고리즘에 생물경로 기반의 메타분석을 접목해 보다 강건한 모델을 만들 수 있지 않을까 하는 생각에 연구를 시작하게 되었다.
□ 이번 성과, 무엇이 다른가?
다른 인공지능 알고리즘과 달리 인공지능 모델의 정확도 뿐 아니라 모델의 일관성 및 해석력에 많은 중점을 둬 예측 및 진단 뿐 아니라 암진행의 새로운 분자 생물학적 기전을 발굴하는 데 좋은 툴로 활용될 수 있다.
□ 실용화된다면 어떻게 활용될 수 있나? 실용화를 위한 과제는?
정밀의학 플랫폼의 훌륭한 레퍼런스로 활용될 수 있다. 새로운 암특이 생물경로 발굴해 신약발굴 단서 제공한다. 보다 강건한 모델링을 위해 희귀 타입의 종양 샘플 확보, 과도한 샘플 불균형을 고려한 모델링이 필요하고 임상의학자가 쉽게 접근할 수 있는 엔드유저 친화적 인터페이스 구축 등이 실용화를 위한 과제로 남아있다
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
관련정보
지식
동향