핵심내용
맞춤형 헬스케어 위한 산화스트레스 예측 모델 개발
-생체 및 임상지표 등을 고려하여 산화스트레스 정량화 입증-
□ 한국연구재단은 권오란 교수(이화여자대학교)와 Jildau Bouwman(네덜란드 응용과학연구기구, TNO) 공동 연구팀이 한국인의 산화스트레스 위험을 진단하기 위한 머신러닝 모델을 개발 및 검증했다고 밝혔다.
□ 빅데이터 분석과 인공지능의 발전은 많은 양의 코호트 데이터와 임상 관련 정보를 토대로 환자에게 적합한 의료정보를 제공하거나 진단 및 치료 오류를 줄여주는 데에 도움을 주고 있다.
※ 코호트 데이터 : 특정기간 동안 공통된 특성이나 경험을 갖는 사용자 집단의 데이터를 의미함. 어떤 원인이 어떤 결과를 가져오는가를 연구하는 방법의 기초 자료로서 시간적인 개념을 포함함.
○ 그러나 기계학습 알고리즘을 적용하여 산화스트레스 관련 만성 질환의 위험을 사전에 줄이고 정밀영양을 제공하려는 연구는 거의 없는 실정이다.
※ 정밀영양 : 식품, 개별 영양소, 식생활 및 생활방식에 대한 사회 문화적 영향, 개인과 집단의 건강에 대한 사회적 인프라 등 다양한 요인을 고려하여 개인별 영양 상태를 파악할 수 있음.
□ 연구팀은 광범위한 인간 대상 연구에 대한 공간방법론의 활용을 테스트하기 위한 개념 증명 연구를 통해 이 문제를 해결하고자 하였다.
※ 공간방법론(health space model) : Bouwman et al. (2012)이 제안한, 통계적 시각화 방법의 일종. 사전에 정의된 생물학적 지표들을 기반으로 개별 피험자의 건강상태를 투영할 수 있다는 방법론.
○ 또한 다양하고 복잡한 데이터의 스펙트럼에서 변수의 특성을 고려해 강력한 예측력과 해석가능성으로 산화위험을 판별하는 모델을 개발하기 위해 머신러닝 방법을 사용하였다.
□ 나이, BMI, 식사의 질, 혈액지표 등과 같은 16가지 변수를 종합적으로 고려해 사용자의 산화스트레스의 위험 정도를 정량화할 수 있는 예측하는 모델을 개발했다.
○ 검증데이터에서 민감도는 0.923(95% CI: 0.879-0.967), 정확도는 0.891(95% CI: 0.854-0.928) 수준으로 나타났다.
□ 이번 연구에는 2015년 4월부터 2018년 8월 사이에 건강검진을 위해 서울시 보라매병원에 내원한 2,454명의 데이터가 사용되었다.
○ 남은 과제는 국가 코호트 자료를 이용하여 개발한 모델을 검증하고 다양한 민족국가 인구의 자료와 비교 및 분석하는 것이다. 이에 연구팀은 만성질환 정량화 모델 개발 관련 연구를 계속할 계획이다.
□ 건강한 인구 집단의 산화스트레스 위험을 계층화, 예측하는 모델을 제시함으로써 식생활 및 생활습관과 관련된 만성질환을 예방할 수 있는 건강관리 전략 수립에 도움이 될 것으로 기대하고 있다.
□ 과학기술정보통신부와 한국연구재단이 추진하는 바이오의료기술개발사업(전통천연물 기반 유전자-동의보감사업) 지원으로 수행된 이번 연구의 성과는 항산화분야 국제학술지 안티옥시단츠(Antioxidants)에 7월 16일 게재되었다.
상세내용
논문명
|
A Machine Learning Algorithm for Quantitatively Diagnosing Oxidative Stress Risks in Healthy Adult Individuals Based on Health Space Methodology: A Proof-of-Concept Study Using Korean Cross-Sectional Cohort Data
|
저널명
|
Antioxidants
|
키워드
|
elastic net regularized generalized linear model (정규화 일반화 선형모델), diagnostic model (진단모델), oxidative stress (산화스트레스), composite biomarker (복합바이오마커)
|
DOI
|
https://doi.org/10.3390/antiox10071132
|
저 자
|
권오란 교수(공동 교신 저자/이화여자대학교), 힐다 보우만 (Jildau Bouwman, 공동 교신 저자/네덜란드 응용과학연구기구), 김유진(제1저자, 이화여자대학교), 김연수(제1저자, 이화여자대학교), 황지영(제2저자, 이화여자대학교), 팀 브룩 (Tim J. van den Broek, 제3저자/네덜란드 응용과학연구기구), 오범조 교수(제4저자/서울특별시보라매병원), 김지연(제5저자, 서울과학기술대학교), 수잔 워페리스(Suzan Wopereis, 제6저자/네덜란드 응용과학연구기구)
|
1. 연구의 필요성
○ 우리 몸에서 노화는 지속적인 산화스트레스를 유발하여 만성 염증 상태로 이어질 수 있다. 적절하게 조절되지 않으면 대사증후군, 심혈관질환, 신경퇴행성 질환, 암, 식이 생활 습관 관련 만성 질환 장애를 일으킬 수 있다.
○ 많은 연구에서 흡연, 노화, 지질 과산화산물인 말론디알데하이드(malon dealdehyde), 체질량지수(BMI)를 포함한 변수를 산화스트레스와 관련된 요인으로 확인했다. 그러나 진단환경에서의 반응은 단일 변수를 기반으로 할 수 없다. 복합 바이오마커는 프로세스와 상호작용을 설명하는 미묘한 변화를 이해하는 데 도움이 될 수 있다. 또한 여러 변수 각각은 산화 스트레스의 종합적 결과에 중요한 역할을 할 수 있다.
○ 이에 연구팀은 다변수 매개 변수화에 의해 결정된, 건강 상태를 투영하는 건강 공간 개념을 사용하여 개인의 산화스트레스 상태를 정량화하는 방법을 증명하고자 하였다.
※ 건강공간(health space) : 건강을 개선하기 위해 생체 지표를 기반으로 다차원적으로 표현된 각 개인의 영양 상태
2. 연구내용
○ 본 연구는 서울특별시 보라매병원의 후향적 코호트 데이터를 사용 하였다. 건강 공간 방법론을 기반으로 건강한 대조군과 산화성 질병사례를 선택함으로써 양 극단의 기준을 먼저 설정하였다.
※ 공간방법론(health space model) : Bouwman et al. (2012)이 제안한, 통계적 시각화 방법의 일종. 사전에 정의된 생물학적 지표들을 기반으로 개별 피험자의 건강상태를 투영할 수 있다는 방법론.
※ 후향적 코호트 데이터 : 기존에 있는 기록이나 기억을 통해 특정 인자 노출여부와 질병발생여부에 대한 자료를 얻는 연구의 데이터.
○ 그런 다음 라쏘(LASSO) 및 엘라스틱넷(elasticnet) 회귀 방법과 10번의 교차 검증을 통해 산화 스트레스 상태를 식별하는 기계학습 알고리즘을 개발하였다. 모델의 미세 조정을 위해 총 16가지의 변수가 선택되었다.
○ 다시 말해 나이, BMI, 식사의 질, 혈액지표 등과 같은 16가지 변수를 종합적으로 고려해 사용자의 산화스트레스의 위험 정도를 정량화할 수 있는 예측하는 모델을 개발했다.
○ 예측 곡선은 검증 데이터에서 수신자 조작 특성* 값이 0.949로, 우수한 민감도 (0.923)와 특이도 (0.855)를 나타냄을 확인하였다.
※ 수신자 조작 특성(receiver operating characteristic, ROC) : 적중 확률 대 오적중 확률의 그래프이다. 진단의 민감도 및 특이도를 확인할 수 있으며 영역의 값이 1에 가까울수록 적중 확률이 높고 0에 가까울수록 오적중 확률이 높다.
○ 알고리즘을 통해 산화스트레스 위험을 개인별로 계층화할 수 있으며 식이 및 생활습관 관련 만성 질환을 사전적으로 예방할 수 있는 건강관련 정보를 제공할 수 있다.
3. 기대효과
○ 본 연구는 식습관, 신체활동, 음주, 흡연 등 생활 요인에 근거한 맞춤형 영양 서비스 기술 제공의 토대를 마련했다는 것에 의의가 있다.
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.