BioINpro
(BioIN + Professional) : 전문가의 시각에서 집필한 보고서 제공[New GPT 시대의 바이오기술] 과학기술 위크시그널과 바이오 미래유망기술
- 등록일2023-10-12
- 조회수3523
- 분류플랫폼바이오 > 바이오융합기술
-
저자/소속
양혜영/한국과학기술정보연구원 미래기술분석센터
-
발간일
2023-10-12
-
키워드
#바이오#미래유망기술#위크시그널#기술예측
- 첨부파일
-
차트+
?
차트+ 도움말
과학기술 위크시그널과 바이오 미래유망기술
양혜영 / 한국과학기술정보연구원 미래기술분석센터
◈ 목차
1. 기술예측과 위크시그널
2. 과학기술 위크시그널 자동담지 방법론
가. 1단계: 키워드 집합 추출
나. 2단계: 키워드 활동성 측정
다. 3단계: 키워드그룹 자동 생성
라. 4단계: 위크시그널 해석
3. 과학기술 위크시그널 포커스영역 및 다이내믹스
4. 바이오 미래유망기술
5. 결론
◈본문
1. 기술예측과 위크시그널
기술예측은 현재 기술의 미래 동향을 예측하거나 잠재적으로 유망한 기술을 미리 파악하는 활동을 가리킨다. 이 용어는 1960년대에 처음 등장하였다. 제1차와 제2차 세계대전 그리고 달 탐사와 같은 역사적 사건을 경험하면서, 기술이 인류의 미래를 형성하고 미래의 변화를 주도하는 중요한 역할을 할 수 있다는 인식이 높아지면서 기술예측의 중요성이 부각되었다. 이러한 과정에서 기술 예측에 대한 인식이 형성되었다. OECD는 1961년에 설립된 기구로, 미래 기술이 기업과 국가에 제공하는 기회와 사회에 미치는 영향을 미리 파악하기 위해 설립 초기부터 노력하고 있다. OECD는 정책 결정자들이 기술을 이해하고, 더 나아가 기술예측을 수행하는 데 필요한 이해를 촉진하기 위해 노력하고 있으며, 이러한 노력의 일환으로, 1967년에 "Technological Forecasting in Perspective"(Jantsch, 1967)라는 보고서를 발표하였다. 이 보고서는 기술예측의 특성, 방법, 기술혁신 및 기술전략 등에 대한 설명을 담고 있는 거의 최초의 보고서로서, 기술예측 분야의 기반을 마련하는 데 기여한 것으로 평가된다. 이후 기술예측은 Martino(1993), UN산업개발기구(2005), Woon 등(2008), Halaweh(2013), Rotolo 등(2015) 여러 관점으로 재조명되며 발전하고 있다.
한편 전략적 관리자로 잘 알려진 Ansoff는 1975년 “Managing Strtegic Surprise by Response to Weak Signals”(Ansoff, 1975)라는 제목의 논문에서, 갑작스러운 외부변화로부터 받게 될 충격을 관리하기 위해 외부환경변화를 모니터링하는 것이 중요하다고 설명하였고, 갑작스러운 변화를 야기할 수 있는 작은 신호를 의미하는 위크시그널이라는 용어를 사용하였다. 위크시그널은 처음 등장한 작은 신호이므로 경험적 외삽으로는 설명하기 어렵고 중요성이 아직 불분명하지만 미래에 대한 정보를 담고 있는 징후를 뜻한다. 2019년 겨울 전 세계적 코로나19 팬데믹이 발생하면서 인류는 이전과는 완전히 다른 시대를 맞이하게 되었고 큰 충격을 받게 되었다. 장기간에 걸쳐 축적된 빅데이터와 인공지능 기술이 발달하고 있음에도 코로나19로 인한 팬데믹과 그 영향력은 미처 제대로 예측하지 못하였다는 점에서 그동안 다방면에서 이루어진 예측 방법에 한계가 있음을 알게 되었다. 장기간의 데이터 분석에 기반한 예측은 그동안 경험하지 못했던 새로운 사건이 발생하는 것에 대해서는 예측하기 어렵기 때문에 이에 대한 보완이 필요하다. 위크시그널 모니터링 방법의 필요성이 대두한 것이다.
본고에서는 최근 새롭게 개발된 이머징 위크시그널 자동탐지 알고리즘과 그 결과를 설명하고자 한다. 과학기술 위크시그널 중 바이오분야의 위크시그널을 활용하여 도출된 바이오 미래유망기술에 대해서도 설명한다. 위크시그널 자동탐지 알고리즘은 장기 데이터에 기반한 기술예측 방법론을 보완하여 미래기술에 대한 최신 트렌드를 도출하는데 도움을 줄 수 있고, 과학기술정책과 기술전략 수립을 위한 근거 정보로 활용될 수 있을 것이다.
2. 과학기술 위크시그널 자동탐지 방법론
한국과학기술정보연구원은 최근 과학기술문헌 빅데이터로부터 전문가의 도움없이 위크시그널을 자동탐지하는 방법을 개발하였다.(Yang et al., 2023) 활용한 데이터베이스는 SCOPUS 논문 데이터이다. 논문데이터베이스 중 SCOPUS는 포함된 저널이 매우 많고, 상당수의 conference proceeding을 포함하고 있어, 최신 위크시그널을 탐지하는데 적합하다. SCOPUS 논문데이터에는 22가지 문헌 종류가 포함되어 있는데, 그 중 Article, Book, Book Chapter, Conference proceeding, Review 등 5가지 문헌을 사용하였다.
위크시그널 자동탐지 방법은 다음 [그림1]의 4단계 프로세스로 이루어진다.
그림 1. 데이터 기반 위크시그널 자동탐지 프로세스 |
가. 1단계: 키워드 집합 추출
초기 키워드 목록은 두 가지 키워드 목록을 합하여 만들어진다. 첫 번째 키워드 목록은 문헌의 제목과 초록에서 추출한다. 제목과 초록을 합친 텍스트를 토큰화하고 N-gram 알고리즘을 이용하여, N=5에 해당하는 키워드 구문까지 추출한다. 두 번째 키워드 목록은 문헌의 저자 키워드 목록이다. 두 가지 키워드 목록을 합해 초기 키워드 목록을 구성한다. 그 다음 초기 키워드 목록에 대한 기초 스크리닝을 위해 TF-IDF를 계산하여 0.8 이상 키워드를 선별한다. 또한 5년 시구간에서 후반 3년과 전반 3년간 단어의 등장 빈도수 차이가 0 이상인 증가하는 경향성의 키워드를 선별하였다.
나. 2단계: 키워드 활동성 측정
1단계 키워드 목록에 대하여 키워드의 규모성과 활동성을 측정한다. 키워드 규모성은 최근 3년간 출연 빈도가 일정 규모 이상일 조건을 의미하는데, 연도별 3회 이상은 등장하는 키워드, 즉 최근 3년간 9회 이상 등장하는 키워드를 선별하였다. 활동성은 지난 23년간 키워드 출연 빈도 대비 최근 3년간 출연 빈도의 비율을 뜻한다. 최근 급부상하는 키워드를 선별하기 위하여 0.5 이상의 활동성 조건을 적용하였다. 2단계 선별기준을 통과한 키워드를 팝핑 키워드(popping keyword)로 명명하였다. 2021년 기준 7,291개 팝핑 키워드를 도출하였고, 2022년 기준 8,299개 팝핑 키워드를 도출하였다.
다. 3단계: 키워드그룹 자동 생성
키워드의 관계를 자동으로 측정하기 위해, 최근 5년간의 SCOPUS 논문 텍스트에 대한 워드임베딩 모델을 구축하였다. 본 연구에서는 FastText 모델을 이용하였다. 워드임베딩 모델은 키워드 사이의 문맥적 유사도를 계산해서 유사도가 크면 거리가 가깝게, 유사도가 작으면 거리가 멀게 키워드가 위치한다. 이로서 임의의 팝핑 키워드 쌍에 대한 거리를 측정하였다. 거리데이터를 기반으로 팝핑 키워드 네트워크를 구현하고 거리 임계값 0.1 이내의 조건을 적용하여 팝핑 키워드 네트워크가 키워드그룹으로 자동 분리되는 연결 컴포넌트(connected component) 방법을 고안하였다.
한편 기존 팝핑 키워드는 연관 키워드와 문맥적 연관성이 충분히 축적되어 거리가 가까운 반면, 신규 등장 팝핑 키워드는 연관 키워드와 거리가 가깝지 않은 경우가 대부분이었다. 따라서 신규 등장 팝핑 키워드는 거리 임계값 0.3 이내의 조건을 적용한 후, 팝핑 키워드 네트워크에서 서로 완전히 연결된 클리크(clique)를 추출하는 방식으로 위크시그널을 도출하였다.
위크시그널을 위한 팝핑 키워드 그룹을 생성할 때, 키워드 수가 100개 이상이면 작은 신호로 보기 어렵다는 판단하에, 키워드 수는 2개 이상 100개 미만으로 설정하였다.
그림 2. (좌) 연결컴포넌트(connected component)와 (우) 클리크(clique) 방식의 위크시그널 생성 방법 |
라. 4단계: 위크시그널 해석
3단계 과정을 거쳐 생성된 위크시그널은, 탐지 시점 기준, 2021년 총 391개, 2022년 총 439개를 도출하였고, 각각 위크시그널2022, 위크시그널2023으로 발표되었다. 팝핑 키워드가 추출된 논문이 속한 저널은 SCOPUS에 의해 복수의 주제분류코드가 부여된다. 위크시그널을 구성하는 팝핑 키워드의 주제분류코드를 활용하여 위크시그널의 주제 분야를 확인하였다. SCOPUS 주제 분류는 Health Sciences, LifeSciences, PhyiscalSciences, SocialSciences&Humanities, Multidisciplinary 등 5개 대분야 아래 각각 총 27개 주제 분야로 구성되어 있다. 위크시그널을 구성하는 팝핑 키워드가 속한 주제분야를 모두 확인하여 가장 많이 등장하는 주제분야를 해당 위크시그널의 주제 분야로 정하였다. 팝핑 키워드, 주제분야, 그리고 최신 논문내용 등을 바탕으로 위크시그널에 해당하는 과학기술내용을 연구진이 모두 검토하였다. 그 결과 위크시그널은 거의 대부분의 주제분야에서 탐지되었고, 최근 기술트렌드에 해당하는 내용임을 확인하였다. 팝핑 키워드로부터 위크시그널을 탐지하고, 더 나아가 주목해야 할 포커스영역을 도출하기까지 과정과 위크시그널2022 지도는 다음의 [그림3]과 [그림4]에서 확인할 수 있다.
그림 3. 팝핑 키워드, 위크시그널, 그리고 10대 포커스 영역 도출 과정 |
그림 4. 위크시그널 2022 지도 |
3. 과학기술 위크시그널 포커스영역 및 다이내믹스
연구진은 2021년에 탐지된 391개 위크시그널2022에 대해서 검토한 후 주목해야 할 10대 포커스영역을 선정하여 발표하였다. 딥러닝 그 다음의 기술, 기생컴퓨팅과 대응기술, 플랫폼 기반 커뮤니티의 확대, 에너지 클라우드의 시대, 유연한 기업이 만드는 미래, 새로운 탄소물질의 등장, 인류와 지구의 공생, 온·오프라인 정신건강, DNA에서 RNA로의 영역 확대, 위드코로나 또는 넥스트코로나 등이 10대 포커스영역이다. 각 포커스영역별로 탐지된 주요 위크시그널과 내용은 [표1]과 같다.
[표1] 위크시그널2022의 10대 포커스영역과 주요 위크시그널 내용
2022 포커스영역 | 주요 위크시그널과 내용 |
[1] 딥러닝, 그 다음의 기술 (Beyond Deeplearning) | ▸deepfakes: 진짜 같은 가짜 데이터 생성 ▸face anti-spoofing: 가짜와 진짜를 구분하기 위한 방법 ▸zero-shot learning: 데이터 없이 학습 또는 유사 분야에 응용되는 인공지능 |
[2] 기생컴퓨팅과 대응기술 (Parasitic Computing) | ▸cryptojacking: 컴퓨터에 몰래 침입해 코인 채굴 ▸cyber insurance: 사이버 안전을 보장하는 보험 |
[3] 플랫폼 기반 커뮤니티의 확대 (Platformmunity) | ▸platformisation: 플랫폼화, 플랫폼 기반 경제 ▸mobile crowdsensing: 모바일 크라우드센싱 |
[4] 에너지 클라우드의 시대 (Energy Cloud) | ▸multienergy microgrid, nanogrid, power-to-X: 다양한 소스의 재생에너지를 생산, 전송, 저장, 관리 ▸electricity theft: 전력망 도둑과 보안 감시 |
[5] 유연한 기업이 만드는 미래 (Agile/Leagile Entrepreneurship) | ▸digital entrepreneurship: 디지털 전환을 위한 디지털 기업가정신 ▸cyber-physical manufacturing: 스마트팩토리를 위한 사이버 물리 시스템 ▸ESG disclosure: 기업의 사회 책임 대응 |
[6] 새로운 탄소 물질의 등장 (New Carbon) | ▸penta-graphene, n-graphdiyne: 새로운 탄소동소체 ▸ml-MoS2: 나노응용물질 |
[7] 인류와 지구의 공생 (Symbiosis) | ▸ecological civilization: 새로운 생태 시스템 ▸carbon trading price: 탄소중립과 탄소거래 제도 ▸nano- and microplasitcs: 미세플라스틱과 환경오염 ▸rhizomicrobiome: 미생물 기반 친환경농업 |
[8] 온·오프라인 정신건강 (On-Off Mentality) | ▸promis-29: 신체적, 정신적, 사회적 건강의 중요성 ▸cyber sickness: 가상공간에서의 정신적 고통 ▸coronaphobia: 코로나포비아 |
[9] DNA에서 RNA로의 영역 확대 (DNA and RNA) | ▸epigenetic editing: 후성 유전체 변이 편집 ▸m6A modification: RNA 조절 기술 ▸COVID-19, nsp12 : 코로나바이러스와 백신 |
[10] 위드코로나 또는 넥스트코로나 (COVID-19) | ▸COVID-19: 코로나19 팬데믹 ▸micro learning, e-wallet: 코로나19 팬데믹으로 인한 비대면 교육, 비대면 결제 등 새로운 라이프스타일 ▸circular business model: 포스트코로나를 위한 산업 패러다임 변화 |
2022년에 탐지된 439개 위크시그널2023에 대해서는 주로 위크시그널2022와 비교하여 나타나는 변화를 파악하기 위한 검토가 이루어졌고, 이는 위크시그널 다이내믹스라는 이름으로 연구되었다. 전체 위크시그널은 391개에서 439개로 전년 대비 12.3% 증가하였고, 팝핑 키워드의 수도 7,291개에서 8,299개 13.8% 증가하였다. 위크시그널2022 중 34.5%의 위크시그널은 위크시그널2023에 그대로 남아있었고, 37.1%의 위크시그널이 사라진 것을 확인하였다. 28.4%의 위크시그널2022는 팝핑 키워드 구성이 바뀌거나 분야가 변동되는 등 변화된 형태로 남아있었다. 위크시그널2023 중 거의 절반에 해당하는 46.9%는 새롭게 등장한 위크시그널이다.
위크시그널2023 중 신규 등장한 위크시그널 사례로는 Medicine분야의 [long-covid,long-covid-19], Dentistry 분야의 [teledentistry, tele-dentistry] 등이 있다. 전년도의 코로나19 팬데믹에 이어, 후유증 등에 관한 후속 연구가 많이 진행됨에 따라 long-covid가 등장한 것으로 해석된다. 또한 코로나19 팬데믹으로 원격의료에 대한 요구가 증가하고 있는데, 치의학 분야에서도 그러한 경향이 teledentistry라는 위크시그널로 나타난 것으로 보인다.
위크시그널2023 중 위크시그널 [marine plastic pollution, marine plastics, marine plastic debris]는 Environmental Science 분야에서 Agricultural and Biological Sciences 분야로 변동되었다. 해양 플라스틱 오염이 환경과학 분야에서 주로 다루어지다가 최근 농업 및 생명과학 분야에서 연구되는 추세로 해석된다.
위크시그널2022 중 [micro/nanomotors,micro/nanomachines]는 위크시그널2023의 [micro/nanomotors, micro/nanorobots]으로 변화되어, 팝핑 키워드 하나가 사라지고 새로운 팝핑 키워드가 합류한 것을 확인하였다. 마이크로/나노모터와 함께 최근 마이크로/나노로봇의 연구가 더 확대되고 있는 것으로 이해할 수 있다.
그 외에도 위크시그널2022에 신규 팝핑 키워드가 합류하거나, 여러 위크시그널이 융합하는 등의 변화방식이 나타났다. 위크시그널을 구성하는 팝핑 키워드의 변화를 확인하여 위크시그널 다이내믹스를 분석하는 것은 미래기술 트렌드의 세부 변동사항을 이해하는데 도움이 될 수 있음을 확인하였다. [표2]는 주제 분야별 위크시그널2022와 위크시그널2023의 수를, [그림 5,6,7]은 위크시그널 다이내믹스의 변화 사례 몇 가지를 보여준다.
[표2] 주제 분야별 위크시그널2022와 위크시그널2023 개수
주제 분야 | 위크시그널 개수 | |
2022 | 2023 | |
Agricultural and Biological Sciences | 9 | 12 |
Arts and Humanities | 3 | 3 |
Biochemistry, Genetics and Molecular Biology | 22 | 23 |
Business, Management and Accounting | 25 | 14 |
Chemical Engineering | 2 | 2 |
Chemistry | 9 | 11 |
Computer Science | 63 | 76 |
Decision Sciences | 1 |
|
Earth and Planetary Sciences | 8 | 8 |
Economics, Econometrics and Finance | 1 | 4 |
Energy | 9 | 12 |
Engineering | 33 | 34 |
Environmental Science | 18 | 23 |
Health Professions | 2 | 1 |
Immunology and Microbiology | 8 | 7 |
Materials Science | 22 | 31 |
Mathematics | 12 | 7 |
Medicine | 90 | 112 |
Neuroscience | 1 |
|
Nursing | 2 | 2 |
Pharmacology, Toxicology and Pharmaceutics | 2 | 2 |
Physics and Astronomy | 8 | 11 |
Psychology | 6 | 7 |
Social Sciences | 35 | 35 |
Dentistry |
| 1 |
Veterinary |
| 1 |
Total | 391 | 439 |
그림 5. 신규 팝핑 키워드가 합류한 위크시그널 사례 |
그림 6. 다수의 신규 팝핑 키워드가 합류한 위크시그널 사례 |
그림 7. 두 개의 위크시그널이 융합한 위크시그널 사례 |
4. 바이오 미래유망기술
한국과학기술정보연구원 미래기술분석센터에서 도출한 팝핑 키워드와 위크시그널은 매우 빠르게 변화하고 있는 과학기술 분야에 대한 정보를 정확하게 탐지하는데 도움을 주는 방법이다. 위크시그널은 전 과학기술분야에 대하여 전문가 도움 없이 누락되는 분야 없이 이머징 기술신호를 탐지하는데 비교적 성공적으로 작동하였다. 각 과학기술분야별로 전문가 해석과정을 거칠 경우, 더 가치있는 통찰과 시사점 도출이 가능하다. 이에 연구진은 한국생명공학연구원 국가생명공학정책연구센터와 협력 하에 바이오 미래유망기술 선정 시 위크시그널과 팝핑 키워드 데이터를 검토하였다.
국가생명공학정책연구센터는 바이오 미래유망기술을 도출하는 프로세스와 노하우를 보유하고 있으며 관련 분야를 검토하는 전문가위원회도 확보하고 있다. 국가생명공학정책연구센터는 바이오 미래유망기술을 발굴하는 3가지 트랙, 과학기술 위크시그널 데이터 탐색, 기존 미래유망 후보기술 재평가, 최근 이슈 모니터링 등의 프로세스를 거쳐 미래유망기술 후보목록을 도출하고, 마지막 단계에서 대규모 전문가 설문조사를 통해 10대 미래유망기술을 선정한다.
그 결과 바이오 10대 미래유망기술 2022중 3개, 바이오 10대 미래유망기술 2023 중 8개 기술이 위크시그널 데이터로부터 도출되었고, 해당 기술목록은 [표3]과 [표4]와 같다.
[표3] 바이오 10대 미래유망기술 2022 중 위크시그널 기반 기술
분야 | 바이오 미래유망기술 | 관련 위크시그널 및 팝핑 키워드 |
플랫폼바이오 (Platform Bio) | 후성유전체 편집 (Epigenome editing) | epigenetic editing, epigenome editing |
레드바이오 (Red Bio) | 치료용 신경정신약물 (Mind-altering medicine) | persistent opioid use |
화이트바이오 (White Bio) | 나노물질 유래 친환경 중합체 합성기술 (Nanomaterial-derived eco-friendly polymer synthesis) | nano-chitosan, nanobiopesticides |
[표4] 바이오 10대 미래유망기술 2023 중 위크시그널 기반 기술
분야 | 바이오 미래유망기술 | 관련 위크시그널 및 팝핑 키워드 |
플랫폼 바이오 (Platform Bio) | 생체 내 면역세포 실시간 분석 (In situ immune cell live imaging/sequencing) | neutrophil-lymphocyte ratio |
레드 바이오 (Red Bio) | 개인 맞춤형 암백신 (Personalized Cancer Vaccines) | neoantigen, neoantigen expression |
임상 적용 가능 유전자편집 기술 (Clinical grade gene editing) | crispr-cas system | |
비침습적 신경조율 기술 (Non-invasive neuromodulation) | post-covid symptoms | |
그린 바이오 (Green Bio) | 배양육 대체육 고도화 (Advanced cultured meat/alternative meat) | Meat analogues |
토양 마이크로바이옴 (Biocrusts microbiome) | biocusts, rhizosphere microbiome, plant microbiome | |
화이트 바이오 (White Bio) | 합성생물학 적용 미생물 공장 (Synthetic microbial factory) | Engineered yeast |
미세플라스틱의 건강 및 생체영향 평가 (Microplastics biomonitoring) | marine litter, marine plastic pollution |
5. 결론
과학기술 문헌 빅데이터에서 자동탐색 알고리즘에 의해 도출된 위크시그널은 전 과학기술 분야에 대한 기술 트렌드를 비교적 정확하게 탐지하는 것을 확인하였다. 각 분야별 전문가들은 알고 있으나 타 분야로까지 널리 그 정보가 확산되지 않은 초기 단계의 미래유망기술과 연구분야가 비교적 누락되지 않고 탐지되었기에, 주기적 위크시그널 모니터링 방법으로 활용 가능성이 매우 크다고 볼 수 있다. 그 외에도 팝핑 키워드들의 미세한 변화와 상호작용을 바탕으로 위크시그널이 어떻게 변화하는지도 풍부한 정보를 확보할 수 있다. 따라서 과학기술 위크시그널은 과학기술정책과 미래기술 경쟁우위 선점을 위한 기술전략 수립 시에 근거 데이터로서 의미가 크다고 볼 수 있다.
또한 위크시그널 자동탐지 알고리즘에 의해 도출된 위크시그널과 팝핑 키워드 데이터는 분야별 전문가들에 의해 더 중요한 통찰을 찾아내는데 도움을 준다. 바이오 10대 미래유망기술 선정 과정에서 근거 데이터로 활용된 위크시그널과 팝핑 키워드 데이터는 전문가들에 의하여 더 깊은 이해와 풍부한 해석을 거쳐 현 시점의 글로벌 바이오 분야를 더욱 객관적이며 과학적으로 조망할 수 있도록 도와준다. 이와 같은 전문가 통찰 과정을 통해 시의성 있는 정책과 R&D 방향성 설정이 가능해진다.
올해로 세 번째 과학기술 위크시그널 탐지 프로세스가 수행되고 있고, 바이오 미래유망기술 선정 시에도 근거 데이터로 활용될 예정이다. 앞으로도 과학기술 위크시그널 탐지 프로세스가 정기적으로 수행되고 관련 연구가 많이 이루어져 위크시그널에 대한 더 깊은 이해와 더 많은 정보를 확보할 수 있기를 기대하며, 이를 바탕으로 과학기술 위크시그널이 다양한 분야의 전문가들에게 통찰력을 제공할 수 있는 정보로서 활용 가치가 확대되기를 기대한다.
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
-
이전글
- [New GPT 시대의 바이오기술] 경제안보 관점에서의 바이오 분야 글로벌 공급망 리스크 분석 및 시사점
-
다음글
- [New GPT 시대의 바이오기술] 기술다양성과 바이오기업의 수익성 간 관계
지식
동향