본문으로 바로가기

기술동향

KISTI DATA INSIGHT 제35호 : 미래기술 위크시그널 2024

  • 등록일2024-02-05
  • 조회수2112
  • 분류기술동향 > 종합 > 종합
  • 자료발간일
    2024-01-25
  • 출처
    한국과학기술정보연구원
  • 원문링크
  • 키워드
    #미래기술#위크시그널#성장예측 시스템
  • 첨부파일

 

 

미래기술 위크시그널 2024


 

◈ 목차

⑴ 위크시그널 자동탐지 및 성장예측 시스템
⑵ 미래기술 위크시그널 2024
 미래기술 위크시그널 2024 목록

 

 

◈본문

1. 위크시그널 자동탐지 및 성장예측 시스템

1.1. 위크시그널 자동탐지 프로세스


◎︎ KISTI 미래기술분석센터는 2021년 위크시그널 자동탐지 알고리즘을 개발한 이후, 2021년과 2022년에 이어 2023년에도 위크시그널을 탐지하여 결과를 제시함

◎︎ 과학기술분야 위크시그널 탐지를 위해 SCOPUS 데이터베이스를 활용하였고, 최근 5년간의 데이터에 <그림 1>의 자동탐지프로세스를 적용하여 2024 위크시그널 586개를 탐지함



(1단계) 키워드집합 추출

- SCOPUS에 포함된 22가지 문헌 종류 중, Article, Book, Book Review, Business Article, Book Chapter 등 다섯 가지 유형의 문헌의 서지 데이터 추출

- 16,213,944개 문헌의 제목, 초록, 저자키워드에 대하여, N-gram 알고리즘을 적용하여 9,010,890개 키워드/키워드구문 추출

- 초기 키워드목록에 대하여 TF_IDF와 5년 시구간 내의 성장 경향성 조건을 적용하여 70,815개 키워드 목록 도출


조건1. TF_IDF >= 0.8

조건2. 경향성(tendency) = 빈도수(후반3년) - 빈도수(전반3년) > 0


(2단계) 키워드활동성 측정

- 1단계 키워드목록에 대하여 최근 규모성과 활동성을 측정하여 최신 떠오르는 키워드 “팝핑키워드”를

10,015개 선별함


조건3. 규모성(scale) = 빈도수(최근3년) >= 9

조건4. 활동성(activeness) = 빈도수(최근3년)/빈도수(23년) >= 0.5

 


<표 1> 위크시그널 자동탐지 프로세스 분석대상 및 결과 관련 연도별 통계


 


<그림 1> 데이터기반 위크시그널 자동탐지 프로세스



(3단계) 팝핑키워드그룹 자동생성

- 키워드 관계를 자동 측정하기 위하여 위크시그널 탐지를 위해 사용한 SCOPUS 5년 데이터에 대하여 워드임베딩 모델을 구축하였고, 워드임베딩 모델을 이용하여 키워드 쌍의 거리를 측정

∙ 워드임베딩 모델은 FastText 알고리즘을 이용

- 수명이 3년 이내인 신규등장 팝핑키워드와 3년 초과인 일반 팝핑키워드의 경우, 연관 키워드와의 거리 특성이 다른 모습으로 나타나는 것을 확인함

∙ 기존 팝핑 키워드는 연관 키워드와의 거리가 가깝게 모여있는 상태로 존재하는 반면, 신규 등장한 팝핑키 워드는 연관 키워드와의 거리가 비교적 먼 상태로 존재

- 신규 등장 팝핑키워드와 일반 팝핑키워드의 특성이 다르므로, 키워드그룹 생성방법을 다르게 적용

∙ 최근 3년 이내 신규 등장한 팝핑키워드의 경우, 거리 0.3 이내 연관 팝핑키워드 집합에 대하여 clique를 탐지하여 키워드 그룹 도출

∙ 수명이 3년 초과인 일반팝핑 키워드의 경우, 거리 0.1 이내 연관 팝핑 키워드 집합에 대하여 connected component를 탐지하여 키워드 그룹 도출



<그림 2> (좌) 연결컴포넌트(connected component)와 (우) 클리크(clique)와 병합과정








...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

관련정보

자료 추천하기

받는 사람 이메일
@
메일 내용