기술동향
KISTI DATA INSIGHT 제35호 : 미래기술 위크시그널 2024
- 등록일2024-02-05
- 조회수2112
- 분류기술동향 > 종합 > 종합
-
자료발간일
2024-01-25
-
출처
한국과학기술정보연구원
- 원문링크
-
키워드
#미래기술#위크시그널#성장예측 시스템
- 첨부파일
미래기술 위크시그널 2024
◈ 목차
⑴ 위크시그널 자동탐지 및 성장예측 시스템
⑵ 미래기술 위크시그널 2024
⑶ 미래기술 위크시그널 2024 목록
◈본문
1. 위크시그널 자동탐지 및 성장예측 시스템
1.1. 위크시그널 자동탐지 프로세스
◎︎ KISTI 미래기술분석센터는 2021년 위크시그널 자동탐지 알고리즘을 개발한 이후, 2021년과 2022년에 이어 2023년에도 위크시그널을 탐지하여 결과를 제시함
◎︎ 과학기술분야 위크시그널 탐지를 위해 SCOPUS 데이터베이스를 활용하였고, 최근 5년간의 데이터에 <그림 1>의 자동탐지프로세스를 적용하여 2024 위크시그널 586개를 탐지함
(1단계) 키워드집합 추출
- SCOPUS에 포함된 22가지 문헌 종류 중, Article, Book, Book Review, Business Article, Book Chapter 등 다섯 가지 유형의 문헌의 서지 데이터 추출
- 16,213,944개 문헌의 제목, 초록, 저자키워드에 대하여, N-gram 알고리즘을 적용하여 9,010,890개 키워드/키워드구문 추출
- 초기 키워드목록에 대하여 TF_IDF와 5년 시구간 내의 성장 경향성 조건을 적용하여 70,815개 키워드 목록 도출
조건1. TF_IDF >= 0.8 조건2. 경향성(tendency) = 빈도수(후반3년) - 빈도수(전반3년) > 0 |
(2단계) 키워드활동성 측정
- 1단계 키워드목록에 대하여 최근 규모성과 활동성을 측정하여 최신 떠오르는 키워드 “팝핑키워드”를
10,015개 선별함
조건3. 규모성(scale) = 빈도수(최근3년) >= 9 조건4. 활동성(activeness) = 빈도수(최근3년)/빈도수(23년) >= 0.5 |
<표 1> 위크시그널 자동탐지 프로세스 분석대상 및 결과 관련 연도별 통계
<그림 1> 데이터기반 위크시그널 자동탐지 프로세스
(3단계) 팝핑키워드그룹 자동생성
- 키워드 관계를 자동 측정하기 위하여 위크시그널 탐지를 위해 사용한 SCOPUS 5년 데이터에 대하여 워드임베딩 모델을 구축하였고, 워드임베딩 모델을 이용하여 키워드 쌍의 거리를 측정
∙ 워드임베딩 모델은 FastText 알고리즘을 이용
- 수명이 3년 이내인 신규등장 팝핑키워드와 3년 초과인 일반 팝핑키워드의 경우, 연관 키워드와의 거리 특성이 다른 모습으로 나타나는 것을 확인함
∙ 기존 팝핑 키워드는 연관 키워드와의 거리가 가깝게 모여있는 상태로 존재하는 반면, 신규 등장한 팝핑키 워드는 연관 키워드와의 거리가 비교적 먼 상태로 존재
- 신규 등장 팝핑키워드와 일반 팝핑키워드의 특성이 다르므로, 키워드그룹 생성방법을 다르게 적용
∙ 최근 3년 이내 신규 등장한 팝핑키워드의 경우, 거리 0.3 이내 연관 팝핑키워드 집합에 대하여 clique를 탐지하여 키워드 그룹 도출
∙ 수명이 3년 초과인 일반팝핑 키워드의 경우, 거리 0.1 이내 연관 팝핑 키워드 집합에 대하여 connected component를 탐지하여 키워드 그룹 도출
<그림 2> (좌) 연결컴포넌트(connected component)와 (우) 클리크(clique)와 병합과정
...................(계속)
☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.
지식