본문으로 바로가기

기술동향

연구의 창의·혁신성 제고를 위한 생성형 AI 기술 분석 및 활용 연구

  • 등록일2024-04-04
  • 조회수2093
  • 분류기술동향 > 종합 > 종합

 

 

연구의 창의·혁신성 제고를 위한 생성형 AI 기술 분석 및 활용 연구


 

◈ 목차


제1장 정책연구 개요

제2장 생성형 AI 기술의 이해

제3장 LLM을 활용한 추론 기술

제4장 창의성 확장을 위한 생성형 AI 활용 방안

제5장 연구를 위한 LLM 창의성 활용 사례

제6장 결론 및 시사점


◈본문


  • 1.정책연구 개요

  • (1)정책연구 요약

  • 연구목적

  • 생성형 AI 기술혁신이 초래하는 학술·연구 활동 전반의 변화에 대비한 효과적 대응전략 마련

  • 연구 분야에서 생성형 AI의 활용 사례를 분석하고 이를 토대로 생성형 AI의 연구 창의성 제고 방안을 모색

  • 현황 및 필요성

  • (현황) 챗GPT 열풍 등 생성형 AI에 대한 세계적 관심 및 기술경쟁 심화

  • 생성형 AI(Generative AI)의 전 세계 시장 규모는 2022년 101억 달러(약 13조원)에서 연평균 34.6% 성장해 2030년 1093억 달러(약 142조 원)로 성장할 것으로 전망(시장조사기관 그랜드뷰리서치)

  • 생성형 AI는 단순 보조수단이 아닌 압도적 효율성 향상의 도구로 역할

  • 업무 생산성을 높이고 신규 창작물을 빠른 속도로 생성하면서 산업 전반에 영향을 미칠 것으로 예상(콘텐츠 산업, IT 산업, 제조업에서의 변화가 클 것으로 예상)

  • (필요성) 생성형 AI 기술 활용 및 대응을 위한 기관 차원의 대비 필요

  • 생성형 AI의 연구현장의 분야별 활용가능성 분석 및 수요자 중심의 정책 수립

  • 연구개발의 내용 및 범위

  • 다양한 생성형 AI 모델 가운데 본 연구에서는 대규모 언어모델(Large Language Model, LLM)을 중심으로 연구를 수행함

  • 연구 분야에서의 LLM의 활용 사례 분석을 통한 LLM을 활용한 연구 창의성 제고 방안 으로서 창의적 업무 프로세스 제안

  • LLM을 활용한 연구 창의성 제고를 위한 후속 연구 방안 도출

  • 2.생성형 AI 기술의 이해

  • (1)대규모 언어 모델(LLM)

     1) Large Language Model의 역량

  • GPT4 Technical Report에서 확인하는 GPT4의 역량

  • GPT4는 2023년 3월에 OpenAI에서 발표한 Large Language Model임

  • 기존 GPT-3.5에 비해 크게 달라진 점은 이미지를 인식하고 이에 대해 text를 생성하는 것이 가능하고, 손으로 그린 웹 사이트 스케치를 코드화하는 것이 가능함

  • 공개되어 있는 문제들을 사용해서 잘 알려져 있는 공인 시험을 실시했는데, 상당히 우수한 성적을 거둠. 미국 대학 입시 SAT 수학에서 89%, AP Biology 85~100%, AP Chemistry 71~88%, AP Physics 2 66~84%, AP Statistics 85~100%)

[그림 1] GPT performance on academic and professional exams.

 

 [그림 1] GPT performance on academic and professional exams


  • 다국어 처리 능력을 확인하기 위해 MMLU (Massive Multitask Language Understanding) benchmark (57개 주제의 다지선택 문제)를 Azure Translate를 사용해서 여러 나라 언어로 번역하여 평가 시행함. 주요한 언어들에서 GPT3.5뿐만 아니라 Chinchilla와 PaLM의 영어 처리 능력보다 우수한 성능을 보임. Latvian, Welsh, Swahili 등 resource가 충분하지 않은 언어들에 대해서는 기존 모델의 영어 처리 능력보다 떨어짐.

  • GPT4는 이미지와 text를 포함한 prompt를 입력받아서 text 출력을 생성함. text, 사진, 그림, 화면 캡춰 등이 포함 문서들에 대해서도 text만으로 구성된 입력과 유사항 성능을 보임

  • TruthfulQA라고 하는 공개된 benchmark를 통해서 의도적으로 선택된 잘못된 문장들 중에서 맞는 것을 찾아내는 역량을 시험함. 초기 GPT4 모델은 GPT3.5에 비해 성능 개선이 거의 없었지만, RLHF post training을 통해서 크게 개선됨을 확인하였음.

[그림 2] Performance of GPT-4 on Truthful QA.


[그림 2] Performance of GPT-4 on Truthful QA.

  • 훌륭한 기능을 갖추었고 GPT3.5 대비 19% point 향상되는 성과를 보였음에도 불구하고 여전히 hallucination(환각)에 의한 추론 오류가 발생함.

  • 위험한 조언, 잘못된 코드, 부정확한 정보 생성을 방지하기 위해 50 여 명의 전문가를 활용하였음. 고위험 영역에서의 모델 행태를 시험해 봄으로써, 예를 들어, 위험한 화학물질 제조법 요청을 거절할 수 있는 역량을 갖추었음


[그림 3] Rate of incorrect behavior on sensitive and disallowed prompts

[그림 3] Rate of incorrect behavior on sensitive and disallowed prompts

 

 

...................(계속)

☞ 자세한 내용은 내용바로가기 또는 첨부파일을 이용하시기 바랍니다.

자료 추천하기

받는 사람 이메일
@
메일 내용