KPI뉴스 - 엔씨소프트-고려대, AI 대화 데이터셋 공개한다

  • 맑음제천6.3℃
  • 맑음울산15.0℃
  • 구름많음이천10.7℃
  • 맑음여수14.8℃
  • 맑음거제12.3℃
  • 흐림강화11.7℃
  • 흐림동두천10.4℃
  • 구름많음춘천8.7℃
  • 맑음고흥8.0℃
  • 맑음구미15.0℃
  • 박무백령도10.4℃
  • 맑음추풍령10.3℃
  • 맑음강릉14.0℃
  • 맑음북창원14.5℃
  • 맑음상주14.2℃
  • 구름많음울진12.6℃
  • 맑음청주13.0℃
  • 맑음임실6.7℃
  • 맑음고창군7.1℃
  • 맑음전주10.2℃
  • 맑음정읍7.8℃
  • 흐림홍천8.5℃
  • 맑음창원16.3℃
  • 맑음남원8.1℃
  • 맑음의성6.7℃
  • 맑음포항16.2℃
  • 맑음보령8.8℃
  • 맑음부산18.0℃
  • 맑음보은7.1℃
  • 구름많음인천12.5℃
  • 맑음청송군5.5℃
  • 맑음문경11.8℃
  • 맑음대구13.4℃
  • 맑음산청10.1℃
  • 구름많음울릉도15.0℃
  • 맑음장수5.7℃
  • 맑음영광군6.6℃
  • 맑음목포10.4℃
  • 맑음양산시13.8℃
  • 구름많음서울13.8℃
  • 맑음남해13.3℃
  • 맑음서청주7.2℃
  • 맑음강진군7.5℃
  • 맑음진도군6.5℃
  • 맑음진주9.6℃
  • 맑음정선군6.1℃
  • 맑음순천8.8℃
  • 맑음의령군9.5℃
  • 맑음북부산11.6℃
  • 흐림파주8.1℃
  • 구름많음수원10.3℃
  • 맑음함양군8.0℃
  • 맑음대관령3.9℃
  • 맑음봉화4.9℃
  • 맑음부안8.6℃
  • 맑음고산12.7℃
  • 맑음충주8.0℃
  • 맑음성산14.1℃
  • 구름많음속초11.4℃
  • 맑음영천8.6℃
  • 맑음순창군7.3℃
  • 맑음보성군10.9℃
  • 맑음안동8.8℃
  • 구름많음북춘천8.2℃
  • 맑음서귀포13.6℃
  • 흐림철원8.8℃
  • 맑음인제8.0℃
  • 구름많음태백7.4℃
  • 맑음부여7.0℃
  • 맑음대전10.3℃
  • 구름많음천안7.6℃
  • 맑음광양시13.1℃
  • 맑음영월7.0℃
  • 맑음세종8.9℃
  • 맑음장흥6.8℃
  • 맑음거창7.8℃
  • 맑음동해16.0℃
  • 맑음완도10.8℃
  • 맑음영덕16.7℃
  • 맑음원주9.7℃
  • 맑음제주12.1℃
  • 맑음광주11.6℃
  • 맑음북강릉12.2℃
  • 맑음흑산도12.3℃
  • 구름많음양평9.6℃
  • 맑음합천10.4℃
  • 구름많음서산8.7℃
  • 맑음영주9.4℃
  • 구름많음경주시10.3℃
  • 맑음김해시14.3℃
  • 맑음군산8.2℃
  • 맑음금산7.3℃
  • 맑음통영13.6℃
  • 구름많음홍성7.6℃
  • 맑음밀양11.1℃
  • 맑음해남5.3℃
  • 맑음고창6.4℃

엔씨소프트-고려대, AI 대화 데이터셋 공개한다

김해욱
기사승인 : 2022-04-14 15:12:25
임희석 교수 연구팀과 공동연구 진행 엔씨소프트가 임희선 고려대학교 교수 연구팀과 공동으로 구축한 AI(인공지능) 대화 데이터 '포커스 데이터셋(FoCus Dataset, For Customized conversation dataset)을 공개했다고 14일 밝혔다.

포커스 데이터셋은 이용자 개인의 페르소나(지혜와 자유의사를 갖는 독립된 인격적 실체)와 외부 지식 모두를 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여 개의 주제를 다룬 1만5000개 이상의 대화로 구성됐다.

▲ 엔씨소프트와 임희석 고려대학교 교수 연구팀이 공동개발한 'FoCus Dataset'(For Customized conversation dataset)의 대화 방식 참고 이미지. [엔씨소프트 제공]

이 데이터셋이 적용된 AI는 대화하는 이용자의 경험, 선호, 소유, 흥미 등을 파악해 위키피디아와 같은 곳에서 이야기 중인 주제에 대해 최신 지식을 실시간으로 습득, 관련 대화가 자연스럽게 이어지도록 한다.

엔씨소프트는 "기존의 일반적인 대용량 언어모델은 학습, 추론에 상당한 비용이 소요됨에도 실시간 지식을 반영하는 것에 한계가 있다"며 "포커스데이터셋은 이러한 거대 언어 모델 없이도 같은 성능의 대화 기술 구현이 가능한 것이 특징"이라고 설명했다.

엔씨소프트와 고려대 공동연구팀은 지난 2월 인공지능 학회 'AAAI 2022'에 참가해 관련 연구 논물을 게재하고 발표한 바 있다. 올해  10월에는 세계 전사언어학회 'COLING 2022'에서 데이터 활용 경진 대회 등의 연구 성과를 공유하는 워크샵을 개최할 예정이다.

이연수 엔씨소프트 랭귀지 에이랩(Language AI Lab) 실장은 "최근 NLP(Language AI Lab) 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 대화 기술들이 제안되고 있다"며 "연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정했고 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이뤄지길 기대한다"고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사