KPI뉴스 - 엔씨소프트-고려대, AI 대화 데이터셋 공개한다

  • 구름많음철원11.3℃
  • 맑음진도군13.0℃
  • 맑음합천13.6℃
  • 구름많음수원12.4℃
  • 맑음통영16.9℃
  • 맑음울산18.4℃
  • 맑음광주14.3℃
  • 맑음구미17.1℃
  • 구름많음이천12.7℃
  • 맑음보성군14.4℃
  • 맑음정읍13.6℃
  • 맑음산청13.6℃
  • 맑음백령도11.4℃
  • 맑음의령군13.9℃
  • 구름많음북춘천11.5℃
  • 구름많음인제10.1℃
  • 맑음금산11.3℃
  • 구름많음동두천12.5℃
  • 맑음진주14.5℃
  • 맑음임실12.0℃
  • 흐림동해14.2℃
  • 비홍성11.2℃
  • 맑음영주13.1℃
  • 맑음강화13.8℃
  • 맑음청송군11.8℃
  • 구름많음충주13.2℃
  • 구름많음세종11.5℃
  • 맑음밀양15.3℃
  • 구름많음원주12.3℃
  • 맑음거제18.6℃
  • 흐림북강릉12.6℃
  • 구름많음봉화10.2℃
  • 맑음순천13.7℃
  • 맑음순창군12.3℃
  • 구름많음양평11.9℃
  • 맑음경주시17.1℃
  • 맑음추풍령15.0℃
  • 맑음거창13.6℃
  • 흐림홍천10.1℃
  • 맑음청주14.8℃
  • 맑음김해시17.7℃
  • 맑음성산17.5℃
  • 맑음안동12.8℃
  • 구름많음천안11.5℃
  • 맑음남해17.2℃
  • 맑음북부산17.8℃
  • 구름많음태백13.2℃
  • 구름많음속초14.2℃
  • 맑음문경17.4℃
  • 맑음장흥12.9℃
  • 맑음완도16.8℃
  • 맑음광양시16.8℃
  • 맑음영천13.6℃
  • 맑음해남11.9℃
  • 구름많음대전13.8℃
  • 맑음울진15.1℃
  • 맑음의성11.8℃
  • 맑음북창원18.8℃
  • 구름많음강릉13.4℃
  • 맑음영광군11.8℃
  • 맑음함양군13.1℃
  • 맑음고창11.1℃
  • 맑음양산시18.5℃
  • 맑음포항18.2℃
  • 구름많음파주10.6℃
  • 맑음보령13.3℃
  • 맑음영덕17.9℃
  • 맑음상주16.3℃
  • 구름많음서산11.3℃
  • 구름많음대관령10.0℃
  • 맑음흑산도15.4℃
  • 맑음서울15.2℃
  • 맑음여수15.8℃
  • 구름많음서청주12.1℃
  • 맑음장수10.4℃
  • 맑음남원12.7℃
  • 맑음고산15.8℃
  • 맑음보은11.6℃
  • 맑음고창군11.9℃
  • 맑음서귀포17.9℃
  • 맑음부안13.1℃
  • 맑음부산21.0℃
  • 맑음영월10.9℃
  • 구름많음군산11.7℃
  • 맑음울릉도16.0℃
  • 맑음강진군12.8℃
  • 맑음창원19.4℃
  • 맑음전주14.5℃
  • 맑음인천13.8℃
  • 구름많음부여10.9℃
  • 맑음목포12.6℃
  • 구름많음춘천12.0℃
  • 구름많음정선군8.3℃
  • 맑음대구17.2℃
  • 맑음고흥15.5℃
  • 맑음제주15.5℃
  • 구름많음제천11.4℃

엔씨소프트-고려대, AI 대화 데이터셋 공개한다

김해욱
기사승인 : 2022-04-14 15:12:25
임희석 교수 연구팀과 공동연구 진행 엔씨소프트가 임희선 고려대학교 교수 연구팀과 공동으로 구축한 AI(인공지능) 대화 데이터 '포커스 데이터셋(FoCus Dataset, For Customized conversation dataset)을 공개했다고 14일 밝혔다.

포커스 데이터셋은 이용자 개인의 페르소나(지혜와 자유의사를 갖는 독립된 인격적 실체)와 외부 지식 모두를 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여 개의 주제를 다룬 1만5000개 이상의 대화로 구성됐다.

▲ 엔씨소프트와 임희석 고려대학교 교수 연구팀이 공동개발한 'FoCus Dataset'(For Customized conversation dataset)의 대화 방식 참고 이미지. [엔씨소프트 제공]

이 데이터셋이 적용된 AI는 대화하는 이용자의 경험, 선호, 소유, 흥미 등을 파악해 위키피디아와 같은 곳에서 이야기 중인 주제에 대해 최신 지식을 실시간으로 습득, 관련 대화가 자연스럽게 이어지도록 한다.

엔씨소프트는 "기존의 일반적인 대용량 언어모델은 학습, 추론에 상당한 비용이 소요됨에도 실시간 지식을 반영하는 것에 한계가 있다"며 "포커스데이터셋은 이러한 거대 언어 모델 없이도 같은 성능의 대화 기술 구현이 가능한 것이 특징"이라고 설명했다.

엔씨소프트와 고려대 공동연구팀은 지난 2월 인공지능 학회 'AAAI 2022'에 참가해 관련 연구 논물을 게재하고 발표한 바 있다. 올해  10월에는 세계 전사언어학회 'COLING 2022'에서 데이터 활용 경진 대회 등의 연구 성과를 공유하는 워크샵을 개최할 예정이다.

이연수 엔씨소프트 랭귀지 에이랩(Language AI Lab) 실장은 "최근 NLP(Language AI Lab) 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 대화 기술들이 제안되고 있다"며 "연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정했고 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이뤄지길 기대한다"고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사