KPI뉴스 - 카카오브레인, 이미지 생성 AI모델 '알큐트랜스포머' 오픈소스로 공개

  • 흐림양산시21.9℃
  • 흐림거창21.0℃
  • 흐림고산20.4℃
  • 흐림부산19.8℃
  • 흐림문경18.7℃
  • 흐림강화20.4℃
  • 흐림울산19.4℃
  • 흐림고창21.0℃
  • 흐림동두천20.2℃
  • 흐림산청20.1℃
  • 흐림추풍령19.7℃
  • 흐림인제17.3℃
  • 흐림청주23.0℃
  • 흐림원주20.1℃
  • 흐림장흥21.9℃
  • 흐림천안19.5℃
  • 흐림순창군22.4℃
  • 흐림영월18.0℃
  • 흐림대전21.4℃
  • 흐림남해21.3℃
  • 흐림수원20.9℃
  • 구름많음완도20.2℃
  • 흐림북부산21.4℃
  • 흐림김해시20.8℃
  • 흐림보령20.8℃
  • 흐림서청주20.6℃
  • 흐림구미23.0℃
  • 흐림진주19.7℃
  • 흐림통영20.8℃
  • 흐림홍성20.8℃
  • 흐림홍천19.0℃
  • 흐림군산20.9℃
  • 흐림제주21.8℃
  • 흐림남원22.4℃
  • 흐림고창군21.1℃
  • 흐림울진17.0℃
  • 흐림여수21.2℃
  • 흐림영천18.9℃
  • 흐림광주23.0℃
  • 흐림의령군20.8℃
  • 흐림고흥21.5℃
  • 흐림보성군21.7℃
  • 흐림대구20.4℃
  • 흐림속초17.4℃
  • 흐림세종20.3℃
  • 구름많음진도군18.9℃
  • 구름많음동해16.8℃
  • 흐림이천20.5℃
  • 구름많음강진군21.2℃
  • 흐림태백14.3℃
  • 흐림영덕16.9℃
  • 흐림백령도19.0℃
  • 흐림정읍21.3℃
  • 흐림북춘천18.8℃
  • 흐림순천19.7℃
  • 흐림전주21.4℃
  • 흐림서귀포22.6℃
  • 흐림포항19.2℃
  • 흐림인천22.5℃
  • 흐림목포21.4℃
  • 흐림밀양22.2℃
  • 흐림철원19.5℃
  • 흐림장수20.0℃
  • 흐림성산20.7℃
  • 흐림춘천19.3℃
  • 흐림영주18.4℃
  • 흐림경주시18.9℃
  • 흐림파주20.5℃
  • 흐림함양군21.2℃
  • 흐림임실20.8℃
  • 흐림부안20.9℃
  • 흐림의성19.4℃
  • 흐림정선군15.4℃
  • 흐림봉화16.4℃
  • 흐림북강릉16.6℃
  • 흐림서산20.1℃
  • 흐림거제20.8℃
  • 흐림강릉18.3℃
  • 흐림청송군18.5℃
  • 흐림서울22.9℃
  • 흐림양평20.2℃
  • 흐림합천21.5℃
  • 흐림흑산도19.8℃
  • 흐림안동20.1℃
  • 흐림울릉도17.5℃
  • 흐림창원20.7℃
  • 흐림금산20.1℃
  • 흐림충주19.8℃
  • 흐림보은19.1℃
  • 흐림대관령12.5℃
  • 구름많음해남20.9℃
  • 흐림영광군20.8℃
  • 흐림부여20.8℃
  • 흐림제천18.4℃
  • 흐림상주20.7℃
  • 흐림북창원21.4℃
  • 흐림광양시20.5℃

카카오브레인, 이미지 생성 AI모델 '알큐트랜스포머' 오픈소스로 공개

김해욱
기사승인 : 2022-04-19 11:06:22
지난해 공개했던 모델보다 2배 성능 향상
6월 CVPR 2022에서 관련 논문 발표
카카오브레인이 이미지 생성 AI(인공지능) 모델인 '알큐트랜스포머(RQ-Transformer)'를 오픈소스 커뮤니티 '깃허브'(GitHub)에 공개했다고 19일 밝혔다.

알큐트랜스포머는 텍스트를 입력하면 그에 맞는 이미지를 출력해 주는 역할을 한다. 2021년 12월에 공개했던 초거대 멀티모달(multimodal, 다모드) 인공지능인 'minDALL-E'(민달리)의 업그레이드 버전이다. 모델의 크기는 과거에 비해 3배, 이미지 생성 속도와 학습 데이터셋 크기는 2배 늘어났다.

▲ 카카오브레인이 이미지 생성 AI(인공지능)모델 'RQ-Transformer'를 오픈소스 커뮤니티인 '깃허브'(GitHub)에 공개했다. [카카오브레인 제공]

카카오는 "3D프린터처럼 형상을 만들어내는 방식을 AI모델에 적용했다고 생각하면 된다"며 "이미지 압축으로 인한 손실이 적고 이미지 출력 계산에 들어가는 시간과 비용도 줄였다"고 설명했다. 이어 "독자 개발 기술을 기반으로 앞으로도 적은 비용으로 더 많은 데이터를 학습할 수 있도록 연구 개발을 이어나갈 것"이라고 했다.

'minDALL-E'와는 달리 RQ-Transformer는 카카오브레인의 독자 기술로 개발됐다. 고해상도 이미지를 2차원 코드맵으로 표현한 과거와 달리 RQ-Transformer는 3차원의 코드맵으로 표현됐다.

카카오브레인은 오는 6월에 열릴 'CVPR 2022'(국제 컴퓨터 비전 및 패턴인식 학술대회)에서 RQ-Transformer 기술 관련 논문을 발표할 예정이다.

김일두 카카오브레인 대표는 "카카오브레인이 공개한 AI 모델은 인간과 컴퓨터가 자유롭게 대화하는 미래를 향해 나아가는 첫 시작일 것"이라고 말했다.

KPI뉴스 / 김해욱 기자 hwk1990@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김해욱
김해욱

기자의 인기기사