KPI뉴스 - 애플은 못하는 AI 통역…삼성 '갤럭시 AI' 지원 언어 연내 20개로

  • 구름많음진주20.3℃
  • 맑음문경19.6℃
  • 맑음서청주21.6℃
  • 맑음함양군20.5℃
  • 박무여수21.6℃
  • 맑음해남20.2℃
  • 맑음의령군19.6℃
  • 맑음북창원21.2℃
  • 맑음보은19.2℃
  • 맑음이천21.3℃
  • 맑음부안22.1℃
  • 안개백령도18.0℃
  • 맑음동두천20.0℃
  • 맑음군산21.3℃
  • 맑음대구20.0℃
  • 맑음영덕17.3℃
  • 맑음강화21.1℃
  • 맑음울산19.8℃
  • 맑음청주23.4℃
  • 맑음거창20.8℃
  • 맑음장수19.3℃
  • 맑음고흥19.9℃
  • 맑음대관령14.1℃
  • 맑음경주시18.8℃
  • 맑음임실19.8℃
  • 맑음북부산20.8℃
  • 안개흑산도18.9℃
  • 맑음추풍령19.3℃
  • 박무서울22.5℃
  • 맑음파주20.1℃
  • 맑음목포21.0℃
  • 맑음고창군21.3℃
  • 맑음영천18.0℃
  • 구름많음수원20.8℃
  • 맑음정읍22.1℃
  • 맑음창원21.3℃
  • 맑음구미22.2℃
  • 맑음보성군21.4℃
  • 맑음산청19.5℃
  • 맑음안동19.0℃
  • 맑음순창군20.8℃
  • 맑음보령21.5℃
  • 맑음충주21.5℃
  • 맑음완도21.1℃
  • 맑음태백16.2℃
  • 맑음북강릉20.4℃
  • 맑음강진군20.9℃
  • 맑음광주22.2℃
  • 맑음영주18.9℃
  • 맑음홍천19.8℃
  • 맑음포항19.3℃
  • 맑음영월20.6℃
  • 맑음강릉19.4℃
  • 맑음진도군18.9℃
  • 맑음전주23.1℃
  • 맑음금산21.4℃
  • 맑음의성17.9℃
  • 맑음봉화15.5℃
  • 맑음철원19.6℃
  • 맑음영광군20.6℃
  • 맑음양평20.7℃
  • 맑음제주21.1℃
  • 맑음서산20.6℃
  • 맑음밀양19.9℃
  • 맑음울릉도20.5℃
  • 맑음남해20.5℃
  • 맑음광양시21.5℃
  • 맑음울진17.9℃
  • 맑음춘천20.5℃
  • 맑음남원20.7℃
  • 맑음속초20.7℃
  • 맑음김해시20.1℃
  • 맑음순천19.8℃
  • 맑음원주22.1℃
  • 맑음통영20.2℃
  • 맑음서귀포21.1℃
  • 맑음부여20.6℃
  • 맑음세종21.5℃
  • 맑음북춘천20.2℃
  • 박무홍성21.0℃
  • 맑음장흥21.3℃
  • 맑음합천19.7℃
  • 맑음인제16.7℃
  • 맑음양산시20.2℃
  • 맑음상주19.8℃
  • 맑음성산20.4℃
  • 맑음고산21.4℃
  • 맑음제천19.5℃
  • 맑음천안19.8℃
  • 맑음고창20.4℃
  • 맑음대전22.7℃
  • 맑음동해19.9℃
  • 맑음정선군14.9℃
  • 맑음청송군16.4℃
  • 구름많음인천21.4℃
  • 맑음부산21.3℃
  • 구름많음거제19.7℃

애플은 못하는 AI 통역…삼성 '갤럭시 AI' 지원 언어 연내 20개로

김윤경
기사승인 : 2024-06-25 13:19:38
표준언어·방언·성조 연구하며 AI 언어 모델 고도화
전세계 20여 R&D 센터서 언어 모델 연구·개발
문화 이해·지식 갖추도록 갤럭시 AI 기능 개선 추진

삼성전자가 '갤럭시 AI'의 지원 언어를 연내 20개로 확대하며 언어 모델 고도화를 추진한다.

인공지능(AI) 통역 기능은 애플이 구현하지 못한 삼성전자의 고유 경쟁력으로 갤럭시 스마트폰의 최대 강점으로 꼽힌다.
 

▲ 삼성리서치 요르단 연구소(SRJO)의 연구원. [삼성전자 제공]

 

삼성전자는 갤럭시 AI의 언어 모델 고도화를 위해 총 20여 R&D(연구개발) 센터에서 언어 모델 연구·개발에 매진하고 있다고 25일 밝혔다.

R&D센터에서는 세계 여러나라의 표준 언어는 물론 지역 방언까지 연구하며 AI를 통한 통역 및 소통 지원에 주력한다.

현재 갤럭시 AI에서 지원하는 언어는 16개다. 한국어, 중국어(간체), 영어, 프랑스어, 독일어, 힌디어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 스페인어, 태국어, 베트남어, 아랍어, 인도네시아어, 러시아어에 대한 통·번역이 온디바이스(기기에 기능 내장) 방식으로 제공된다.


삼성전자는 연내 스웨덴어, 네덜란드어, 루마니아어, 튀르키예어를 추가, 총 20개 언어를 지원할 계획이다.
 

▲ 삼성리서치 요르단 연구소의 '갤럭시 AI' 언어 개발 담당자들. [삼성전자 제공]

 

갤럭시 AI 언어 모델은 △언어의 특성과 문법에 대한 정량 평가 △ 문화에 대한 지식과 이해를 검증하는 정성 평가를 거쳐 공개된다.

삼성전자가 특히 공들이는 언어는 아랍어와 베트남어, 스페인어, 인도네시아 언어다. 이들은 전세계 다수가 사용 중이나 방언이 많고 문화적 특수성으로 연구와 이해가 쉽지 않다는 공통점이 있다.

아랍어는 20여개국 4억명 이상이 사용 중인 세계 6번째 보편 언어다. 하지만 현대 표준 아랍어인 풋스하(Fusha)와 일상생활에서 사용하는 방언인 암미야(Ammiyya)를 모두 학습해야 하는 어려움이 있어 통번역에 어려움이 많다. 아랍어 방언은 총 30여 종에 달한다.

갤럭시AI의 아랍어 통번역 기능은 삼성리서치 요르단 연구소(SRJO)가 원어민들로 팀을 구성, 음성 데이터 수집과 텍스트화, 데이터 선별, 고급 모델링 기술을 적용해 세상에 나올 수 있었다.

베트남어도 통번역이 쉽지 않다. 베트남어는 전세계 약 1억명이 사용하지만 무려 여섯 가지의 성조가 있어 미세한 차이 인식이 필수적이다.

삼성리서치 베트남 연구소(SRV)는 한 단어를 0.02초 전후로 자르고 데이터베이스화한 후 이를 정교하게 다듬고 정제하는 과정을 거쳤다.

▲ 삼성리서치 인도네시아 연구소(SRIN) '갤럭시 AI' 언어 연구원들이 통번역 기능을 검수하고 있다. [삼성전자 제공]

 

중남미 공통 언어인 스페인어는 22개국을 특성을 고유하게 반영하고 있어 별도 작업이 필요하다. 대표적으로 수영장이라는 단어를 멕시코는 '알베르카(alberca)', 아르헨티나와 파라과이, 우루과이는 ' 필레타(pileta)', 콜롬비아와 볼리비아, 베네수엘라는 '피시나(piscina)'라고 표현한다.

삼성리서치 브라질 연구소(SRBR)도 중남미 국가의 스페인어 차이를 이해할 수 있도록 각 국가의 오디오와 텍스트 등 방대한 양의 데이터를 수집해 관리하고 지속적으로 개선했다.

인구 2억 8000만 명인 인도네시아 언어는 문장의 맥락 이해에 집중했다.

삼성리서치 인도네시아 연구소(SRIN)는 인간의 뇌가 학습하는 과정과 유사한 '인공신경망번역(NMT)' 방식을 적용, 단어가 아닌 문장 단위로 언어를 학습시켜 갤럭시 AI가 의사소통의 맥락과 규칙을 이해할 수 있도록 했다.

삼성전자 관계자는 "갤럭시 AI가 언어를 넘어 문화 이해력, 지식까지 갖출 수 있도록 기능을 고도화하고 세계인들이 언어장벽 해소를 위해 지원 언어의 수를 지속 확대할 방침"이라고 밝혔다.

 

KPI뉴스 / 김윤경 기자 yoon@kpinews.kr

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]

김윤경
김윤경

기자의 인기기사