KPI뉴스 - 카카오, AI 안전성 검증 위한 가드레일 모델 공개

  • 구름많음정읍26.6℃
  • 구름많음성산25.0℃
  • 구름많음이천26.2℃
  • 구름많음인제23.8℃
  • 구름많음구미28.7℃
  • 흐림영천25.2℃
  • 구름많음세종25.6℃
  • 맑음서산26.5℃
  • 흐림강릉21.7℃
  • 구름많음속초20.0℃
  • 구름많음보성군26.5℃
  • 구름많음산청28.1℃
  • 흐림철원25.7℃
  • 구름많음울진24.3℃
  • 구름많음임실26.0℃
  • 구름많음부산22.8℃
  • 흐림청송군25.8℃
  • 흐림원주25.1℃
  • 구름많음거창27.8℃
  • 구름많음수원26.3℃
  • 흐림대관령17.9℃
  • 구름많음장수25.4℃
  • 구름많음목포24.8℃
  • 구름많음양평25.2℃
  • 구름많음군산26.5℃
  • 구름많음금산26.3℃
  • 흐림북강릉21.9℃
  • 구름많음서청주26.7℃
  • 구름많음장흥26.8℃
  • 흐림거제25.1℃
  • 구름많음영주23.4℃
  • 구름많음고창군25.0℃
  • 구름많음강화25.4℃
  • 구름많음전주26.6℃
  • 흐림양산시25.2℃
  • 흐림추풍령24.6℃
  • 흐림영덕22.1℃
  • 구름많음진도군24.8℃
  • 구름많음함양군28.2℃
  • 구름많음완도27.0℃
  • 구름많음남해26.8℃
  • 구름많음홍천25.7℃
  • 흐림고산24.3℃
  • 구름많음보은24.8℃
  • 구름많음상주27.2℃
  • 구름많음인천25.8℃
  • 흐림통영26.4℃
  • 구름많음의성27.4℃
  • 흐림안동25.1℃
  • 흐림제천22.9℃
  • 구름많음영광군25.9℃
  • 구름많음진주27.2℃
  • 구름많음천안25.3℃
  • 흐림태백18.0℃
  • 구름많음춘천26.1℃
  • 흐림정선군21.2℃
  • 구름많음순창군26.6℃
  • 구름많음동두천26.6℃
  • 구름많음북춘천25.0℃
  • 흐림밀양28.7℃
  • 구름많음청주26.5℃
  • 구름많음보령27.7℃
  • 구름많음부안26.8℃
  • 구름많음김해시24.0℃
  • 구름많음대전26.3℃
  • 구름많음고흥27.9℃
  • 비울릉도19.0℃
  • 구름많음창원24.4℃
  • 흐림경주시27.5℃
  • 구름많음해남26.0℃
  • 구름많음강진군26.7℃
  • 구름많음포항24.4℃
  • 구름많음서귀포25.5℃
  • 구름많음순천26.1℃
  • 흐림울산24.0℃
  • 흐림대구28.0℃
  • 구름많음흑산도25.3℃
  • 구름많음북창원26.5℃
  • 흐림영월23.4℃
  • 맑음광양시28.6℃
  • 맑음홍성26.5℃
  • 구름많음남원26.7℃
  • 구름많음의령군28.4℃
  • 구름많음파주25.9℃
  • 맑음여수26.7℃
  • 구름많음북부산24.8℃
  • 구름많음광주26.6℃
  • 구름많음합천28.1℃
  • 흐림문경25.5℃
  • 흐림충주25.0℃
  • 흐림동해21.0℃
  • 구름많음서울26.6℃
  • 구름많음부여26.6℃
  • 흐림봉화23.3℃
  • 구름많음제주25.8℃
  • 구름많음백령도23.3℃
  • 구름많음고창26.3℃

카카오, AI 안전성 검증 위한 가드레일 모델 공개

설석용 기자
기사승인 : 2025-05-27 15:28:31

카카오가 안전하고 신뢰할 수 있는 생성형 AI 기술 환경 및 생태계 조성에 나선다고 27일 밝혔다.

 

카카오는 AI 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 'Kanana Safeguard'를 개발하고, 생태계에 기여하기 위해 국내 기업 최초로 총 3종의 모델을 오픈소스로 공개한다. 

 

▲[카카오 제공]

 

최근 다양한 생성형 AI 서비스들이 확산되는 가운데 유해 콘텐츠의 위험성에 대한 사회적 우려가 증대되고 있다. 카카오는 이에 대한 기술적·제도적 장치인 AI 가드레일 시스템 마련에 대한 필요성을 인식하고 'Kanana Safeguard' 모델을 개발하게 됐다. 주요 빅테크에서는 생성형 AI를 통해 발생할 수 있는 위험 요소를 감지하는데 특화된 모델을 운영 중이다. 

 

'Kanana Safeguard'는 카카오가 자체 개발한 언어모델 'Kanana'를 기반 기술로 활용했으며, 한국어 및 한국 문화를 반영한 자체 구축 데이터셋을 활용해 한국어에 특화된 성능을 보유하고 있다. AI 모델의 정밀도와 재현율을 평가하는 수치인 F1 스코어를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 기록하기도 했다.

 

이번에 오픈소스로 공개한 모델은 총 3가지로, 각각의 모델은 리스크 유형에 따라 유해성 및 위험성에 대한 효과적 탐지가 가능하다. △사용자의 발화 또는 AI의 답변에서 증오, 괴롭힘, 성적 콘텐츠 등에 대한 유해성을 탐지하는 'Kanana Safeguard' △개인 정보나 지식재산권 등  법적 측면에서 주의가 필요한 요청을 탐지하는 'Kanana Safeguard-Siren' △AI 서비스를 악용하려는 사용자의 공격을 탐지하는 'Kanana Safeguard-Prompt'이며, 모두 허깅페이스를 통해 다운로드 할 수 있다.

 

카카오는 안전한 AI 생태계의 구축에 기여하고자 'Kanana Safeguard'에 상업적 이용과 수정 및 재배포 등이 자유롭게 가능한 아파치2.0 라이선스를 적용했다. 향후 지속적인 업데이트를 통해 모델을 고도화 할 예정이다.   

 

카카오 김경훈 AI Safety 리더는 "생성형 AI의 등장 이래, 기술의 발전과 더불어 AI 윤리와 안전성에 대한 중요성이 국내외에서 점차 부각되고 있다"며 "책임감 있는 AI 구축에 대한 인식을 널리 확산시키고, 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제적인 대응을 이어갈 계획"이라고 말했다. 


KPI뉴스 / 설석용 기자 ssyasd@kpinews.kr

 

[저작권자ⓒ KPI뉴스. 무단전재-재배포 금지]