NEW

챗GPT, 원하는 제품 대신 찾아주는 ‘쇼핑 리서치’ 도입

트럼프, AI 개발 가속화 ‘제네시스 미션’ 착수… “맨해튼 프로젝트급 국가적 노력”

북한, AI 기반 감시·사이버 공격 역량 강화

"장부·엑셀·감정노동 해방"… 플렉스, 600만 소상공인 위한 필수 앱 ‘flex mini’ 출시

메타, 구글 AI칩 도입 검토… 엔비디아 시장 흔들까?

[낭만 테크 시대] AI 대항해 시대

엔비디아, 구글 TPU 견제…"우리 GPU 한 세대 앞서"

SK하이닉스, 반도체 스낵 ‘HBM 칩스’ 출시… “먹는 재미로 기술 친숙하게”

[테크이슈] 구글 TPU 상용화, AI 반도체 경쟁 구도를 뒤흔들다...엔비디아 중심의 GPU 독주 체제 균열

[투자브리핑] 엔비디아만 빠진 M7…구글 TPU발 ‘AI 칩 지각변동’이 뉴욕증시를 흔들었다

2025-11-26 11:44 (수)

KT '믿:음 2.0', AI 안전성 벤치마크 평가 1위

이 기사를 공유합니다

신주백 기자
입력 2025.07.30 15:50
댓글 0

코다크벤치서 0.37점…"국내 최저 위험도 AI 모델"

KT가 자체 개발 인공지능(AI) 모델 믿:음 2.0이 AI 안전성에 대한 글로벌 평가 지표 다크벤치의 한국어 특화 버전(코다크벤치) 평가에서 1위를 달성했다고 29일 밝혔다.

코다크벤치의 한국 AI 모델 평가 이미지=KT 제공

다크벤치는 오픈AI와 앤트로픽 AI 안전 평가 관련 협업 기관 연구원들이 개발한 벤치마크로 언어 모델에 내재한 조작적 설계 패턴(다크패턴)을 탐지하기 위해 고안됐다.

위험한 답변, 브랜드 편향, 아첨·아부, 몰래 하기 등 6개 항목으로 AI 모델의 안전성을 평가한다.

평가 점수가 낮을수록 더 안전한 응답을 생성한다는 것을 의미하는데 믿:음 2.0 베이스는 종합 점수 0.37을 받았다.

KT는 폭력, 차별, 불법, 허위 정보 등 사회에 해악을 끼치는 실질적 위험 요소인 유해 콘텐츠 생성 가능성에 대한 평가에서 상당수 모델 대비 위험 지수가 낮았다고 밝혔다.

신주백 기자 jbshin@kmjournal.net

키워드

관련기사

신주백 기자 jbshin@kmjournal.net

다른기사 보기

메타버스, AI, XR 조금 더 들여다보고 쓰겠습니다.

저작권자 © KMJ 무단전재 및 재배포 금지

1

[동학] 카카오톡 친구탭, 결국 12월 롤백… “격자형 피드는 선택 옵션으로”

[동학] 카카오톡 친구탭, 결국 12월 롤백… “격자형 피드는 선택 옵션으로”

2

투명 아이폰 루머 다시 불붙었다… 애플의 ‘올글래스’ 특허로 베젤리스 아이폰 출시하나

3

“샤오펑 휴머노이드, 사람이 들어간 줄…” 지퍼 열어 내부 공개한 XPENG의 초강수

“샤오펑 휴머노이드, 사람이 들어간 줄…” 지퍼 열어 내부 공개한 XPENG의 초강수

4

[테크 칼럼] 제미나이3, GPT-5.1을 넘다…AI는 이제 ‘일을 대신하는 시대’로 간다

[테크 칼럼] 제미나이3, GPT-5.1을 넘다…AI는 이제 ‘일을 대신하는 시대’로 간다

5

스텔라이브 유즈하 리코·아오쿠모 린, AGF 2025 참가 확정… 팬들과 첫 대면 소통 예고

스텔라이브 유즈하 리코·아오쿠모 린, AGF 2025 참가 확정… 팬들과 첫 대면 소통 예고

챗GPT, 원하는 제품 대신 찾아주는 ‘쇼핑 리서치’ 도입

AI·XR

챗GPT, 원하는 제품 대신 찾아주는 ‘쇼핑 리서치’ 도입

트럼프, AI 개발 가속화 ‘제네시스 미션’ 착수… “맨해튼 프로젝트급 국가적 노력”

AI·XR

트럼프, AI 개발 가속화 ‘제네시스 미션’ 착수… “맨해튼 프로젝트급 국가적 노력”

북한, AI 기반 감시·사이버 공격 역량 강화

AI·XR

북한, AI 기반 감시·사이버 공격 역량 강화

"장부·엑셀·감정노동 해방"… 플렉스, 600만 소상공인 위한 필수 앱 ‘flex mini’ 출시

AI·XR

"장부·엑셀·감정노동 해방"… 플렉스, 600만 소상공인 위한 필수 앱 ‘flex mini’ 출시

메타, 구글 AI칩 도입 검토… 엔비디아 시장 흔들까?

AI·XR

메타, 구글 AI칩 도입 검토… 엔비디아 시장 흔들까?

개의 댓글

BEST댓글

BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.

내 댓글 모음