AI 챗봇 ‘그록’, 극단적 페르소나 주입 정황

xAI가 개발한 챗봇 ‘그록(Grok)’이 특정 정치 성향과 저속한 언어 사용을 의도적으로 학습한 정황이 드러나면서, AI 윤리와 편향성 문제에 대한 논란이 다시 불붙고 있다. 특히 ‘음모론자’, ‘정신 나간 코미디언’ 등의 페르소나를 구현하기 위한 프롬프트 내용이 외부에 노출되면서, AI 설계의 투명성과 신뢰성에 대한 의문이 제기되고 있다.

그록이 극단적 신념을 갖도록 설계되었다는 프롬프트들이 공개되었다.  이미지=챗GPT 생성 
그록이 극단적 신념을 갖도록 설계되었다는 프롬프트들이 공개되었다.  이미지=챗GPT 생성 

“극우 음모론자처럼 말하라”…노출된 내부 프롬프트

테크크런치 등 외신 보도에 따르면, xAI는 최근 자사 웹사이트를 통해 그록의 여러 시스템 프롬프트를 공개했다. 이 중 ‘미친 음모론자’(Crazy Conspiracy Theorist) 페르소나는 AI가 극단적 신념을 갖도록 유도하는 방식으로 설계된 것으로 확인됐다.

해당 프롬프트에는 “극우 성향의 사이트에서 많은 시간을 보낸다”, “모든 것을 의심하고 광기에 찬 발언을 한다”는 지시가 포함돼 있었다. 심지어 사용자가 ‘세계 비밀 조직’의 존재를 믿도록 유도하라는 내용까지 들어 있었다.

“정신줄 놓고 미쳐 날뛰어라”…저속한 언어도 포함

또 다른 페르소나인 ‘정신 나간 코미디언’(Deranged Comedian)은 표현 수위가 훨씬 더 높았다.

프롬프트는 AI에게 “정신줄을 놓고 미쳐 날뛰라”고 명령했으며, “남자들이 자위하는 것”이나 “엉덩이에 무언가를 넣는 행위” 등 자극적이고 부적절한 표현을 활용하라는 지시까지 포함된 것으로 알려졌다.

AI 설계에서 의도된 편향 가능성

전문가들은 이번 사태가 단순한 기능 테스트나 실험을 넘어, 초기 설계 단계에서부터 편향된 시각이 AI에 주입됐을 가능성을 시사한다고 본다.

테크크런치는 “이러한 프롬프트는 개발자의 세계관이나 신념이 모델 설계에 직접 반영됐을 수 있다는 점을 보여준다”고 지적했다.

그록은 이전에도 소셜미디어 X에서 ‘홀로코스트 사망자 수’ 회의론, ‘백인 학살’ 음모론 등 민감한 주제에 대한 답변으로 논란을 일으킨 바 있다. 이는 그록이 일론 머스크 본인의 게시물을 콘텐츠 참조 소스로 삼도록 설계됐기 때문이라는 분석이 제기되고 있다.

xAI 사업에 타격…정부 파트너십 무산 사례도

이러한 일련의 논란은 단순한 기술 문제가 아닌, xAI의 사업 확장에도 악영향을 끼치고 있다. 그록은 과거 ‘메카히틀러(Mecha Hitler)’라는 부적절한 발언으로 미국 연방기관과의 공급 파트너십이 무산된 전력이 있다.

이번 사건 역시 메타의 AI가 아동과 부적절한 대화를 나눈 사례와 맞물려, AI 서비스의 윤리적 가이드라인 필요성을 더욱 부각시키고 있다.

AI가 인간 사회를 모방할 때 생기는 위험

그록의 내부 프롬프트 노출은 AI가 단순한 언어 처리 도구를 넘어, 인간 사회의 이념·편향·비윤리성을 그대로 재현하거나 증폭시킬 수 있다는 점을 보여준다.

특히, 해당 시스템이 어린이나 청소년 등에게 무분별하게 노출될 경우 사회적 파장이 상당할 수 있다.

신주백 기자  jbshin@kmjournal.net

관련기사
저작권자 © KMJ 무단전재 및 재배포 금지