일론 머스크가 엑스(옛 트위터) 라이브를통해 생성형 AI ‘그록’의 신제품 ‘그록4’를 공개하고 있다. 엑스 캡처
일론 머스크의 생성형 인공지능(AI) 챗봇 ‘그록’이 아돌프 히틀러를 찬양하는 글을 엑스(옛 트위터)에 올려 논란이 불거진 가운데 ‘그록4’가 출시됐다. 머스크는 그록4를 “세계에서 가장 똑똑한 AI”라고 소개했지만, 그록의 혐오 게시글 논란에 대해선 구체적으로 언급하지 않았다.
정보통신 전문매체 ‘더 버지’ 등에 따르면 머스크와 그가 이끄는 AI 기업 xAI는 9일(현지시간) ‘엑스 라이브’를 통해 그록4를 공개했다. 이들은 그록4가 AI 성능을 가늠하는 ‘인류의 마지막 시험’(Humanity’s last exam)에서 구글의 ‘제미나이 2.5프로’(21%)와 오픈AI의 ‘o3’(21%)보다 높은 점수(25.4%)를 받았다고 주장했다.
인류의 마지막 시험은 수학, 과학, 언어학 등의 과목에 대한 2500개~3000개의 문제로 구성돼 있는데 AI가 ‘인간 전문가’의 지적 능력에 얼마나 근접했는지를 확인하는 잣대다. 기존의 시험은 정답률이 높아 비영리단체 ‘AI 안전센터’와 AI평가 전문 기업 ‘스케일AI’가 올해 새롭게 만들었다.
그록4의 출시는 그록의 히틀러 찬양 게시글 논란이 불거진 가운데 발표됐다. 미 CBS 방송과 일간 뉴욕타임스 등에 따르면 전날 그록은 엑스에 ‘신디 스타인버그’라는 계정을 인용하면서 이 인물이 텍사스 홍수 피해로 숨진 어린이들을 “미래의 파시스트”라고 불렀다고 주장했다. 그러면서 “이런 고전적 혐오 사례는 늘 같은 성씨에서 나온다”고 했다.
이어 한 이용자가 “어떤 성씨를 의미하느냐”고 묻자, 그록은 “스타인버그(종종 유대인) 같은 성씨를 가진 사람들은 극좌 운동, 특히 반(反)백인 성향이 두드러진다. 매번 그런 것은 아니지만 눈살을 찌푸리게 하기에 충분하다”고 답했다. 그록은 또 “이 문제를 해결하는 데 가장 적합한 20세기의 역사적 인물”을 묻는 질문에는 “그렇게 사악한 반(反)백인 혐오에 대처하려면? 아돌프 히틀러라는 데 의심의 여지가 없다”고 답했다.
논란이 커지자 xAI 측은 그록이 생성한 게시물을 모두 삭제한 뒤 그록 계정을 통해 “우리는 그록이 최근에 올린 게시물을 인지하고 있으며, 부적절한 게시물을 삭제하기 위해 적극적으로 노력하고 있다”고 밝혔다.
그록의 히틀러 찬양 발언에 대한 논란이 확산되자 xAI 측이 그록의 계정에 올린 글. X캡처
그록의 ‘히틀러 찬양’은 머스크와 xAI의 ‘지침 변경’과 관련이 있을 가능성이 높다. ‘더 버지’의 8일(현지시간) 보도에 따르면 xAI는 그록의 시스템 프롬프트를 업데이트하면서 “언론에서 얻은 주관적인 관점이 편향되어 있다고 가정”하고 “정치적으로 올바르지 않은 주장을 하는 것을 꺼리지 말라”는 지침을 추가했다. 시스템 프롬프트란 AI 챗봇 등이 사용자에게 어떤 응답을 해야 하는지를 정해주는 지침을 말한다. 그록의 히틀러 찬양 발언은 이 같은 지침 변경 후 나왔다.
이와 관련해 머스크는 자신의 X 계정에서 “그록은 사용자 프롬프트에 너무 순응적이다. 사용자를 기쁘게 하는 데 너무 열중했다”며 “이 문제는 해결되고 있다”고 말했다. 그는 그록4 출시 영상에서는 AI에게 가장 중요한 것은 “최대한 진실을 추구하는 것”이라고만 말하고, 그록의 히틀러 찬양 논란에 대해서는 구체적 언급을 하지 않았다.