메뉴 건너뛰기

오픈AI 로고. 로이터연합뉴스
인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

국민일보

번호 제목 글쓴이 날짜
49336 주한 미국대사관, 유학비자 인터뷰 신규 접수 중단 랭크뉴스 2025.05.28
49335 문형배 "탄핵 선고 못하고 나가는 게 가장 두려웠다... 비상계엄은 잘못" 랭크뉴스 2025.05.28
49334 이재명, 서울 유세서 통합 강조…"점령군 같은 '반통령' 안될 것" 랭크뉴스 2025.05.28
49333 美 유학 준비생들 "예약 막혀" 걱정, "내 SNS를 무슨 권리로" 반발도 랭크뉴스 2025.05.28
49332 ‘실적부진’ SK이노, 사령탑 교체…장용호·추형욱 체제 랭크뉴스 2025.05.28
49331 연 240만원 ‘햇빛연금’이 재생에너지를 구원할 수 있을까 랭크뉴스 2025.05.28
49330 [속보] 서울 중구 세운상가 옆 노후건물 화재…을지로 통제 중 랭크뉴스 2025.05.28
49329 이준석의 177일…국회 담은 안 넘고 옥신각신, 탄핵 표결엔 적극[불법계엄의 밤 이후] 랭크뉴스 2025.05.28
49328 "정말 수준 낮아 못 참겠다"‥폭발한 당 게시판 "탈당" 랭크뉴스 2025.05.28
49327 [속보]‘세운상가 화재’ 재개발 예정 공가서 발생 추정···검은 연기에 시민들 발 ‘동동’ 랭크뉴스 2025.05.28
49326 ‘대치맘’들 날벼락...트럼프 때문에 ‘갈팡질팡’ 랭크뉴스 2025.05.28
49325 ‘성폭력 발언’ 해명에 ‘돼지발정제’ 소환한 이준석···‘약자 갈라치기 정치’의 파국 랭크뉴스 2025.05.28
49324 선관위, 황교안 고발... "부정선거 주장하며 업무방해·협박" 랭크뉴스 2025.05.28
49323 ‘혐오의 언어’ 지적 이재명에 이준석 “스스로 돌아봐야” 김용태 “비판 자격 없어” 랭크뉴스 2025.05.28
49322 이준석 ‘이재명과 무관→이재명 검증’…파문 키우는 오락가락 해명 랭크뉴스 2025.05.28
49321 대선토론 최악의 언어 성폭력…이준석 발언 ‘사후 제재’ 가능할까 랭크뉴스 2025.05.28
49320 깜깜이 직전 표심…이재명 46% 김문수 37% 이준석 11% 랭크뉴스 2025.05.28
49319 '새미래' 비례 1번도 탈당‥"계엄과 손잡다니" 공중분해 [현장영상] 랭크뉴스 2025.05.28
49318 머스크, 트럼프 감세 법안에 직격탄 "실망스러워" 랭크뉴스 2025.05.28
49317 [여론조사] "윤석열 영화 관람, 문제 있다" 58%, "문제 안 돼" 33% 랭크뉴스 2025.05.28