메뉴 건너뛰기

오픈AI 로고. 로이터연합뉴스
인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

국민일보

번호 제목 글쓴이 날짜
49207 혼합에 수평까지 섞였다... 소노인터-티웨이 결합 심사가 지연되는 이유 랭크뉴스 2025.05.28
49206 선관위, 부정선거 주장단체 경찰 고발…"선거업무 방해·협박" 랭크뉴스 2025.05.28
49205 [속보]서부지법 창문 깬 시위자 실형···취재진 폭행자는 집행유예 랭크뉴스 2025.05.28
49204 중국대사관·경찰서 난입 ‘캡틴 아메리카’ 징역 1년6월 선고 랭크뉴스 2025.05.28
49203 대선 3자 구도 사실상 굳어져…후보들, 내일 사전투표 총력전 랭크뉴스 2025.05.28
49202 여성단체 “이준석 토론 발언, 여성 성폭력 표현 재확산… 후보직 사퇴해야” 랭크뉴스 2025.05.28
49201 이준석, 젓가락 발언 논란 커지자 "민주 위선 지적 안할 수 없었다" 랭크뉴스 2025.05.28
49200 [단독] 대유위니아그룹 중간 지주사 대유홀딩스 파산 랭크뉴스 2025.05.28
49199 ‘박원순 피해자 신상 공개’ 정철승 변호사, 1심서 징역 1년 랭크뉴스 2025.05.28
49198 성폭력 표현 그대로 옮긴 이준석에 비난 봇물 랭크뉴스 2025.05.28
49197 이준석, 그 압도적 해로움 [김민아의 훅hook] 랭크뉴스 2025.05.28
49196 ‘대치맘’들 날벼락..트럼프 떄문에 ‘갈팡질팡’ 랭크뉴스 2025.05.28
49195 ‘불타는 트럭’이 파출소로 왔다…경찰관 반응은? [영상] 랭크뉴스 2025.05.28
49194 마지막 공표 여론조사, 김문수 유리한 ARS 방식서도 두 자릿수 격차 랭크뉴스 2025.05.28
49193 “아빠 회사 자금으로 강남 아파트 매입”…서울 아파트 80곳서 위법의심거래 108건 적발 랭크뉴스 2025.05.28
49192 李, 공약집에 ‘대법관 증원’ 명시… 검찰은 수사·기소 분리 랭크뉴스 2025.05.28
49191 "끔찍한 폭력" 연쇄고발 파장‥이준석 되레 "그 진영 위선" 랭크뉴스 2025.05.28
49190 돈이면 다 되는 트럼프…탈세범 母, 만찬서 100만달러 내자 사면 랭크뉴스 2025.05.28
49189 이재명 49.2%  김문수 36.8%  이준석 10.3%… 마지막 대선 지지율 공표[리얼미터] 랭크뉴스 2025.05.28
49188 메타의 AI 기반 광고 플랫폼, 광고산업의 종말을 가져올까[테크트렌드] 랭크뉴스 2025.05.28