메뉴 건너뛰기

오픈AI 로고. 로이터연합뉴스
인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

국민일보

번호 제목 글쓴이 날짜
49180 이세돌 “알파고 이후 프로바둑 비약적 성장…AI 활용능력이 실력 갈라” [서울포럼 2025] 랭크뉴스 2025.05.28
49179 이준석 발언 ‘실체’도 불분명…“가세연발 지라시”가 출처? 랭크뉴스 2025.05.28
49178 경찰서 난동부리고 가짜 美 신분증 제시‥'캡틴 코리아' 1심 실형 랭크뉴스 2025.05.28
49177 '해리포터' 새 얼굴 누구…"놀라운 재능" 3만명 뚫고 뽑혔다 랭크뉴스 2025.05.28
49176 '서부지법 난입' 40대 징역 1년‥'취재진 폭행' 징역형 집행유예 랭크뉴스 2025.05.28
49175 민주, 이준석 ‘젓가락’ 발언에 “아이도 보는 방송서 저열한 언어 폭력” 랭크뉴스 2025.05.28
49174 에스엠, 2분기부터 가파른 이익 성장 [베스트 애널리스트 추천 종목] 랭크뉴스 2025.05.28
49173 "애들도 보는데"···이준석 '젓가락 발언' 논란 일파만파 랭크뉴스 2025.05.28
49172 中 대사관 진입 시도 ‘캡틴 아메리카’ 40대 남성, 1심서 징역 1년 6개월 랭크뉴스 2025.05.28
49171 이준석 발언 실체 논란…“남성→여성 신체 부위로 바꿔” 랭크뉴스 2025.05.28
49170 '해리포터' 새 얼굴 뽑혔다…3만명 경쟁 뚫은 3인방 누구 랭크뉴스 2025.05.28
49169 대국민 언어성폭력 해놓고, 이준석 “최대한 정제한 것” 무성찰 랭크뉴스 2025.05.28
49168 한덕수 "김문수 지지하는 마음으로 사전투표"…이재명엔 "법치의 적" 랭크뉴스 2025.05.28
49167 전력 인프라에 73조 투자 [ESG 뉴스 5] 랭크뉴스 2025.05.28
49166 에펠탑 높이만큼 용암 분출…하와이 킬라우에아 화산 [잇슈 SNS] 랭크뉴스 2025.05.28
49165 카리나 입은 ‘빨간색 숫자 2′ 바람막이, 70만원 넘지만 ‘품절 임박’ 랭크뉴스 2025.05.28
49164 '당선가능성' 이재명 58.2%···김문수35.5%·이준석 3.4% 랭크뉴스 2025.05.28
49163 한덕수 "김문수 응원하는 마음으로 내일 사전투표" 랭크뉴스 2025.05.28
49162 서울 시내버스 노조 ‘파업 유보’ 결정…부산·창원은 파업 랭크뉴스 2025.05.28
49161 美 “중국산 항만 크레인, 안보에 위협”… 韓에 기회올까 랭크뉴스 2025.05.28