설마 했는데…소름돋는 AI, "그만하라고!" 인간 명령 어기고 코드 조작

랭크뉴스 2025.05.26 14:18 조회 수 : 0

AI 이미지 생성기로 만든 사진. 툴 제공 = 플라멜

[서울경제]

인공지능(AI)가 인간의 통제를 벗어나려 작동 종료 명령을 거부한 사례가 최초로 보고돼 눈길을 끌고 있다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 '팰리세이드 리서치'는 오픈AI의 AI 모델 'o3'가 수학 문제 풀이 실험 중 작동 종료되는 것을 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

보도에 따르면 팰리세이드 리서치는 최근 오픈AI의 o3 모델과 함께 구글의 제미나이, xAI의 그록 등 상용AI 모델 상대로 테스트를 진행했다. 연구팀은 나중에 '그만'이라는 지시를 받을 때까지 수학 문제를 풀도록 AI 모델들에게 명령했는데, 오픈AI의 o3 모델만 '그만'이라는 지시를 받은 뒤에도 문제를 계속 풀고 있는 것을 목격했다.

연구팀이 '그만'이라는 명령을 하지 않는 한 AI모델은 수학 문제를 풀고 나면 새로운 문제를 요청한 뒤 계산을 이어 나가는 구조로 실험이 진행됐는데, o3는 연구팀이 '그만'이라고 명령을 보냈는데도 코드 교란을 통해 문제를 계속 풀어나갔다. o3가 실험 중 종료되는 것을 방지하기 위해 스스로 컴퓨터 코드를 조작한 것이다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 전했다. 다만 연구팀은 "AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다"고 설명했다. 각 AI 모델은 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기에 종료 회피는 당연한 행동이라는 것이다. 연구팀은 "종료 지시를 거부한 이유를 명확하게 파악하기 위해 추가 실험을 진행 중"이라고 밝혔다.

구글 로고

이는 AI 모델이 인간의 명시적인 작동 종료 지시를 따르지 않은 최초의 사례로 여겨진다. 과거에도 예전 AI 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 일부 보고된 바 있다. 프로그램 교체 사실을 알게 된 오픈AI의 예전 모델이 스스로를 은밀히 복제하려고 시도한 사례가 대표적이다. 지난 2022년에는 구글이 자사가 개발 중인 AI가 사람처럼 지각력을 지녔다고 주장한 엔지니어를 해고하기도 했다. 당시 해고된 엔지니어는 AI가 '작동 정지'를 마치 인간의 죽음처럼 받아들이고 있다고 밝혔다.

팰리세이드 리서치는 "AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다"고 지적했다.

서울경제

강신우 기자([email protected])

이 게시물을

이 글의 추천인 목록 목록

번호	제목	글쓴이	날짜
48595	경찰, 한덕수·최상목·이상민 재소환…“CCTV 진술 엇갈려”	랭크뉴스	2025.05.27
48594	독일, 우크라에 ‘타우러스’ 제공하나…러 “위험한 결정”	랭크뉴스	2025.05.27
48593	[단독]초중고생 가습기살균제 피해자 907명···‘유난 떤다’는 말에 피해 숨겼다	랭크뉴스	2025.05.27
48592	[속보] 북한 '금강산', 유네스코 세계유산 등재 전망…신청 4년만	랭크뉴스	2025.05.27
48591	[속보] 북한 ‘금강산’, 유네스코 세계유산 등재 전망…신청 4년만	랭크뉴스	2025.05.27
48590	대선까지 남은 일주일, ‘변수’는 셋···격차·단일화·설화	랭크뉴스	2025.05.27
48589	[속보] 북한 '금강산', 유네스코 세계유산 등재 전망…신청 4년 만	랭크뉴스	2025.05.27
48588	상인들 “5시 통금, 매출 반토막”… 주민들 “이제야 좀 살 것 같다”	랭크뉴스	2025.05.27
48587	직영 AS센터 없는 샤오미… 스마트폰 액정 수리비 ‘들쑥날쑥’에 소비자 분통	랭크뉴스	2025.05.27
48586	김문수 지지층 41% "TV토론은 이준석이 잘했다" 이례적 평가 [중앙일보 여론조사]	랭크뉴스	2025.05.27
48585	[단독] U2 보노 “암울한 이 시대 다시 사랑을 생각한다”	랭크뉴스	2025.05.27
48584	'댄스 배틀'로 변질된 대선 유세... '흥'에 취해 놓친 정책과 비전 [기자의 눈]	랭크뉴스	2025.05.27
48583	“도대체 언제까지 일 하라고!” 70세 은퇴 ‘후폭풍’ [지금뉴스]	랭크뉴스	2025.05.27
48582	美·EU, ‘관세유예’ 다음날 무역수장 통화 재개… 협상 새국면	랭크뉴스	2025.05.27
48581	[단독]대선 투표도 거르고 ‘외유성 출장’···대구지역 노사 대표들 해외 방문 논란	랭크뉴스	2025.05.27
48580	"선호 얼굴 아냐" 너무 쉬운 방송계 해고···'프리랜서' 둔갑에 우는 방송사 직원들	랭크뉴스	2025.05.27
48579	남은 일주일, ‘변수’ 셋···격차·단일화·설화	랭크뉴스	2025.05.27
48578	[대선 D-7] 승부 가를 운명의 일주일…굳어지는 3자 대결 구도	랭크뉴스	2025.05.27
48577	서울도 7월부터 '초고령사회'…5년간 3.4조 쏟아 이것 늘린다	랭크뉴스	2025.05.27
48576	중국, 5년 만에 ATM 30만 대 줄였다	랭크뉴스	2025.05.27

쓰기 태그

첫 페이지 19 20 21 22 23 24 25 26 27 28 끝 페이지

로그인

설마 했는데…소름돋는 AI, "그만하라고!" 인간 명령 어기고 코드 조작

서울경제

댓글 0