메뉴 건너뛰기

미 법원, 빅테크 손들어줘…해석 무게중심 따라 전문가도 온도 차
네이버 ‘제휴 약관’ 싸고 국내서도 분쟁…이번 판결 영향력에 주목
거대언어모델(LLM) 클로드를 개발·운영하는 미국 AI 기업 앤스로픽 로고 / 로이터 연합뉴스


[주간경향] 미국에서 인공지능(AI)이 저작권자의 명시적 동의 없이 저작물을 학습한 행위가 ‘공정 이용’에 해당한다는 판결이 잇따라 나오고 있다. ‘공정 이용’은 저작권 소유자의 허가 없이 저작물을 사용할 수 있도록 허용하는 것으로 기술 기업들의 핵심적인 법적 방어 수단이다. 전 세계적으로 AI 학습과 저작권 충돌이 주요 법적 쟁점으로 부상한 가운데 일정 조건을 충족한 AI 학습에 대해 법원이 일단 빅테크의 손을 들어준 셈이다. 국내에서도 네이버와 언론사 간 저작권 소송이 진행 중이어서 이번 판결이 유사한 분쟁에 어떤 영향을 미칠지 주목된다.

미국 법원, AI 학습 ‘공정 이용’ 인정

6월 23일 미국 캘리포니아 북부 연방지방법원은 저작권이 있는 책을 생성형 AI 모델의 학습에 사용한 행위가 ‘공정 이용(fair use)’에 해당한다고 판결했다. 작가 안드레아 바르츠 등 3명은 지난해 8월 거대언어모델(LLM) 클로드를 개발·운영하는 미국 AI 기업 앤스로픽을 상대로 저작권 침해 집단소송을 제기했다. 이들은 앤스로픽이 불법 복제 전자책 사이트를 통해 수백만권의 저작물을 무단 수집했으며, 이를 클로드에 학습시켜 수익을 창출함으로써 창작자의 권리를 침해했다고 주장했다.

이 사건을 담당한 윌리엄 앨섭 판사는 두 쟁점을 분리해서 판단했다. 앤스로픽이 디지털 중앙 도서관을 구축하기 위해 700만권 이상의 책을 불법 다운로드한 행위는 저작권 침해에 해당한다고 지적했다. 그러나 AI가 저작권이 있는 책들을 무단으로 학습한 행위 자체에 대해선 “지극히 변형적”이라며 공정 이용에 해당한다고 판단했다. “작가가 되고 싶어하는 모든 독자처럼 앤스로픽의 LLM도 작품을 복제하거나 대체하려는 것이 아니라 새로운 것을 창조하기 위해 학습했다”는 판사의 설명은 AI 학습 행위를 창작을 위한 정당한 이용으로 본 입장을 뒷받침한다.

비슷한 판례는 이틀 뒤 또 나왔다. 6월 25일 같은 법원의 빈스 차브리아 판사는 메타 사건에서 AI 학습이 고도로 ‘변형적’이라는 점을 들어 공정 이용을 인정했다. 13명의 작가가 메타가 자신들의 저작물을 AI 모델 라마에 무단 학습시켰다며 시장 가치의 침해를 주장했으나, 차브리아 판사는 AI 학습이 “매우 변형적”이며 저작권 침해에 해당하지 않는다고 판단했다.

학습 행위 vs 데이터 확보

전문가들은 앞으로 더 많은 판례 축적이 필요하다는 전제 아래 판결의 의미를 분석했다. 특히 앤스로픽 판결에서 법원은 AI의 학습 행위와 데이터 확보 방식을 구분해 판단했다. 해석의 무게중심을 어디에 두냐에 따라 전문가들의 평가에도 온도 차가 있었다.

박경신 고려대 법학전문대학원 교수는 법원이 AI의 학습 과정을 ‘복제’가 아닌 ‘읽기’로 간주했다는 점에 주목했다. 그는 “AI가 책을 읽을 때 책장을 넘기는 방식이 아니라 (1)책을 파일로 전환하고 (2)텍스트를 토큰(token·AI가 텍스트를 처리할 때 사용하는 최소 단위)으로 쪼개는 과정을 거치는데 이 행위들이 ‘읽기’보다는 ‘복제’에 가깝기 때문에 어떤 판결이 나올지가 쟁점이었다”라며 “이번 판결은 두 가지 과정 모두를 ‘책 읽기’를 위해 합리적으로 필요한 행위로 보고 공정 이용을 인정한 것”이라고 설명했다. 이어 “향후 이들이 흐름으로 자리 잡을 경우 전 세계 AI 학습이 직면한 저작권 문제 전반에 영향을 미칠 것”이라고 했다.

반면 법원이 AI의 학습 행위와 데이터 확보 방식을 명확히 구분했다는 점에서 향후 쟁점은 ‘합법적 접근(legal access)’ 여부로 이동할 것이라는 분석도 제기된다. 법원은 불법 복제된 책을 디지털 도서관에 저장한 행위를 명백한 저작권 침해로 판단했다. 최승재 세종대 교수는 “AI 기업들이 학습 데이터를 확보할 때 콘텐츠 이용 허가 없이 크롤링(crawling·소프트웨어가 웹에서 유용한 정보를 찾아 특정 데이터베이스로 수집해 오는 작업) 등을 통해 수집하는 경우가 많은데, 향후 소송에서는 이러한 확보 방식의 정당성 여부가 핵심 쟁점이 될 것”이라고 내다봤다.

이번 미국 판례가 글로벌 차원에서 AI 모델 학습을 둘러싼 법체계 변화의 흐름과 맞물려 있다는 관측도 나왔다. 이재흥 시민기술네트워크 상임이사는 “이번 판결을 기존 법체계를 바꾸는 ‘룰 체인징(rule changing)’으로 보긴 어렵지만 ‘공정 이용’이 빅테크에 유리한 방향으로 해석되면서 창작자의 지식재산권이 상대적으로 약화되는 조짐은 뚜렷하다”고 말했다.

그는 유럽연합(EU)이 AI 경쟁력 제고를 목표로 텍스트 앤 데이터 마이닝(TDM) 규정을 완화한 사례를 예로 들며 “EU는 합법적으로 접근 가능한 저작물에 대해 상업적 목적의 TDM까지 허용하고 있다. 저작권자가 이에 대해 명시적으로 거부 의사를 밝히는 경우에는 제외되지만 실효성은 낮다”고 설명했다. 이어 “영국도 비영리 연구에만 허용해온 TDM 규제를 최근 완화해 EU 수준으로 개정할 것을 예고한 상태다. 창작자들의 반발이 거세다”라고 덧붙였다.

네이버 사옥. 연합뉴스


네이버 ‘제휴 약관’을 둘러싼 국내 쟁점

국내에서도 AI 학습과 관련한 저작권 쟁점이 부상하고 있다. 지난 1월 지상파 방송 3사는 네이버가 생성형 AI 하이퍼클로바, 하이퍼클로바X에 뉴스 콘텐츠를 무단 활용했다며 저작권 침해 및 부정경쟁방지법 위반 혐의로 소송을 걸었다. 지난 4월 한국신문협회는 네이버가 신문·통신 기사 데이터를 AI 학습에 무단 사용했다며 공정거래위원회에 신고했다.

네이버는 AI 학습이 제휴 약관에 따른 정당한 행위였다고 주장한다. 네이버는 “언론사 제휴 약관에 따라 학습을 진행했으며, 해당 조항에 대한 문제 제기가 있은 후에는 2023년 6월 개정된 약관에 따라 명시적 동의 없이 AI 학습에 활용하지 않는다”고 밝혔다. 네이버가 당시 AI 학습의 근거로 제시한 조항은 콘텐츠 제휴 약관 제8조 제3항이다. “네이버는 서비스 개선, 새로운 서비스 개발을 위한 연구를 위해 직접 공동으로 또는 제3자에게 위탁하는 방식으로 정보를 이용할 수 있다”는 등의 내용을 담고 있다.

신문협회는 이 약관이 뉴스 서비스 제공을 위한 조항일 뿐 AI 학습에까지 적용하는 것은 무리라고 본다. 협회는 “생성형 AI 등장 이전에 마련된 약관을 근거로 전혀 다른 기술에 동일 적용하는 것은 적절하지 않다”며 “AI 학습에는 별도 계약이나 사전 동의가 필요하다”고 강조했다. 네이버가 이후 뉴스 데이터를 활용하지 않았다는 입장에 대해서도 “생성형 AI 작동에 뉴스 데이터가 필수적인 만큼 실제로는 활용했을 가능성도 배제할 수 없다”고 말했다.

빅테크·콘텐츠 기업 간 계약 확산

이러한 법적 다툼과는 별개로 개별 언론사와 AI 기업 간의 콘텐츠 라이선스 계약도 진행되는 흐름도 있다. 뉴욕타임스는 지난 5월 아마존과 라이선스 계약을 체결해 자사 기사 콘텐츠를 알렉사 등 AI 플랫폼의 학습 데이터로 제공하기로 했다. 오픈AI는 파이낸셜타임스, 르몽드 등 20여 개 언론사와 기사 활용 계약을 맺고 있다. 이 같은 추세는 학술 출판 분야로도 확산하고 있다. 영국의 옥스퍼드대학출판부, 케임브리지대학출판부와 미국의 와일리 출판사 등은 AI 기업들과 학습 데이터 제공을 포함한 라이선스 계약을 체결하거나 협상을 진행 중이다. 이들은 대부분 저자의 명시적 동의를 받는 방식을 채택해 법적 안정성을 확보하는 전략을 택하고 있다. 국내에서도 올들어 조선일보가 업스테이지와 네이버가 미디어그룹 브릴리언트코리아와 각각 AI 데이터 라이선스 협약을 체결했다.

AI 기업 입장에서도 안정적인 콘텐츠 수급을 위한 언론사·출판사와의 협력은 불가피하다는 분석이 나온다. 박경신 교수는 “AI는 새로운 기사를 스스로 생산할 수 없기 때문에 지속적으로 주요 언론사의 최신 기사를 읽고 학습할 수밖에 없다”며 “AI 회사들도 일정하게 언론사들과 공생관계를 유지할 필요가 있기에 제휴는 계속 이루어질 것으로 보인다”라고 말했다.

문제는 이러한 흐름이 기울어진 구조 위에서 전개되고 있다는 점이다. 신문협회 관계자는 “네이버 등 빅테크 기업이 시장을 지배하며 강한 영향력을 행사하는 상황에서 현재의 불균형한 구조에 대한 시정 조치가 필요하다”며 “공정위가 불공정하다고 판단을 내린다면 보다 대등한 조건에서 계약이나 협상이 이뤄질 수 있겠다는 기대가 있다”라고 말했다.

특히 ‘기울어진 운동장’은 상대적으로 중소 언론사나 독립 창작자에게 더 불리하게 작용하고 있다. 박경신 교수는 “라이선스 계약은 1 대 1로 이뤄지는 계약의 습성상 대형 언론사들 위주로 이뤄질 가능성이 높고 중소형 언론사들에는 기회가 돌아가지 않을 것”이라며 “결국 중소 언론사들이 고사할 위험이 발생한다. 이 부분을 해결하기 위한 법제가 필요하다”라고 말했다.

이 같은 구조적 불균형은 ‘정제된 학습 데이터의 고갈’이 AI 학습과 관련해 새로운 이슈로 부각하면서 더욱 가팔라질 수 있다는 전망이다. 지난해 6월 AI 전문 리서치 기관인 에포크(Epoch AI)는 인간이 생성한 고품질 텍스트 데이터(책·뉴스 기사 등 신뢰도와 구조가 확보된 언어 자료)가 이르면 2026년부터 고갈되기 시작할 수 있다고 분석했다. 또 출판물, 기록물, 아카이브 등 아직 AI 학습 자원으로 본격 활용되지 않은 영역이 AI 학습 데이터의 새로운 원천으로 부각하면서 관련 저작권과 데이터 접근 문제 역시 주요 쟁점으로 떠오를 전망이다.

이재흥 상임이사는 “향후 AI 기업들이 상업적 목적으로 활용하게 될 콘텐츠 중에는 소규모 출판사나 독립 창작자들이 제작한 저작물처럼 다양한 방식으로 흩어져 있는 자료가 많다”며 “이러한 콘텐츠는 협상의 사각지대에 놓이기 쉬워 개별 창작자나 프리랜서들이 정당한 보상이나 저작권 인정을 받기 어려울 수 있다”고 우려했다.

경향신문

번호 제목 글쓴이 날짜
54909 선사시대 생생한 삶…반구천 암각화, 한국 17번째 세계유산 됐다(종합) new 랭크뉴스 2025.07.12
54908 온열환자 한낮 아닌 오후 4~5시 가장 많이 발생…벌써 지난해 3배 new 랭크뉴스 2025.07.12
54907 "尹 독방에 에어컨 놔달라"…지지자 민원 폭주에 구치소 난감 new 랭크뉴스 2025.07.12
54906 "이게 정말 나온다고?"...새우깡의 파격 변신 new 랭크뉴스 2025.07.12
54905 “윤석열 독방에 에어컨 놔달라”…지지자들, 구치소에 전화·팩스 폭주 new 랭크뉴스 2025.07.12
54904 정청래 "개혁 대표될 것"·박찬대 "개혁을 말로하나"…충청 공략 new 랭크뉴스 2025.07.12
54903 "尹, 더위에 당뇨로 식사 못해"…14일 특검 출석 불투명 new 랭크뉴스 2025.07.12
54902 “대통령 크게 화냈다”…김태효 진술에 수사외압 수사 급물살 new 랭크뉴스 2025.07.12
54901 의대학장들 "학생들 조건없이 복귀 밝혀야…교육단축 고려 안해" new 랭크뉴스 2025.07.12
54900 그칠 줄 모르는 K콘텐츠 성장, '케이팝 데몬 헌터스'라는 기념비 new 랭크뉴스 2025.07.12
54899 조국혁신당 "내란 극우세력 국회서 퇴출…비례성 높은 선거제 도입" new 랭크뉴스 2025.07.12
54898 조국혁신당 "비례성 높은 국회의원 선거 도입해 내란세력 퇴출" new 랭크뉴스 2025.07.12
54897 "尹 독방에 에어컨 놔 달라" 항의 민원··· 尹, 14일 특검 출석도 불투명 new 랭크뉴스 2025.07.12
54896 국힘 한지아 “‘강선우 갑질 방지법’ 발의하겠다”…사적 심부름 ‘부당지시’로 규정 new 랭크뉴스 2025.07.12
54895 러 외무 "푸틴·김정은 지속적 소통"…정상회담 가능성 시사 new 랭크뉴스 2025.07.12
54894 “비즈니스 부담되면 ‘이 좌석’ 고르세요”…‘프리미엄 이코노미’ 내세운 에미레이트항공 new 랭크뉴스 2025.07.12
54893 NHK “北·中, 평양-베이징 여객열차 운행 재개 합의” new 랭크뉴스 2025.07.12
54892 나경원 “윤석열 탄핵 반대 왜 사과해야 하냐…이미 탈당” new 랭크뉴스 2025.07.12
54891 한동훈 "전작권 전환하면 미군 철수할 수도…국민 동의 구해야" new 랭크뉴스 2025.07.12
54890 강훈식 비서실장 “내각 인선해보니 대통령 눈 너무 높아” new 랭크뉴스 2025.07.12