AI 학습 데이터를 통제하는 자가 AI를 통제한다
2025년, 인공지능(AI)은 산업 전반에 깊숙이 자리 잡았다. 그러나 AI 학습의 기반이 되는 데이터가 실제로 누군가의 창작물일 수 있다는 점에서, 학습데이터의 저작권 문제는 여전히 미해결 과제로 남아 있다. 각국은 AI 기술 혁신과 창작자 권리 보호 사이에서 균형을 찾기 위한 제도적 해석과 조정을 시도하고 있다.
영국, 공공협의를 통한 저작권 예외 조항 검토
영국 정부는 2024년 12월 17일부터 2025년 2월 25일까지 ‘저작권과 인공지능(Copyright and Artificial Intelligence)’을 주제로 대규모 공공협의를 실시했다. 협의에서는 상업적 텍스트 및 데이터 마이닝(Text and Data Mining, TDM)에 대한 저작권 예외 조항으로 다음 세 가지 안이 제시되었다.
1안. 상업적 TDM 수행 시 저작권자 허락 필수
2안. 상업적 TDM에 대한 전면 면책 도입
3안. 권리자가 명시적으로 거부(opt-out)한 경우를 제외하고 TDM 면책 허용 + 데이터 출처 공개 의무 부과
영국 정부는 3안을 선호하고 있으며, 이는 유럽연합의 ‘디지털 단일시장 저작권 지침(Directive 2019/790)’과 유사한 접근이다.
일본·싱가포르: 예외 조항을 통한 산업 친화적 환경 조성
일본은 2018년 저작권법 개정을 통해, 감상 목적이 아닌 저작물 활용에 대해 일정 조건 하에 자유 이용을 허용했다. 이는 AI 학습 목적의 데이터 사용을 실질적으로 열어주는 조치다. 싱가포르도 2021년 저작권법 개정을 통해 ‘컴퓨팅 데이터 분석(Computational Data Analysis, CDA)’을 위한 저작물 이용을 면책 대상으로 규정했다. 다만, 이용자는 저작물에 합법적으로 접근할 수 있어야 한다는 조건이 붙는다.
유럽연합, 권리 유보 기반의 조건부 면책
유럽연합은 2019년 디지털단일시장 지침(DSM Directive)을 통해 TDM에 대한 면책 규정을 도입했다. 특히 연구 목적 외 상업적 TDM도 면책 대상으로 포함하되, 권리자가 사전 유보(opt-out)한 경우에는 예외적으로 면책이 적용되지 않도록 했다. 이는 AI 산업 진흥과 저작권 보호 간의 균형을 모색한 사례다.
미국, 공정이용(Fair Use) 원칙에 대한 제동
미국은 그간 AI 학습에 있어 연방저작권법 제107조의 ‘공정이용(Fair Use)’ 원칙을 중심으로 해석해왔다. 그러나 2025년 2월 11일, 델라웨어 지방법원은 톰슨 로이터(Thomson Reuters)가 AI 법률 검색엔진 로스 인텔리전스(Ross Intelligence)를 상대로 제기한 소송에서 저작권 침해를 인정하며 기존 관행에 제동을 걸었다.
법원은 로스 인텔리전스가 상업적 이익을 추구하며, 원문에 가까운 형태로 데이터를 활용했고, 원 저작물의 시장을 대체한다는 점에서 공정이용이 성립하지 않는다고 판단했다.
이어 2025년 5월 9일, 미국 저작권청(US Copyright Office)은 AI 학습을 위한 저작물의 대규모 상업적 활용이 공정이용 요건에 부합하지 않을 수 있다는 입장을 공식 보고서를 통해 밝혔다. 이는 AI 기업의 데이터 수집 및 사용 관행에 구조적 재검토가 필요함을 시사하는 대목이다.
한국, 제도개선 협의체 운영 및 6월 말 ‘AI 저작권 안내서’ 발표 예정
문화체육관광부와 한국저작권위원회는 2025년 3월 ‘인공지능 저작권 제도개선 협의체’를 출범하고, ▲AI 학습데이터 제도 분과 ▲데이터 거래 활성화 분과 ▲AI 산출물 활용 분과 등 3개 분과 중심으로 제도 개선 논의를 진행해왔다.
특히 산출물 활용 분과는 현재 ▲「생성형 인공지능 저작물 저작권 등록 안내서」와 ▲「AI 결과물에 의한 저작권 분쟁 예방 안내서」의 초안을 마무리하고 있다. 두 안내서는 2025년 6월 20일 대국민 설명회를 거쳐 이달 말 최종 발간될 예정이다.
이 안내서에는 생성형 AI 결과물의 저작권 등록 가능성, 등록 절차 및 사례, 그리고 저작권 침해 판단 기준과 분쟁 예방 가이드라인 등이 담길 예정이다. 이는 AI 기업, 창작자, 일반 이용자 모두에게 법적 기준과 실무 지침을 제공하는 최초의 공식 가이드로, 한국의 AI 저작권 정책 전환의 분기점이 될 것으로 보인다.
디즈니·유니버설 vs 미드저니: 콘텐츠 기업의 반격
2025년 6월 11일, 월트디즈니컴퍼니(Walt Disney Company)와 유니버설스튜디오(Universal Studios)는 AI 이미지 생성 서비스 미드저니(Midjourney)를 상대로 저작권 침해 소송을 제기했다.
이들은 미드저니가 자사 IP인 스타워즈, 심슨 가족, 슈렉, 미니언즈 등의 캐릭터 이미지를 무단 수집해 모델 학습에 활용했다고 주장하며, 콘텐츠 권리자의 통제권을 강조했다.
이 사건은 AI 산업이 관행적으로 수집해온 온라인 데이터를 둘러싸고, 법적 책임을 직접적으로 묻는 전례로 기록될 가능성이 크다. AI 학습과 저작권 간 경계를 재정의할 분수령이 될 수 있다.
“데이터를 통제하는 자가 AI를 통제한다”
AI 기술의 미래는 더 이상 알고리즘에만 달려 있지 않다. 학습데이터의 양과 질, 그리고 그것을 합법적으로 활용할 수 있는 권리 구조가 핵심 경쟁력이 되었다. 알고리즘은 누구나 개발할 수 있지만, 법적으로 보호되는 데이터와 그 활용 권한은 국가와 기업이 통제할 수 있는 전략 자산으로 떠올랐다.
일본과 싱가포르는 저작권 예외 조항을 통해 산업 혁신을 유도하고 있으며, 유럽은 권리 유보 원칙을 통해 창작자 보호를 강화하고 있다. 미국은 공정이용의 범위를 좁히며 AI 산업의 데이터 활용에 실질적 제한을 두기 시작했다.
결국, ‘누가 데이터를 통제하느냐가 AI를 통제한다’는 명제는 더 이상 과장이 아니다. AI 학습데이터 저작권을 둘러싼 각국의 정책과 판결은, 기술 주도권을 둘러싼 조용하지만 치열한 전쟁의 서막을 알리고 있다.
테크풍운아 칼럼니스트 tlswnqor@naver.com
- [권영설의 경영 칼럼] AI 르네상스, 창조의 시대가 다시 시작됐다
- “챗GPT 써봤다”는 사람, 벌써 1천만 명 넘었다
- "지브리풍 AI 이미지, 저작권 괜찮을까?"
- AI가 생각하기 시작했다
- “이제 클로바가 아니라 청와대다” 하정우, 대통령실 AI미래기획수석 발탁
- BBC와 퍼플렉시티의 충돌... 생성형 AI 시대, 미디어 룰은 바뀌어야 한다
- 美법원 "AI 훈련 위한 책 사용은 '공정 이용'"…앤스로픽 승소
- 에어버스·ASML 등 유럽 대기업 "EU AI법 연기하라"
- 나노 바나나 AI, 공개되지 않은 채 압도했다… 구글발 생성형 혁신인가
- "AI로 우리 기사 요약하지 마!" 美 언론사, 구글에 첫 소송
- AI 무단 크롤링 논란 확산…‘제로 클릭’ 시대, 콘텐츠 생태계의 역습