![[사진=셔터스톡]](https://cdn.fortunekorea.co.kr/news/photo/202311/31336_22758_2735.jpg)
미국의 뉴스 미디어 얼라이언스(NMA, 구미국신문협회)가 지난 31일(현지시간) 챗GPT 및 초대규모언어모델(LLMs)의 콘텐츠 불법 복제 문제를 담은77쪽짜리 백서를 발표했다.NMA는 뉴욕타임스 등 2200여개의 미국 내 언론매체를대표하는 단체다.
백서에 따르면, AI 챗봇은훈련 과정에 있어무료 슬롯 머신 다운 받기 의존도가 높아저작권을 침해하는 답변을 생성할 수 있다.
NMA는 "생성형 AI는 수많은 콘텐츠 생산자들의 노력을 토대로 만들어진상업적 제품"이라고 주장했다.
특히 이들은 개발자들이 LLMs를 훈련시키는 데 사용한 콘텐츠를공개하지 않아, 정확히 어떤 데이터가 복제되었는지 알기 힘든 점을 지적한다. LLMs는 방대한 텍스트 정보를토대로 문장을 이해하고 생성하는AI 모델을 뜻한다.
NMA는 LLMs 훈련 과정에사용된 것으로 추정되는 데이터 샘플을 분석했다. 이후 "LLMs가커먼 크롤(Common Crawl)과 같은 오픈 웹사이트보다 뉴스, 매거진, 디지털 미디어 출판물의 데이터를5~100배가량 자주사용했다"는 결론을 내렸다.
다니엘 코피(Danielle Coffey) NMA 대표이사는 "우리의 무료 슬롯 머신 다운 받기가 거의 똑같이 재생산되는 것을 확인할 수 있었다"고 말했다.
백서는"이는 저작권이 있는 자료를 특정 목적을 위해 허가 없이 복제하는행위로,법률에 위배된다"고 강조했다.
이세연 기자 mvdirector@fortunekorea.co.kr