코난의 5줄 기사 요약

AI학습 사이트 톱10중 절반이 뉴스

에도가와 코난 2024. 5. 4. 19:29
728x90
반응형

 

글로벌 빅테크 간에 인공지능(AI) 모델 경쟁이 불붙으면서, 개발 과정에 필수적인 AI 학습 콘텐츠의 저작권을 둘러싼 논란이 전 세계적으로 거세지고 있다. 빅테크는 AI 모델로 막대한 수익을 얻고 있지만, AI 개발 때 양질의 뉴스 콘텐츠를 대거 사용하고도 합당한 사용료를 내지 않는다는 지적이 잇따르고 있다.

 AI에 가장 많은 정보를 제공한 웹사이트 상위 10개 중 5개가 뉴스 사이트인 것으로 나타났다. 미국의 뉴욕타임스(NYT)가 4위, LA타임스가 6위, 영국의 가디언이 7위였다. 웹사이트 리스트를 상위 100개로 늘려도 뉴스 사이트는 51개로 비중이 절반을 넘어섰다.

 AI 업계 관계자는 “언론 외 다른 웹사이트의 콘텐츠도 뉴스를 인용하거나 참고한 것이 많다”며 “콘텐츠의 출발점까지 거슬러 가면, AI 학습에 뉴스 콘텐츠의 기여도는 압도적”이라고 말했다.

“뉴스를 중심으로 양질의 데이터를 확보하는 것이 AI 업체의 격전지가 될 것”이라며 “데이터 품질을 높이는 데 도움이 되는 회사를 인수하거나 콘텐츠 사용료를 내는 등 협력 움직임이 많아질 수밖에 없다”

테크 업계 관계자는 “다양한 블로그나 유튜브, 심지어는 논문까지 뉴스에서 보도된 사안을 재생산하는 경우가 많기 때문에, 실제로 AI 훈련에 사용되는 뉴스 콘텐츠는 단순 뉴스 웹사이트 이상으로 많다고 봐야 한다”고 말했다.

728x90
반응형