您的位置:首页 > 新闻 > 热点要闻 > 科技巨头陷AI训练风波:苹果、英伟达等被指违法使用17.3万YouTube视频培训AI模型

科技巨头陷AI训练风波:苹果、英伟达等被指违法使用17.3万YouTube视频培训AI模型

2025/3/12 22:42:20 来源:https://blog.csdn.net/zhuzongpeng/article/details/140507810  浏览:    关键词:科技巨头陷AI训练风波:苹果、英伟达等被指违法使用17.3万YouTube视频培训AI模型

一份由Proof News和Wired联合开展的调查显示,包括苹果(Apple)、英伟达(Nvidia)在内的多家全球知名公司涉嫌违反YouTube的服务条款,利用从该平台抓取的约17.3万个视频的文本字幕来训练人工智能(AI)系统。这些视频字幕数据被整合进一个名为“The Pile”的800GB大型训练数据集中,该数据集由非营利组织EleutherAI创建,旨在“民主化”AI研究,使得更多人能够接触和研究基础模型,而不只是局限于少数几家公司。

然而,这一做法触犯了YouTube的使用条款,因为其未经允许使用了YouTube的内容,并采取自动化手段获取数据。尽管EleutherAI在其研究论文中承认了这一违规行为,但辩称用于抓取数据的工具已经广泛存在,他们的行为并未造成额外伤害。尽管如此,许多受影响的内容创作者对此表示愤怒和沮丧,认为这种行为侵犯了他们的权益,且事先未获得任何授权或通知。

例如,哲学频道Philosophy Tube的制作者Abigail Thorn表示,得知自己的内容被非法用于AI训练后感到极度侵犯,甚至萌生了放弃创作的念头。她呼吁YouTube应该采取更多措施防止此类盗窃行为的发生。

报道指出,由于苹果等科技巨头并非直接从事数据抓取工作,它们在一定程度上规避了责任,但此事引发了关于AI训练数据伦理来源的重要讨论。而EleutherAI至今未就此事发表评论,其在最初的研究论文中否认有任何不当行为或造成的损害。

随着AI硬件投资的快速增长,市场需要巨额利润来支撑其硬件采购需求,这可能导致未来出现更多非法获取数据的事件,如同此次YouTube视频字幕的使用情况,以及Google Gemini项目未经许可读取文件的案例。这一趋势让人担忧,网络内容的创造者可能会越来越频繁地面临作品被滥用的风险。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com