科技巨头陷AI训练风波：苹果、英伟达等被指违法使用17.3万YouTube视频培训AI模型

2025/3/12 22:42:20 来源：https://blog.csdn.net/zhuzongpeng/article/details/140507810 浏览: 次关键词：科技巨头陷AI训练风波：苹果、英伟达等被指违法使用17.3万YouTube视频培训AI模型

一份由Proof News和Wired联合开展的调查显示，包括苹果（Apple）、英伟达（Nvidia）在内的多家全球知名公司涉嫌违反YouTube的服务条款，利用从该平台抓取的约17.3万个视频的文本字幕来训练人工智能（AI）系统。这些视频字幕数据被整合进一个名为“The Pile”的800GB大型训练数据集中，该数据集由非营利组织EleutherAI创建，旨在“民主化”AI研究，使得更多人能够接触和研究基础模型，而不只是局限于少数几家公司。

然而，这一做法触犯了YouTube的使用条款，因为其未经允许使用了YouTube的内容，并采取自动化手段获取数据。尽管EleutherAI在其研究论文中承认了这一违规行为，但辩称用于抓取数据的工具已经广泛存在，他们的行为并未造成额外伤害。尽管如此，许多受影响的内容创作者对此表示愤怒和沮丧，认为这种行为侵犯了他们的权益，且事先未获得任何授权或通知。

例如，哲学频道Philosophy Tube的制作者Abigail Thorn表示，得知自己的内容被非法用于AI训练后感到极度侵犯，甚至萌生了放弃创作的念头。她呼吁YouTube应该采取更多措施防止此类盗窃行为的发生。

报道指出，由于苹果等科技巨头并非直接从事数据抓取工作，它们在一定程度上规避了责任，但此事引发了关于AI训练数据伦理来源的重要讨论。而EleutherAI至今未就此事发表评论，其在最初的研究论文中否认有任何不当行为或造成的损害。

随着AI硬件投资的快速增长，市场需要巨额利润来支撑其硬件采购需求，这可能导致未来出现更多非法获取数据的事件，如同此次YouTube视频字幕的使用情况，以及Google Gemini项目未经许可读取文件的案例。这一趋势让人担忧，网络内容的创造者可能会越来越频繁地面临作品被滥用的风险。

科技巨头陷AI训练风波：苹果、英伟达等被指违法使用17.3万YouTube视频培训AI模型

最新新闻

热搜词