苹果英伟达涉使用争议资源训练AI模型

17 7 月 2024

苹果英伟达涉使用争议资源训练AI模型

近日，一家名为ProofNews的非营利性新闻工作室发布了一篇关于大型科技公司使用YouTube视频资源训练AI模型的报道。根据该报道，包括苹果、英伟达、Salesforce和Anthrophic在内的多家知名科技公司在训练AI模型时，都使用了名为YouTube Subtitles的5.7GB数据集，该数据集包含约4.89亿个单词。这一数据集由EleutherAI于2020年创建，涵盖超过48,000个频道的173,536个YouTube视频字幕内容，其中还包括12,000多个已删除的视频字幕。

据悉，YouTube Subtitles数据集主要用于收集热门YouTube频道的资源。该数据集已被广泛应用于训练AI模型，以提高这些模型的自然语言处理能力。然而，这也引发了对AI技术伦理问题的讨论，如隐私保护、信息安全和数据合规等。

随着人工智能技术的快速发展，如何确保其在遵循道德和法律规范的前提下得到安全有效的应用，已成为当下亟待解决的问题。对于此类问题，我国政府和相关部门正在加强监管，以确保AI技术能够造福社会，而非给人类带来潜在的风险。

分秒AI研究院

分秒AI研究院

苹果英伟达涉使用争议资源训练AI模型

分秒AI

发表回复取消回复

分秒AI研究院

分秒AI研究院

苹果英伟达涉使用争议资源训练AI模型

苹果英伟达涉使用争议资源训练AI模型

分秒AI

发表回复 取消回复

发表回复取消回复