苹果英伟达涉使用争议资源训练AI模型

近日,一家名为ProofNews的非营利性新闻工作室发布了一篇关于大型科技公司使用YouTube视频资源训练AI模型的报道。根据该报道,包括苹果、英伟达、Salesforce和Anthrophic在内的多家知名科技公司在训练AI模型时,都使用了名为YouTube Subtitles的5.7GB数据集,该数据集包含约4.89亿个单词。这一数据集由EleutherAI于2020年创建,涵盖超过48,000个频道的173,536个YouTube视频字幕内容,其中还包括12,000多个已删除的视频字幕。

据悉,YouTube Subtitles数据集主要用于收集热门YouTube频道的资源。该数据集已被广泛应用于训练AI模型,以提高这些模型的自然语言处理能力。然而,这也引发了对AI技术伦理问题的讨论,如隐私保护、信息安全和数据合规等。

随着人工智能技术的快速发展,如何确保其在遵循道德和法律规范的前提下得到安全有效的应用,已成为当下亟待解决的问题。对于此类问题,我国政府和相关部门正在加强监管,以确保AI技术能够造福社会,而非给人类带来潜在的风险。

发表回复