在Meta涉及的一起人工智能版权案件中,Kadrey v. Meta揭示了该公司在开发Llama3过程中面临的激烈竞争和潜在的版权问题。Meta的高层管理者和研究人员全身心投入,力求超越OpenAI和Anthropic等竞争对手,在AI模型开发方面达到顶尖水平。
强烈的竞争精神:Meta誓言超越OpenAI
Meta生成式AI副总裁Ahmad Al-Dahle表示,Llama3的研发目标明确指向GPT-4,希望通过高效的硬件支持,如64k GPU来获得竞争优势。他在内部邮件中写道:“我们将推出64k GPU!我们需要学习如何构建尖端技术并赢得这场竞赛。”
尽管Meta发布了开源AI模型,但其高层更专注于击败像OpenAI和Anthropic这样的竞争对手。这些竞争对手通常不会公开分享其模型权重,而是将其模型置于API后面,从而形成强烈的竞争焦点。
轻视Mistral及内部焦虑
Mistral是Meta最大的公开竞争对手之一,但Meta的高层显然对其不屑一顾。Al-Dahle在一封邮件中表示:“Mistral对我们来说微不足道;我们应该做得更好。”这也暴露了Meta在AI竞赛中的极端焦虑以及他们在行业中的强烈雄心。
同时,Meta的AI领导者经常讨论如何积极收集数据以训练Llama3,在内部邮件中还透露出他们对Llama3非常乐观的态度。一位高管甚至在邮件中提到:“Llama3是我真正关心的东西。”
版权问题与法律挑战
随着Meta在Llama3开发中面临激烈的竞争,他们使用的训练数据开始引发法律争议。检察官指控Meta的高管可能为了快速开发AI而忽视了版权问题,并使用了受版权保护的书籍作为训练数据。
研究者Hugo Touvron在一封邮件中透露,训练Llama2所用的数据集组合“非常糟糕”,建议通过改进数据集来优化Llama3,并讨论了清除使用LibGen数据集(其中包括来自Cengage Learning、Macmillan Learning、McGraw Hill和Pearson Education等出版商的受版权保护的作品)障碍的问题。
尽管存在版权问题,但Meta CEO马克·扎克伯格强调,Meta将继续推进Llama模型的发展,并缩小与OpenAI和Google等封闭模型之间的差距。
Meta的未来展望与Llama3的市场地位
2024年7月,扎克伯格表示Llama3的表现已经达到了最先进AI模型的水平,并在某些方面领先。他预计从2025年开始,Meta的Llama系列将成为行业的最先进AI模型。然而,由于其训练数据面临的法律审查不断增加,Llama3的发布仍然面临激烈的版权诉讼。
总结:本文介绍了Meta在开发Llama3过程中面临的激烈竞争、内部焦虑以及由此引发的版权问题和法律挑战。尽管存在诸多困难,但Meta依然致力于超越竞争对手,并期望在未来成为行业领先的AI模型开发者。