最近,关于人工智能版权的一起案件——Kadrey v. Meta案,法院解封了Meta内部的邮件,揭示了该公司高管们决心在Llama3的发展中超越OpenAI的GPT-4模型。
Meta生成式AI副总裁Ahmad Al-Dahle在2023年10月的一封邮件中提到:“坦白地说,我们的目标必须是GPT-4。我们拥有64,000块GPU!我们需要学习如何构建前沿技术并赢得这场竞争。”
尽管Meta已经发布了开源AI模型,但公司的AI领导层显然更关注那些不公开分享模型权重的竞争者,如Anthropic和OpenAI,将他们的Claude和GPT-4视为标杆。尽管频繁提及法国AI初创公司Mistral,但Meta高管似乎对此不屑一顾。Al-Dahle在一封邮件中表示:“Mistral对我们来说不过是小菜一碟;我们应该做得更好。”
在AI领域,各大公司都在竞相推出先进的AI模型。这些法庭文件揭示了Meta在这场竞争中的高度紧张氛围。在几封邮件中,Meta的AI领导者指出他们“非常积极”地获取训练Llama所需的数据,并且一位高管甚至说:“Llama3是我唯一关心的事情。”他们讨论了如何改进数据集以提升Llama3的表现。
然而,在这起案件中,检察官指控Meta高管可能因急于推出AI模型而忽视了数据使用问题,涉及一些受版权保护的书籍。Touvron提到Llama2的数据集组合表现不佳,并探讨了如何使用更好的数据源来改进Llama3。Al-Dahle问道:“我们有足够的数据集吗?有没有因为愚蠢的原因不能使用的数据?”
此前,Meta CEO马克·扎克伯格表示正在努力缩小Llama模型与OpenAI和Google等公司封闭源代码模型之间的性能差距。这些内部邮件显示Meta承受着巨大的压力来实现这一目标。扎克伯格在一封7月2024年的信中提到:“今年,Llama3在最先进的模型中具有竞争力,并且在某些领域领先。”
2024年4月,Meta最终发布了Llama3,在比赛中表现出色,超越了Mistral的开源选项。然而,用于训练该模型的数据——据报道得到了扎克伯格的批准——正受到多起诉讼的审查。
这篇文章主要讲述了关于人工智能版权案件——Kadrey v. Meta案中解封的内部邮件内容。这些邮件揭示了Meta公司高管们决心超越OpenAI的GPT-4模型,在开发Llama3方面取得了显著进展。同时,文章也提到了公司在获取数据和使用受版权保护的数据方面面临的挑战,并强调了扎克伯格对改进和提升Llama系列模型的信心。重点:
🌟 Meta高管们专注于在Llama3的发展中超越OpenAI的GPT-4模型。
💡 公司积极获取数据但面临使用受版权保护数据的指控。
📈 扎克伯格期待未来的Llama模型成为行业中最先进的选择。