国内开源大型模型DeepSeek R1正式发布，性能超越o1模型，成本降低90%

最近，中国的DeepSeek团队推出了一款最新的开源大型模型R1，引起了广泛的关注。R1模型的表现极为出色，在多项测试中超越了OpenAI的o1模型，特别是在数学和编程相关的评估中表现尤为突出。

在最新举行的美国AIME2024测试中，R1获得了79.8分，超过了o1的79.2分。在MATH-500测试中，R1的成绩为97.3分，比o1的96.4分更高。此外，在SWE-bench Verified测试中，R1的成绩为49.2分，超过了o1的48.9分。虽然在Codeforces编程测试中，R1仅比o1低了0.3分，但整体表现与o1模型相当。

除了性能之外，R1的成本优势更为显著。OpenAI的o1模型每百万个输入令牌收费高达$15，而R1的成本仅为$0.14，降低了90%。对于输出部分，o1每百万个令牌收费$60，而R1只需要$2.19，实现了27倍的成本减少。这一显著的成本差异使R1在开源大型模型领域脱颖而出。

DeepSeek团队宣布开源R1后，许多外国网友对其表示赞赏，认为在成本效益和性能方面，R1超越了Meta和Mistral等现有的开源平台。许多用户表示，R1高效的推理能力使其在代码编写和数学解释方面表现出色，并有人称其为“最接近人类内心独白的模型”。此外，苹果公司的机器学习研究员Awni Hannun也测试了R1，并发现它在Apple M2 Ultra上运行迅速且高效。

R1模型的研发经历了多个阶段的训练过程，包括冷启动数据和多阶段训练等步骤，以增强其推理能力和可读性。这些技术改进确保了R1模型在各种任务中的出色表现。

R1的发布再次引起了国际市场上对中国的开源大型模型的关注和讨论。许多科技爱好者对这款模型的潜力充满期待。R1的发布标志着中国在大型模型技术领域取得了进一步突破，并促进了开源技术的发展。

开源地址：https://huggingface.co/deepseek-ai/R1

API：https://api-docs.deepseek.com/guides/reasoning_model

关键点：
🌟 R1模型在多项测试中超越了OpenAI的o1，在性能上表现出色。
💰 R1的输入和输出成本分别为$0.14和$2.19，成本降低了90%。
🚀 R1自开源以来受到了广泛关注，并获得了许多外国专家的高度评价及认可。

总结：文章介绍了中国的DeepSeek团队最新推出的开源大型模型R1的表现及其成本优势。通过多个测试表明，R1在数学和编程相关任务上超越了OpenAI的o1模型，并且具有显著的成本降低优势。文章还提到了多位专家对R1的认可以及其在全球范围内的关注和讨论。

国内开源大型模型DeepSeek R1正式发布，性能超越o1模型，成本降低90%

Leave a comment

Tag Clouds

Press ESC to close

国内开源大型模型DeepSeek R1正式发布，性能超越o1模型，成本降低90%

Leave a comment

Tag Clouds

Newsletter