Press ESC to close

国内开源大型模型DeepSeek R1正式发布,性能超越o1模型,成本降低90%

最近,中国的DeepSeek团队推出了一款最新的开源大型模型R1,引起了广泛的关注。R1模型的表现极为出色,在多项测试中超越了OpenAI的o1模型,特别是在数学和编程相关的评估中表现尤为突出。

image.png

在最新举行的美国AIME2024测试中,R1获得了79.8分,超过了o1的79.2分。在MATH-500测试中,R1的成绩为97.3分,比o1的96.4分更高。此外,在SWE-bench Verified测试中,R1的成绩为49.2分,超过了o1的48.9分。虽然在Codeforces编程测试中,R1仅比o1低了0.3分,但整体表现与o1模型相当。

除了性能之外,R1的成本优势更为显著。OpenAI的o1模型每百万个输入令牌收费高达$15,而R1的成本仅为$0.14,降低了90%。对于输出部分,o1每百万个令牌收费$60,而R1只需要$2.19,实现了27倍的成本减少。这一显著的成本差异使R1在开源大型模型领域脱颖而出。

DeepSeek团队宣布开源R1后,许多外国网友对其表示赞赏,认为在成本效益和性能方面,R1超越了Meta和Mistral等现有的开源平台。许多用户表示,R1高效的推理能力使其在代码编写和数学解释方面表现出色,并有人称其为“最接近人类内心独白的模型”。此外,苹果公司的机器学习研究员Awni Hannun也测试了R1,并发现它在Apple M2 Ultra上运行迅速且高效。

R1模型的研发经历了多个阶段的训练过程,包括冷启动数据和多阶段训练等步骤,以增强其推理能力和可读性。这些技术改进确保了R1模型在各种任务中的出色表现。

R1的发布再次引起了国际市场上对中国的开源大型模型的关注和讨论。许多科技爱好者对这款模型的潜力充满期待。R1的发布标志着中国在大型模型技术领域取得了进一步突破,并促进了开源技术的发展。

开源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

关键点:

🌟 R1模型在多项测试中超越了OpenAI的o1,在性能上表现出色。

💰 R1的输入和输出成本分别为$0.14和$2.19,成本降低了90%。

🚀 R1自开源以来受到了广泛关注,并获得了许多外国专家的高度评价及认可。

总结:文章介绍了中国的DeepSeek团队最新推出的开源大型模型R1的表现及其成本优势。通过多个测试表明,R1在数学和编程相关任务上超越了OpenAI的o1模型,并且具有显著的成本降低优势。文章还提到了多位专家对R1的认可以及其在全球范围内的关注和讨论。
Douglas Lemke

Hi, I’m Douglas Lemke, Your Blogging Journey Guide 🖋️. Writing, one blog post at a time, to inspire, inform, and ignite your curiosity. Join me as we explore the world through words and embark on a limitless adventure of knowledge and creativity. Let’s bring your thoughts to life on these digital pages. 🌟 #BloggingAdventures

Leave a comment

Your email address will not be published. Required fields are marked *

@Katen on Instagram