DeepSeek 正式发布了并开源了其最新的大型语言模型 R1。这款模型表现卓越,被认为与 OpenAI 的官方版本 o1 相当。这一举措不仅标志着国内 AI 技术的又一重大突破,也为全球 AI 开发者提供了新的选择。
DeepSeek R1 在后训练阶段广泛运用了强化学习技术,即使在仅有少量标注数据的情况下,也能显著提升模型的推理能力。在数学、编程和自然语言推理等关键任务中,DeepSeek R1 的表现与 OpenAI 的官方版本 o1 相当,展示了其强大的能力。
为了回馈开源社区,DeepSeek 还开源了两个模型:DeepSeek-R1 和 DeepSeek-R1-Zero,参数量均为 660B。此外,通过模型蒸馏技术,DeepSeek 还开源了六个较小的模型,包括参数量为 32B 和 70B 的模型。这些较小的模型在多种能力上超过了 OpenAI 的 o1-mini,进一步丰富了开源生态系统。
在 API 定价方面,DeepSeek 也展现出了开放的态度:命中缓存的成本仅为每百万输入标记 1 元,未命中缓存的成本为每百万输入标记 4 元;输出标记的成本为每百万 16 元,整体定价更具竞争力。
DeepSeek R1 采用标准的 MIT 许可证授权使用,允许用户不受限制地进行商业使用。此外,DeepSeek 鼓励用户利用 R1 的输出来训练其他模型,进一步推动 AI 技术的普及和发展。DeepSeek R1 的开源无疑将为全球开发者提供更强大的工具,并注入新的活力到 AI 技术的创新和应用中,预示着 AI 技术民主化时代的加速到来。
总结:本文介绍了 DeepSeek 最新发布的大型语言模型 R1 及其开源情况。R1 在多个任务中的表现与 OpenAI 的官方版本相当,并且通过多种方式支持开发者和研究者。此外,它还提供了开放的 API 定价和 MIT 许可证授权使用条件,促进了 AI 技术的发展和普及。