最近,位于杭州的AI公司DeepSeek发布了其最新的大型语言模型——V3。这款开源模型在多项基准测试中的表现与OpenAI的40和Anthropic的Claude 3.5 Sonnet相当,引起了行业的关注。
图片来源说明:图片由AI生成,由服务提供商Midjourney授权。
DeepSeek的CEO梁文峰表示,资金从来不是他们的问题。尽管V3是在H800芯片上训练的,但DeepSeek团队仍然展示了强大的研究和工程能力,即使资源有限。
AI先锋Andrej Karpathy评论说,DeepSeek的投资预算“真的太低了”,但最终结果却是“在资源有限的情况下取得的高度令人印象深刻的研究和工程成果”。
AGI被认为是AI研究的“圣杯”,能够超越人类在解决问题和执行任务方面的表现。专家预测,一旦这项技术成熟,率先实现AGI的国家将在经济、科学和安全方面获得显著优势。
总结:本文介绍了DeepSeek公司发布的最新大型语言模型V3及其在基准测试中的出色表现。尽管投资预算较低,DeepSeek团队依然展示了强大的研究和工程能力。AGI被视为AI研究的重要目标,其成熟将对国家的经济、科学和安全产生重大影响。