最近,北京月光暗面科技有限公司宣布了其智能助手Kimie的一项重要技术升级,推出了新的k1.5多模态思维模型。这一模型在多模态推理和通用推理能力方面达到了行业领先水平,标志着Kimie在人工智能领域的又一突破。
在短短三个月内,k1.5多模态思维模型是Kimie k系列强化学习模型的第三次重大升级。继去年11月发布的k0-math数学模型和去年12月发布的k1视觉思维模型之后,k1.5模型在基准测试中表现出色。在短-CoT模式下,k1.5的数学、编程、视觉多模态和通用能力显著超越了全球公认的短推理SOTA模型GPT-4o和Claude3.5Sonnet,高出550%。而在长-CoT模式下,k1.5的数学、编程和多模态推理能力也达到了OpenAI o1官方版本的水平,使其成为除OpenAI之外第一个实现与o1官方版本相当的多模态推理性能的公司。
这一升级是Kimie技术团队不懈努力和创新的结果。团队已公开发布了一份详细的模型训练技术报告《Kimie k1.5:通过大型语言模型扩展强化学习》,记录了在新科技范式下的模型训练探索。
报告强调了k1.5模型的关键创新之处,包括长上下文扩展,通过部分展开技术提高训练效率,并指出增加上下文长度可以持续提升模型性能。此外,改进的策略优化方法和简化的设计框架支持了该模型的强大表现。值得注意的是,k1.5模型同时训练了文本和视觉数据,使它能够在两个模态之间进行联合推理,尤其擅长数学能力,但在处理依赖图形理解的几何问题方面仍面临挑战。
为了进一步增强短链推理能力,团队还提出了一种有效的长转短方法(long2short),利用长-CoT技术改进短-CoT模型,在AIME、MATH500和LiveCodeBench等测试中取得了显著成果,远超现有短链推理模型如GPT-4和Claude Sonnet3.5。
k1.5多模态思维模型的预览版将逐步在Kimi.com网站和最新版的Kimi智能助手应用中推出。用户可以在使用过程中找到模型切换按钮来体验这一新升级的模型。k1.5模型擅长深度推理,帮助用户解决复杂的编程问题、数学难题以及工作相关的挑战。
北京月光暗面科技有限公司表示,在2025年将继续沿着既定路线图加速对k系列强化学习模型的升级,在更多领域提供更多的模态能力和更强的一般能力,为用户提供更多可能性。
GitHub报告链接:https://github.com/MoonshotAI/kimi-k1.5
总结:本文介绍了北京月光暗面科技有限公司为其智能助手Kimie推出的最新技术升级——k1.5多模态思维模型。该升级不仅提升了多项关键能力,并且展示了与现有SOTA(当前最佳)水平相比的巨大进步。文章还详细描述了该升级背后的创新技术和方法,并展望了未来的发展方向。