2024年,各种轻量级的语言模型纷纷登场。从微软的Phi系列、谷歌的Gemma,到Meta较小版本的Llama模型,这些模型都具有生成类人类语言的能力,但训练数据量较小,参数也更少。它们被认为更容易训练和使用,消耗的计算资源较少,成本更低,并且更适合特定任务。
来年2025年,小模型将带来巨大影响,在人工智能领域发挥关键作用。
高管们表示,小型语言模型(SLMs)将在未来一年推动人工智能的普及和商业应用。
“小型语言模型将是明年的一大主题,”Infosys首席执行官Salil Parekh在接受ET采访时说,“它们的影响更大是因为它们使用的是规模较小的数据集,这些数据集在组织内部更为常见,通过它们可以实现更深入的影响。
组织也希望更多地处理自己的数据集,而不仅仅是通用领域的数据。
”他补充道。
就像大型语言模型(LLMs),SLMs也能生成类人类的语言,但它们是基于规模较小的数据集进行训练的,参数较少。
据称,它们更容易训练和使用,消耗的计算资源更少,成本效益更高,并且更适合特定任务。
2024年见证了众多轻量级模型的推出,从微软的Phi家族小型语言模型到谷歌的Gemma以及Meta较小版本的Llama模型。
“2024年全年,大型语言模型在各种AI任务中推动了准确性边界的发展,而小型语言模型则推动了大规模采用和真正的人工智能民主化,”微软印度开发中心AI和搜索总裁Sundar Srinivasan表示。
SLMs高度准确且低幻觉的特点使它们立即适用于医疗保健和银行业等隐私敏感和关键领域,在这些领域中预计将在2025年增加采用率。
Srinivasan补充说,在医疗保健领域,它们可以显著增强患者互动和支持,特别是在缺乏医疗专家的地区。
应用场景包括转录患者互动、电子健康记录的数据录入以及初步诊断支持。
在银行业或金融领域,SLMs将帮助提供个性化的金融建议、欺诈检测以及文档分析和处理。
Srinivasan说。
来年,SLMs将成为焦点。
由于需要使大型语言模型在商业上具有可扩展性,并且其工具更加面向开发者以适应特定需求和应用场景的需求调整,“IBM印度软件实验室副总裁Vishal Chahal”表示。
他还指出,“2024年的开源项目为开发者提供了使用大型语言模型调整小型语言模型的机会。
”“2025年及以后,小型语言模型将嵌入到业务流程中,并能够在边缘设备和本地基础设施上运行,让用户能够控制这些技术与数据交换的方式。
”Chahal说。
此外,在移动设备、物联网和边缘设备等资源有限的情况下以及特定客户导向的任务和个人化支持方面,它们将成为实时生成式AI应用的理想选择。
“专家表示这些较小的模型将能够驱动更个性化的数字代理和助手以提供定制化的体验和响应。
例如,在客户支持方面将看到个性化、效率、客户同理心以及语言多样性的管理方面的显著改进。
”虚拟SLM部署的应用实例显示了这一点。
法律和制造业也从部署小型语言模型中受益匪浅。
他们认为。
“与此同时,大型语言模型的应用将更多集中在需要多维度理解的各种复杂任务上,在知识发现和模式挖掘方面有更高的采用率,并对大量数据的新见解有需求。
”