DeepSeek：你需要了解的所有关于AI聊天机器人应用的知识

deepseek-2.jpg?w=650

DeepSeek 病毒般传播开来。

中国人工智能实验室 DeepSeek 在本周因其聊天机器人应用程序登上了苹果应用商店和谷歌应用市场的榜首而进入了公众视野。DeepSeek 的 AI 模型采用了高效的计算技术进行训练，这使得华尔街分析师和技术专家开始质疑美国在人工智能竞赛中是否还能保持领先地位，以及对人工智能芯片的需求是否会持续。

但 DeepSeek 究竟来自何方，又是如何迅速走红的呢？

DeepSeek 的交易起源

DeepSeek 由一家名为 High-Flyer Capital Management 的中国量化对冲基金支持。该基金利用 AI 来辅助其交易决策。

AI 爱好者李文峰于 2015 年与他人共同创立了 High-Flyer。据报道，李文峰在浙江大学求学期间就开始涉足交易领域，并于 2019 年将 High-Flyer Capital Management 打造成一家专注于开发和部署 AI 算法的对冲基金。

2023 年，High-Flyer 开始运营 DeepSeek，这是一个独立于其金融业务的研究实验室。由于 High-Flyer 是其投资者之一，该实验室随后发展成为了一家名为 DeepSeek 的独立公司。

自成立以来，DeepSeek 就建立了自己的数据中心集群用于模型训练。然而，和其他中国的人工智能公司一样，DeepSeek 受到了美国对硬件出口的限制。为了训练其最新模型，该公司不得不使用英伟达 H800 芯片——这是 H100 芯片的一个较弱版本，而 H100 芯片是美国公司可以使用的。

据称，DeepSeek 的技术团队以年轻人为主。该公司积极从顶尖中国大学招聘博士级别的 AI 研究人员。此外，DeepSeek 还聘请了一些没有计算机科学背景的人来帮助技术团队更好地理解各种学科的内容（据《纽约时报》报道）。

强大的 DeepSeek 模型

DeepSeek 在 2023 年 11 月发布了第一批模型——DeepSeek Coder、DeepSeek LLM 和 DeepSeek Chat。但直到去年春天，当这家初创公司发布了下一代 DeepSeek-V2 模型系列时，AI 行业才开始注意到它。

作为通用文本和图像分析系统，DeepSeek-V2 在各种 AI 基准测试中表现优异，并且当时的运行成本远低于同类模型。这迫使 DeepSeek 的国内竞争对手如字节跳动和阿里巴巴降低了部分模型的使用价格，并使其他一些模型完全免费提供。

2024 年 12 月发布的 DeepSeek-V3 只是增加了 DeepSeek 的知名度。

根据 DeepSeek 内部基准测试的结果，DeepSeek V3 在下载后可用的模型（如 Meta 的 Llama）和只能通过 API 访问的“封闭”模型（如 OpenAI 的 GPT-4o）方面表现更优。

R1 “推理”模型同样令人印象深刻。该模型于今年一月发布，并声称在关键基准测试中与 OpenAI 的 o1 模型表现相当。

R1 是一种推理模型，在解决某些问题时需要比普通非推理模型多几秒到几分钟的时间。然而，在物理、科学和数学等领域内，它们通常更为可靠。

R1、DeepSeek V3 及其他一些 DeepSeek 模型也存在一定的缺点：作为由中国开发的人工智能产品，它们会接受中国的互联网监管机构的基准测试以确保其回应符合“核心社会主义价值观”。例如，在聊天机器人应用程序中，R1 不会回答关于天安门广场或台湾自治的问题。

颠覆性的方法

如果要谈论 Deepseek 的商业模式，则并不明确。该公司的产品和服务定价远低于市场价值，并且有些产品甚至免费提供。

据称由于效率突破使得成本竞争力极强。不过有专家对此表示质疑。

无论如何，在 Hugging Face 平台上托管的这些模型受到了开发者的广泛欢迎——Clem Delangue（Hugging Face 的 CEO）表示，在 Hugging Face 上已经创建了超过 500 个 R1 的衍生模型，并且这些衍生模型总共获得了超过 250 万次下载。

尽管面临来自更大、更成熟的竞争对手的压力以及股价下跌和公开回应等事件的影响（例如 Nvidia 股价下跌了 18%，OpenAI CEO Sam Altman 发表了公开回应），但 Deepseek 对 Meta AI 投资的影响仍然存在。

同时也有公司甚至整个国家和地区禁止使用 Deepseek。

至于未来如何，则尚不明朗。改进后的模型是必然趋势之一。但美国政府似乎越来越担心所谓的有害外国影响。

总结：文章主要介绍了中国人工智能实验室 Deepseek 如何迅速崛起并进入公众视野的过程及其背后的背景故事、技术特点和发展现状。虽然其强大且高效的 AI 模型引起了广泛关注和讨论，但也面临着来自国内外的不同挑战与限制。

DeepSeek：你需要了解的所有关于AI聊天机器人应用的知识

DeepSeek 的交易起源

强大的 DeepSeek 模型

颠覆性的方法

Leave a comment

Tag Clouds

Explore Topics

Press ESC to close

DeepSeek：你需要了解的所有关于AI聊天机器人应用的知识

DeepSeek 的交易起源

强大的 DeepSeek 模型

颠覆性的方法

Leave a comment

Tag Clouds

Newsletter

Explore Topics