您现在的位置是:首页 > 要闻 > 正文

最新深度ai大模型 deep seek叫什么

发布时间:2025-02-01 11:11:35来源:

导读 最新的深度AI大模型DeepSeek发布的一系列模型中,最近受到广泛关注的是DeepSeek-R1。以下是关于DeepSeek及其最新模型的详细介绍:一、公司...

最新的深度AI大模型DeepSeek发布的一系列模型中,最近受到广泛关注的是DeepSeek-R1。以下是关于DeepSeek及其最新模型的详细介绍:

一、公司背景

公司名称:深度求索(DeepSeek)

隶属集团:量化巨头幻方量化集团

成立时间:其关联公司北京深度求索人工智能基础技术研究有限公司成立于2023年5月16日

注册资本:1000万元人民币

法定代表人:裴湉

二、最新模型DeepSeek-R1

发布时间:2025年1月20日

模型特点:

1. 在多个关键任务上的性能已达到或超过OpenAI的最新模型。

2. 特别是在数学、代码和自然语言推理等领域表现出色。

3. 推出了一个实验性模型DeepSeek-R1-Zero,该模型完全依赖强化学习进行训练,并在训练中展示出复杂的行为,如自我反思和主动策略寻求。

模型优势:

1. 低训练与使用成本:相比于一些传统的大模型,DeepSeek-R1的训练和使用成本更低。

2. 开源模式:DeepSeek-R1采用开源模式,为全球科研人员和企业提供更多可能性。

三、其他重要模型

DeepSeek还发布了其他多个重要模型,包括但不限于:

DeepSeek LLM:第一个大模型,包含670亿参数,在推理、编码、数学和中文理解等方面表现出色。

DeepSeek-V2:第二代开源Mixture-of-Experts(MoE)模型,包含2360亿个总参数,实现了更强的性能,同时节省了训练成本。

DeepSeek-Coder-V2:一个开源的混合专家(MoE)代码语言模型,在代码特定任务中达到了与GPT4-Turbo相当的性能。

DeepSeek-VL2:用于高级多模态理解的专家混合视觉语言模型,在视觉问答、光学字符识别、文档/表格/图表理解以及视觉定位等任务中展现了卓越的能力。

综上所述,DeepSeek作为量化巨头幻方量化的子公司,在深度AI大模型领域取得了显著成果。其最新发布的DeepSeek-R1模型在数学、代码和自然语言推理等领域表现出色,同时采用低成本、高性能和开源模式,为全球科研人员和企业提供了更多可能性。

标签:

上一篇
下一篇