您现在的位置是：首页 > 要闻 > 正文

最新Deepseek仅用多少万美金

发布时间：2025-02-01 11:02:36来源：

导读最新DeepSeek模型，即DeepSeek-V3，仅用557.6万美金就成功训练出来。这一成本相较于其他高性能AI模型的训练费用要低得多，例如GPT-4o等模型...

最新DeepSeek模型，即DeepSeek-V3，仅用557.6万美金就成功训练出来。这一成本相较于其他高性能AI模型的训练费用要低得多，例如GPT-4o等模型的训练费用高达约1亿美元。DeepSeek-V3能够用如此低的成本实现高性能，主要得益于其创新的技术方法，如使用小数据集蒸馏等，这些技术使得DeepSeek能够在保持模型性能的同时，大幅降低训练成本。

此外，DeepSeek-V3还引入了无辅助损失的负载均衡策略和多标记预测（MTP）目标，这些技术进一步提升了模型的性能并支持推理加速的预测解码。在预训练阶段，DeepSeek-V3仅耗费了266.4万H800 GPU小时，完成了对14.8万亿token的预训练，总训练成本控制在557.6万美元以内。

总的来说，DeepSeek-V3以其低廉的训练成本和接近GPT-4级别的性能，在AI领域引起了广泛的关注和热议。

标签：

您现在的位置是：首页 > 要闻 > 正文

最新Deepseek仅用多少万美金

猜你喜欢

最新文章