您现在的位置是:首页 > 要闻 > 正文

最新Deepseek仅用多少万美金

发布时间:2025-02-01 11:02:36来源:

导读 最新DeepSeek模型,即DeepSeek-V3,仅用557.6万美金就成功训练出来。这一成本相较于其他高性能AI模型的训练费用要低得多,例如GPT-4o等模型...

最新DeepSeek模型,即DeepSeek-V3,仅用557.6万美金就成功训练出来。这一成本相较于其他高性能AI模型的训练费用要低得多,例如GPT-4o等模型的训练费用高达约1亿美元。DeepSeek-V3能够用如此低的成本实现高性能,主要得益于其创新的技术方法,如使用小数据集蒸馏等,这些技术使得DeepSeek能够在保持模型性能的同时,大幅降低训练成本。

此外,DeepSeek-V3还引入了无辅助损失的负载均衡策略和多标记预测(MTP)目标,这些技术进一步提升了模型的性能并支持推理加速的预测解码。在预训练阶段,DeepSeek-V3仅耗费了266.4万H800 GPU小时,完成了对14.8万亿token的预训练,总训练成本控制在557.6万美元以内。

总的来说,DeepSeek-V3以其低廉的训练成本和接近GPT-4级别的性能,在AI领域引起了广泛的关注和热议。

标签:

上一篇
下一篇