首页 新闻 DeepSeek AI:可访问的创新,投资16亿美元

DeepSeek AI:可访问的创新,投资16亿美元

作者 : Sadie Feb 20,2025

DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。该公司声称已经培训了其强大的DeepSeek V3神经网络,仅利用2048 GPU,这与竞争对手的费用形成了鲜明的对比。但是,这个数字具有误导性。

DeepSeek Test图像:ensigame.com

DeepSeek V3的创新架构有助于其效率。关键技术包括多型预测(MTP),该预测同时预测了多个单词;专家(MOE)的混合物,采用256个神经网络来增强处理;和多头潜在注意力(MLA),重点是至关重要的句子元素以提高准确性。

DeepSeek V3图像:ensigame.com

与其公开成本相反,半分析显示,DeepSeek的基础设施约为50,000 Nvidia GPU,价值约16亿美元,运营成本接近9.44亿美元。这项大量投资,加上其研究人员的高薪(每年超过130万美元),大大超过了最初的600万美元索赔。

DeepSeek图像:ensigame.com

DeepSeek的成功源于其独特的结构:中国对冲基金的高飞行员的子公司拥有其数据中心,从而促进了快速的创新和优化。它的自资助性质增强了敏捷性。尽管“预算友好”的叙述被夸大了,但DeepSeek的整体投资超过5亿美元仍然代表了一种相对精益的方法。

DeepSeek图像:ensigame.com

与竞争对手的对比是惊人的。 DeepSeek的R1型号的价格为500万美元,而Chatgpt4o的1亿美元。 DeepSeek的示例展示了竞争力的途径,但无可否认,其成功源于大量投资和技术进步,而不仅仅是其据称是低培训成本。尽管提出了夸张的说法,但它仍然大大削弱了竞争对手。