栏目分类

热点资讯

你的位置:2024年11选5还能玩吗 > 新闻动态 >

硬件网站Tomshardware:DeepSeek可能没有宣传那么神 没什么奇迹

发布日期:2025-02-05 15:57    点击次数:201

快科技 2 月 3 日消息,近一周以来,DeepSeek 不仅引发了美国硅谷的恐慌,也让很多原本不关心 AI 的人感受到了中国 AI 大模型的震撼。

不过,国外老牌硬件网站 Tomshardware 发文称,DeepSeek 可能没有宣传的那么具有颠覆性,在 AI 领域不存在奇迹。

以下为文章节选(仅供参考,不代表本站观点):

中国初创公司 DeepSeek 最近因其先进的 AI 模型 R1 的计算资源使用量惊人地低,而成为科技界的焦点。

该公司声称 DeepSeek 的训练成本仅为 600 万美元以及 2048 个 GPU,其最新的 R1 模型可以与 Open AI 的 o1 相媲美。

然而,行业分析公司 SemiAnalysis 报告称,DeepSeek 背后的公司花费了 16 亿美元的服务器成本,并拥有 50,000 个 NVIDIA Hopper GPU。

报告称,DeepSeek 运营着一个拥有约 50,000 个 Hopper GPU 的庞大计算基础设施。根据 SemiAnalysis 的数据,其中包括 10,000 个 H800 和 10,000 个 H100,另外还购买了 H20 芯片。

这些资源分布在多个位置,用于 AI 训练、研究和财务建模等。SemiAnalysis 的数据显示,该公司在服务器上的总资本投资约为 16 亿美元,估计运营成本为 9.44 亿美元。

DeepSeek 起源于 High-Flyer(幻方),这是一家中国对冲基金,很早就采用了人工智能,并在 GPU 上投入了大量资金。

2023 年,High-Flyer 成立了 DeepSeek,作为一家专注于人工智能的独立企业。与许多竞争对手不同,DeepSeek 仍是自筹资金,这使其在决策方面具有速度和灵活性。

DeepSeek 的一个主要优势在于它能够运行自己的数据中心,而大多数其他 AI 初创公司则依赖外部云提供商。这种独立性允许其完全控制测试和 AI 模型优化。

此外,它能够快速迭代而不受外部瓶颈的影响,这使得 DeepSeek 与业内传统参与者相比效率极高。

根据 SemiAnalysis 的数据,DeepSeek 只在中国境内招聘,注重员工的技能和解决问题的能力,而非资历。

DeepSeek 面向北京大学、浙江大学等知名高校招聘人才,并提供极具竞争力的薪水。根据研究,DeepSeek 的一些人工智能研究人员的薪酬超过 130 万美元(约合 942.7 万元人民币),超过了 Moonshot(月之暗面)等其他领先的中国人工智能公司的薪酬。

SemiAnalysis 报告称,由于人才的涌入,DeepSeek 率先推出了 MLA 等创新技术。DeepSeek 强调效率和算法改进,而不是蛮力扩展,重塑了人们对 AI 模型开发的期望。

出于多种原因,这也让大家相信,技术的快速进步可能会减少对高端 GPU 的需求,从而对 NVIDIA 等公司产生利空应影响。

最近有消息称,DeepSeek 仅花费 600 万美元训练其最新模型,但这个数字仅指总训练成本的一部分——不包括研究、模型改进、数据处理或整体基础设施费用。

事实上,自成立以来,DeepSeek 在人工智能开发上花费了超过 5 亿美元。SemiAnalysis 认为,与受官僚主义困扰的大型公司不同,DeepSeek 的精益结构使其能够积极推动人工智能创新。

DeepSeek 的崛起凸显了一家资金雄厚的独立 AI 公司如何挑战行业领导者。但现实情况要复杂得多:SemiAnalysis 认为 DeepSeek 的成功建立在数十亿美元的战略投资、技术突破和有竞争力的员工队伍之上。

这意味着没有什么奇迹。正如埃隆 · 马斯克一年前指出的那样,如果你想在 AI 领域具有竞争力,你就必须每年投入数十亿美元。



我的网站