TGFC俱乐部>>完全数码讨论区>>
- 刷新/显图/登录/注册/WEB
标题:deepseek新版是被国产芯片耽误了
时间:25-08-14 15:46
作者:君思睿

posted by wap, platform: Chrome
来自《金融时报》的文章《DeepSeek’s launch of new AI model delayed by Huawei chip issues》

因为DS新版训练使用某品牌国产芯片,结果搞不定,又换回黄皮衣家的,导致迟迟出不来:


中国人工智能公司深势(DeepSeek)因未能使用华为芯片完成新模型的训练,推迟了新品发布,这凸显了北京在取代美国技术方面的局限性。

据三位知情人士透露,自今年1月推出R1模型以来,深势在官方鼓励下,尝试采用华为昇腾(Ascend)处理器,而不是英伟达(Nvidia)系统进行训练。但在用昇腾芯片进行R2模型训练过程中,这家初创公司遇到了持续的技术问题,最终不得不在训练阶段使用英伟达芯片,而在推理阶段才用华为芯片。

一位知情人士表示,这些问题是导致该模型从5月推迟发布的主要原因,使其在竞争中失去先机。训练是指模型从大规模数据集中学习,而推理则是指利用已训练好的模型进行预测或生成内容(例如回答聊天机器人问题)的过程。

深势的困境表明,在关键任务上,中国芯片仍落后于美国对手,这也凸显了中国在科技自给自足道路上的挑战。本周,《金融时报》报道称,北京要求中国科技公司对采购英伟达H20芯片的理由作出说明,以鼓励他们推广华为和寒武纪等国产替代品。

业内人士指出,与英伟达产品相比,中国芯片在稳定性、芯片间互联速度以及软件水平方面仍存在差距。两位知情人士表示,华为曾派出工程师团队前往深势总部,协助其用昇腾芯片开发R2模型,但即便在工程师团队现场支持下,深势仍未能在昇腾芯片上完成一次成功的训练。

据知情人士透露,深势目前仍在与华为合作,使R2模型在推理阶段能兼容昇腾芯片。公司创始人梁文峰在内部表示,他对R2的进展并不满意,并推动团队投入更多时间打造能够保持公司AI领先地位的先进模型。另一位知情人士补充,R2推迟发布还与更新模型所需的数据标注时间比预期更长有关。中国媒体报道称,该模型可能会在未来几周内发布。

加州大学伯克利分校AI研究员Ritwik Gupta表示:“模型是可以轻易替换的商品,很多开发者正在使用阿里巴巴的Qwen3,它既强大又灵活。”Gupta指出,Qwen3借鉴了深势的核心理念,例如让模型具备推理能力的训练算法,但在使用效率上进行了优化。他还表示,华为在用昇腾芯片进行训练时正经历“成长的阵痛”,不过他相信这家中国科技巨头最终会适应这一过程。

“今天我们没有看到基于华为训练的顶尖模型,并不意味着未来不会出现。这只是时间问题。”他说。

英伟达近期同意将其在中国销售H20芯片的部分收入上缴美国政府,以恢复该产品在华销售。英伟达表示,中国公司使用其芯片的开发者“将在打造获胜的AI生态系统中发挥关键作用”,“放弃整个市场和开发者只会损害美国的经济和国家安全”。

深势与华为均未回应置评请求。





回复列表 (10)
#2 hzde884 2025-8-14 16:39
posted by wap, platform: Android
刘建超被查了解一下

===================
#3 卖哥 2025-8-14 17:12
看那堆论文就知道,DS的开发工具是极其特化的,甚至可以说是H800专用的。

===================
#4 ginaamix 2025-8-17 00:09
posted by wap, platform: Chrome
没SIMT,写个算子很麻烦

===================
#5 naughtyben 2025-8-17 04:52
posted by wap, platform: iPhone
谭庆还是谭难?

===================
#6 dorn 2025-8-17 10:37
潭庆日:绿脸贱笑:兔脸红:



===================
#7 hftrrt 2025-8-17 12:27
posted by wap, platform: Android
原帖由 @ginaamix 于 2025-8-17 00:09 发表
没SIMT,写个算子很麻烦
下一代要加simt了

===================
#8 manvvvv 2025-8-17 13:44
你国搞AI的障碍根本不是技术问题,整个简中互联网阴阳怪气不好好说话,任何AI训练出来都是傻的

===================
#9 今夜打老虎 2025-8-17 14:03
posted by wap, platform: Android
....几把鬼扯ds就是用n卡训练的,最多用昇腾跑推理。网上传了几天的屎泥潭今天才捡起来

===================
#10 卖哥 2025-8-17 14:23
原帖由 今夜打老虎 于 2025-8-17 14:03 发表
posted by wap, platform: Android
....几把鬼扯ds就是用n卡训练的,最多用昇腾跑推理。网上传了几天的屎泥潭今天才捡起来

8路H800支持训练的模型就那么大。
不换新平台,上限就锁死了。
N卡的新平台又买不到。

===================
#11 dboy99 2025-8-17 21:54
posted by wap, platform: Android
原帖由 @今夜打老虎 于 2025-8-17 14:03 发表
....几把鬼扯ds就是用n卡训练的,最多用昇腾跑推理。网上传了几天的屎泥潭今天才捡起来
信息源头应该是轮媒,轮媒总是能在千里之外获得圈内人都拿不到的第一手资料

===================


[登录后才可回复]