cuda - 搜索 News

10 小时

DeepSeek并没有完全跳出英伟达的CUDA框架，而是选择绕过了CUDA的高层API，直接操作PTX指令集，进行更细粒度的硬件优化。这种做法本质上是在原有框架内寻求突破，而非彻底脱离英伟达的生态系统。为什么选择PTX？这到底是突破，还是妥协？为什么 ...

12 小时

近日，英伟达在AI领域的布局引发了广泛关注。从收购3dfx到CUDA计算架构的推出，英伟达的并购策略为其在GPU市场的领先地位奠定了坚实基础。如今，英伟达能否继续通过并购巩固其在AI时代的地位？让我们一起来看看。

3 天

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

最近，关于DeepSeek是否能够绕开英伟达的CUDA框架的讨论，引发了广泛关注。这个问题的答案，不仅关乎DeepSeek的未来发展，更可能影响中国GPU产业能否在全球AI竞争中占有一席之地。英伟达的CUDA技术几乎垄断了全球的AI计算市场，国产GP ...

来自MSN15 小时

在当今的科技世界里，人工智能（AI）技术已经成为推动各行各业变革的重要力量。然而，随着AI在计算能力和应用领域上的快速增长，大家开始逐渐意识到一个问题：现有的AI系统需要消耗大量的电力和计算资源，这样的模式是否能持续？

1 天on MSN

IT之家 2 月 23 日消息，英伟达在其最新的 RTX 50 系列（Blackwell）显卡中停止了对 32 位 CUDA 应用的支持，多年来，对 PhysX 技术的支持也在逐渐减少。YouTube 博主 VerbalSilence 和一位 ...

4 小时on MSN

英伟达近期推出的RTX 50系列图形处理器（GPU）做出了一项重大变更，宣布不再支持32位CUDA应用程序，这一决定对众多经典游戏玩家来说无疑是一个打击。特别是那些依赖于32位PhysX引擎的老游戏，在RTX ...

结合xAI发布的Grok-3，xAI已经将10万卡集群扩展到20万，确实带来了当下全球最领先的预训练/推理模型性能。对比xAI和DeepSeek，10万卡vs万卡，Grok-3相比R1在某些测评集上提高了20%左右效果，是否有性价比？认为，这并不冲突 ...

知乎 on MSN9 天

编辑：桃子好困【新智元导读】DeepSeek模型开发竟绕过了CUDA？最新爆料称，DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示，CUDA护城河不存在了？原本DeepSeek低成本训出的R1，就已经让整个硅谷和华尔街为之虎躯一震。

36氪25 天

硬件媒体Tom‘s Hardware带来开年最新热议： DeepSeek甚至绕过了CUDA，使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自MSN19 天

CUDA还提供类似内存修饰符、Warp级操作的更接近硬件层的优化接口。你过你知道C语言，那你可以在C语言当中调用CPU的汇编语句。打破CUDA垄断？

14 小时

DeepSeek还表示，当前在线服务的模块已经经过测试、部署完备，可以投入生产环境。这个领域没有高高在上的象牙塔，只有纯粹的车库创业精神与社区共筑的创新力量。开播时间 | 2-24 10:00 国泰基金：网罗硬科技龙头，科创综指投资机会解读 ...

当前正在显示可能无法访问的结果。