cuda - 搜索 News

4 小时

DeepSeek并没有完全跳出英伟达的CUDA框架，而是选择绕过了CUDA的高层API，直接操作PTX指令集，进行更细粒度的硬件优化。这种做法本质上是在原有框架内寻求突破，而非彻底脱离英伟达的生态系统。为什么选择PTX？这到底是突破，还是妥协？为什么 ...

4 小时

英伟达的CUDA，DeepSeek只“击穿”了50%

综上，CUDA的“魔咒”与英伟达的技术垄断，早已将全球AI产业的算力主权牢牢掌控。这场与英伟达的较量，绝不仅仅是技术上的一场追逐，而是关乎中国在全球科技格局中能否真正崛起的关键赌局。如果我们依然依赖外部技术，坐视CUDA继续作为全球AI算力的“标准”，那中国AI的未来，将永远在别人的“规则”下打拼。

来自MSN9 小时

全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍

在当今的科技世界里，人工智能（AI）技术已经成为推动各行各业变革的重要力量。然而，随着AI在计算能力和应用领域上的快速增长，大家开始逐渐意识到一个问题：现有的AI系统需要消耗大量的电力和计算资源，这样的模式是否能持续？

钛媒体APP on MSN3 小时

英伟达想靠并购赢下AI时代

DeepSeek引发的海啸，并未让英伟达一蹶不振。

1 天

英伟达 RTX 50 系列 GPU 放弃对 32 位 CUDA 支持，老显卡成 PhysX 游戏 ...

PhysX 技术在 64 位应用中仍然可以正常使用，例如在《蝙蝠侠：阿卡姆骑士》中，这表明英伟达并未完全放弃 PhysX 技术。但该公司确实已经停止了 RTX 50 系列显卡对 32 位 CUDA 的支持，未来可能还会进一步扩展这一决定。由于 ...

3 天

世界首个「AI CUDA工程师」诞生！AI自己写代码优化CUDA内核，性能狂飙 ...

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

1 天on MSN

RTX 50系列GPU放弃对32位CUDA支持，老显卡成PhysX游戏“救星”

IT之家 2 月 23 日消息，英伟达在其最新的 RTX 50 系列（Blackwell）显卡中停止了对 32 位 CUDA 应用的支持，多年来，对 PhysX 技术的支持也在逐渐减少。YouTube 博主 VerbalSilence 和一位 ...

腾讯网3 天

华泰证券：DeepSeek有望加速模型训练与CUDA解耦

每经AI快讯，华泰证券研究认为，DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法，PTX是CUDA编译的中间代码，在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码 ...

1 天

RTX 50系列不再支持32位CUDA，老显卡GTX 980 Ti成PhysX游戏新宠？

英伟达在其最新的RTX 50系列显卡中做出了一项重大调整，这一变化引起了游戏玩家和硬件爱好者的广泛关注。据最新消息，RTX ...

光明网 on MSN6 小时

DeepSeek 发布开源第一弹！让大模型在GPU上跑得更快

据介绍，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。“在H800上能实现3000 GB/s 的内存带宽 &580 TFLOPS 的计算性能。”DeepSeek说。

3 天on MSN

华泰证券：DeepSeek有望与CUDA解耦：国产算力或受益

【华泰证券：DeepSeek有望加快模型训练与CUDA的解耦进程】华泰证券研究指出，DeepSeek在V3中运用了相较CUDA更为底层的PTX来优化硬件算法，PTX是CUDA编译的中间代码，在CUDA和最终机器码之间发挥着桥梁作用。而NSA则采用了O ...

5 天

经典物理引擎 PhysX 走向终结：英伟达 RTX 50 系列显卡不再支持 32 位 ...

IT之家 2 月 19 日消息，英伟达在其 RTX 50 系列显卡上悄然停止了对 32 位 PhysX 技术的支持。PhysX 是一项曾在 2000 年代初至 2010 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果