开发者必须手工管理成千上万条线程的索引、内存布局和同步,仿佛一个交响乐指挥需要亲自调试每一件乐器的音准。这种复杂性将大多数开发者挡在门外,只有少数高性能计算专家才能驾驭。
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括:NVIDIA CUDA ...
2025 年12 月,NVIDIA 推出CUDA 13.1,此次更新被官方定位为“自2006 年CUDA 平台诞生以来最大、最全面的升级”。其核心亮点之一,是引入了新的编程模型CUDA Tile。这个变化,有可能不仅仅是一项技术迭代,而是标志着GPU 编程范式迈入一个新的阶段。
今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python ...
最多可支持 10000+ 个并发线程。 经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 作为一种大规模并行 ...
近日举办的2025 RISC-V中国峰会上,NVIDIA硬件工程副总裁Frans Sijstermans宣布,CUDA软件平台将支持RISC-V指令集架构处理器,为开源架构RISC-V开启进入数据中心与AI市场的大门。 据了解,过去x86与Arm架构在AI与HPC领域居于主导地位,主要原因就是和CUDA的高度整合。
在中国举办的 2025 年 RISC-V 峰会上,Nvidia 宣布其 CUDA 软件平台将在 CPU 方面与 RISC-V 指令集架构(ISA)兼容。这一消息在 RISC-V 活动期间的一个演示中得到了证实 。这是在性能要求高的应用中启用基于 RISC-V ISA 的 CPU 的重要一步。 这项宣布表明,RISC-V 现在可以 ...
在昨天测试了丽台的Cell核心视频加速卡后,今天日本PCWatch网站又放出了一篇视频处理性能测试文章。这一次的主角也是近期的热门人物,NVIDIA CUDA加速。他们分别使用了三款目前支持CUDA加速的视频处理软件:Badaboom Media Converter、TMPGEnc 4.0 XPress和PowerDirector威力 ...