
IT之家 9 月 17 日音信体育游戏app平台,科技媒体 Wccftech 昨日(9 月 16 日)发布博文,报谈称 AMD 为冲破 CUDA 在 AI 边界的把持,发布 ROCm 7.0 揣摸软件堆栈,官网页面泄漏救援最新算法和模子、推广 AMD 锐龙 AI 处理器和 AMD Radeon 显卡救援等。

图源:AMD
AMD 官方照旧发布 ROCm 7.0 更新日记,其中最值得温和的窜改,在于优化 AI 推理任务。AMD 声称,在 DeepSeek R1 基准任务中,Instinct MI355X 的 FP8 糊涂量比 NVIDIA Blackwell B200 跳跃 30%。IT之家附上酌量截图如下:

图源:AMD
AMD 还提供了 ROCm7 的实测成果,比拟较 ROCm 6,在 Llama 3.1 70B 模子上性能进步 3.2 倍,Qwen2-72B 上性能进步 3.4 倍,而 DeepSeek R1 性能进步 3.8 倍。

图源:AMD
功能升级方面,ROCm 7.0 集成了最新算法与模子、先进的 AI 推广特质、对 MI350 系列 GPU 的救援,以及集群处理与企业级功能,这些窜改旨在进步大范围 AI 部署的可推广性与褂讪性。
新版块引入对 Instinct MI355X、MI350X 的救援,并新增 Ubuntu 24.04.3 与 Rocky Linux 9 系统兼容,同期淘汰了旧版 Ubuntu 与 SLES 15 SP6。
AI 框架救援也同步更新,包括 PyTorch 2.7、TensorFlow 2.19.1、ONNX Runtime 1.22.0、JAX 0.6.0、Triton 3.3.0、vLLM 等。酌量数学库、通讯库与器具链全面提档,进一步进步大模子和 HPC 场景理会。
