欢迎参与评论,每一条合规评论都是对我们的褒奖。
请 登录 或 快速注册 后发表评论
AMD宣布,对ROCm软件栈进行了更新,推出了新的迭代版本ROCm 6.2,巩固了作为人工智能和高性能计算开发平台的领先地位。这一新版本里,AMD在性能、效率、可扩展性方面都做了提升,无论从事前沿AI模型的研究、新一代人工智能应用的开发,或是复杂的优化模拟,都能从中获益。
ROCm 6.2共有五大核心功能提升,包括:
扩展了专为大语言模型(LLMs)所设计的vLLM的支持,提升了AMD Instinct系列加速器的AI推理能力;
对ROCm中的Bitsandbytes量化技术支持,提升了AMD Instinct系列的AI训练和推理能力,增强内存效率与性能;
通过全新的离线程序创建工具,简化了ROCm的安装过程;
全新的Omnitrace和Omniperf性能分析工具(Beta版),从而在AMD ROCm中引领AI(人工智能)与HPC(高性能计算)开发的变革;
更加广泛的FP8(数据处理方式)支持,通过使用ROCm 6.2增强了AI推理能力。
AMD表示,通过ROCm 6.2再次展示了其为人工智能和高性能计算领域提供强大、有竞争力且富有创新性解决方案的承诺,开发人员拥有了突破边界所需的工具和支持,开发人员可以将项目提升至前所未有的性能和效率水平。