
5月9日在家新闻,摩尔线程今天宣布推出Torch-Musa v2.0.0版本,这是对Pytorch深度学习框架的Musa扩展图书馆的重要升级。新版本基于计算3.1计算体系结构的能力,支持FP8本机数据类型,支持Pytorch 2.5.0,并进一步提高了AI模型的支持功能,并通过对MUSA计算平台的多重性能优化进行大型处理数据处理。作为此升级的主要亮点,Torch-Musa v2.0.0首先实现了对国内GPU中FP8数据类型的完全支持。 FP8是用于当前AI计算的低切口格式低精油。在支持民间FP8的GPU中,将FP8混合精度用于大语言模型培训(LLM)可能会破坏GPU计算能力并大大减少记忆使用的使用。摩尔的线程基于新一代Musa计算3.1计算体系结构的全GPU功能本地支持FP8计算,它为火炬 - 穆萨v2.0.0提供了实施FP8矩阵和分布式通信优化的复制的基础。希望有了建筑的基本优势,Torch-Musa v2.0.0可以在FP8计算的效率方面提供完整的作用,并提高大语模型的培训和概念的效率。 Torch-Musa v2.0.0在Musa的计算平台上引入了许多创新功能,以进一步提高实施深度研究任务的效率:新的虚拟内存管理支持:MUSA虚拟内存管理技术可以有效地减轻GPU Memor的问题碎片,并减少模型训练过程中的记忆使用。它特别适用于FSDP,DeepSpeed和Megatron-LM等框架中的主要培训模型。支持新的Musa图:Musa图技术在图中包括许多Musa核心,大大降低了通过单个CPU的开销开始调度,提高计算效率以及与CUDA图界面的兼容。 torch.compile添加Triton后端支持:Triton-Musa的后端支持是为Torch.com提供的,开发人员可以直接使用Pytorch本机接口来获得更好的性能。 Torch-Musa v2.0.0基于对Pytorch 2.2.0的全面支持,增加了对Pytorch 2.5.0的支持,允许开发人员使用全GPU儿童的功能来计算Musa 3.1计算体系结构,而新版本的Pytorch开放。 Torch-Musa是完全开放的资源,开发人员可以通过访问GitHub访问源代码。它的房屋配备了开放的地址资源: