MLU370—X8单机8卡部署配置

发布时间:2022-03-22 12:38
编辑:文辉
来源:IT之家
字体:  阅读量:11326   

,据寒武纪官方消息,寒武纪今天正式发布新款训练加速卡 MLU370—X8,搭载双芯片四芯粒思元 370,集成寒武纪 MLU—Link 多芯互联技术,主要面向训练任务。

MLU370—X8单机8卡部署配置

寒武纪表示,在业界应用广泛的 YOLOv3,Transformer 等训练任务中,8 卡计算系统的并行性能平均达到 350W RTX GPU 的 155%。MLU370-X4智能加速卡为单槽位150w全尺寸加速卡。

本站了解到,MLU370—X8 采用了 7nm 工艺,配备 48GB LPDDR5 内存,FP32 单精度浮点性能达到 24 TFLOPS。该加速卡的优势表现为高性能,可提供256TOPS推理算力和24TFLOPS(FP32)训练算力,同时提供FP16,BF16等多种训练精度,配合全新CambriconNeuware软件栈,可充分满足推训一体AI任务需求。。

据介绍,MLU370—X8 智能加速卡提供 250W 最大训练功耗,可充分发挥 AI 训练加速中常见的 FP32,FP16 或 BF16 计算性能寒武纪首次将双芯片四芯粒思元 370 整合在 MLU370—X8 智能加速卡中,提供了两倍于标准思元 370 加速卡的内存,编解码资源,同时搭载 MLU—Link多芯互联技术

MLU370—X8 智能加速卡支持 MLU—Link多芯互联技术,提供卡内及卡间互联功能寒武纪为多卡系统专门设计了 MLU—Link 桥接卡,可实现 4 张加速卡为一组的 8 颗思元 370 芯片全互联,每张加速卡可获得 200GB / s 的通讯吞吐性能,带宽为 PCIe 4.0 的 3.1 倍,可高效执行多芯多卡训练和分布式推理任务

MLU370—X8 单机 8 卡部署配置

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

原标题:MLU370—X8单机8卡部署配置

上一篇:这款产品就是已经传闻多时的Vidda激光微投产品

下一篇: 返回列表

关于我们| 广告合作| 免责申明| 加入我们| 意见与建议|
项城网 - 所载文章、数据仅供参考,使用前务请仔细阅读网站法律声明。备案号:苏ICP备2022014228号-6
网站地图项城网 版权所有 网站统计