您的位置 首页 > 百科知识

腾讯发布星脉网络 2.0:大模型训练效率相比上代提升 20%

感谢网友 航空先生 的线索投递! 7 月 2 日消息,腾讯昨日发布其自研星脉网络 2.0 版本,升级后的星脉网络支持单集群 10 万卡组网,网络通信效率比上一代提升 60%,大模型训练效率提升 20%,故障定位从天级降低至分钟级。获悉,腾讯自研交换机从 25.6t 升级到 51.2t,容量提升一倍;自研硅光模块从 200g 升级到 400g,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2t,为业界最高。腾讯自研全新通信协议 tita2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。腾讯全新高性能集合通信库 tccl2.0 采用 nvlink net 异构并行通信,实现数据的并行传输。auto-tune network expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。

▲数据的并行传输(腾讯云)TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。

以上就是腾讯发布星脉网络 2.0:大模型训练效率相比上代提升 20%的详细内容,更多请关注本站其它相关文章!

热门文章