随着数字经济蓬勃发展,尤其是人工智能的发展对算力提出了新的更高要求。当 前,我国算力综合供给水平快速提升、算力产业创新能力持续增强、算力赋能千行 百业稳步深化。国家和企业在面向人工智能、大数据等新兴领域需求强化算力支 撑,持续赋能科技创新。各个算力和IT基础设施服务提供商也在持续加大高性能智 算供给,加强先进存储产品部署,开展算力网络优化行动,加快构建云边端协同、算 存运融合的一体化、多层次的算力基础设施体系。数字基础设施提供商安超云与算 力厂商燧原科技联合推出了AI时代的云端算力解决方案,推动人工智能快速发展。
合作伙伴介绍
燧原科技专注人工智能领域云端和边 缘算力产品,致力为通用人工智能打造算力底座,提供原始创新、具备自主知 识产权的AI加速卡、系统集群和软硬件 解决方案。凭借其高算力、 高能效比的 创新架构和高效易用的软件平台,产品可广泛应用于泛互联网、智算中心、智 慧城市,智慧金融、科学计算、自动驾驶 等多个行业和场景。
业务挑战
·人工智能快速的发展的过程中,有一 个巨大的阻力就是算力不足。算力是人 工智能发展的基础设施。AI需要对数据 进行重复多轮次处理,数据处理能力主 要依靠人工智能。
·适用于AI计算的GPU供不应求,导致 一些企业和科研机构无法买到性价比合 适的卡。
·而当前最关键的AI相关的GPU都被国 际厂商所垄断,市场占有率达八成以上。 此时政府和企事业单位更需要国产GPU 卡的出现和应用。
·在整体的人工智能体系中,有AI生态 体系问题,有适配的问题,让用户面临着 适配的复杂度和重复性工作。
解决方案
云燧T20训练加速卡是燧原科技基于 “邃思2.0”芯片打造的第二代人工智能 训练加速卡。对比第一代训练加速卡,云燧T20将整个训练算力提升了1.6倍,同 时 ,“ 邃思 2 . 0 ” 采取全新一代的GCU架构2.0,针对AI的特性进行了深度优化,全 面支持多种数据精度,云燧T20也成为
国内首张支持TF32(单精度张量浮点) 的训练加速卡。同时,为与高性能算力匹配,在存储和带宽方面,云燧T20是国内 首张支持HBM2E高端存储方案的训练 加速卡,存储和数据的结合以及和算力 的匹配,最终保证了云燧T20能够提供 非常高的算力。同时,云燧T20能够支持 数千张卡的集群进行互联,实现优秀的 模型加速能力。 云燧i20是燧原科技基于“邃思2.5”芯片 打造的第二代人工智能推理加速卡,具有高算力高性能、大带宽低时延、模型覆 盖面广、软件生态开放等特点。云燧i20 支持多种数据精度,也是国内首张支持 HBM2E存储方案的推理加速卡,相较第 一代推理加速卡能力提升了3.5倍。
“云燧T20”和“云燧i20”面向整个互联 网、传统行业以及新基建三大业务板块, 可以为客户打造基于差异化的场景和整 个的定制化的解决方案。 安超云操作系统ArcherOS(安超超融 合)是一款信创云就绪的全栈超融合基 础设施软件产品,具有资源弹性扩展、应 用感知、支持混合业务负载等特点,可为 用户提供高性能、高可用、高效率及易于 安装维护的IT基础设施,极速开启政府 和企业上云进程。 经安超云软件有限公司与上海燧原科技 有限公司联合测试,完成了安超云操作 系统软件V1.6与云燧i20/T20的互认证, 共同打造了基于AI应用场景的算力解决 方案。
方案亮点
·大模型现有生态接入:支持PyTorch、 TensorFlow、PaddlePaddle、 OneFlow、Megatron-LM、FairScale等 主流AI框架和分布式加速库,支持 GPT-2、源1.0、悟道2.0、CPM等主流 AIGC大模型的Pretrain和Finetune。
·大模型极致性能提供:采用自主研发 的GCU-LARE技术和ECCL分布式通信 技术,提升大模型训练多机多卡高速互 联 的 性 能 ,支 持 数 据 并 行 、模 型 并 行 、流 水线并行和混合并行等并行加速功能, 支持ActivationCheckpointing、ZeRO 优化器、CPU offload、AMP(自动混合精 度)等算力和显存优化方法,可快速高效 地进行大模型训练。
·大模型业务高性价比推理加速:凭借 云端推理产品云燧i20通过互联网社交 应用服务上亿规模用户的成功经验,同 时与广泛的落地场景进行打磨,燧原的 推理产品在支持Stable Diffusion、 GPT-2、T5等AIGC大模型推理上具备高 性价比,加速AIGC相关下游场景的商业 落地。