首页解决方案联合解决方案

AI时代的云端算力解决方案

随着数字经济蓬勃发展，尤其是人工智能的发展对算力提出了新的更高要求。当前，我国算力综合供给水平快速提升、算力产业创新能力持续增强、算力赋能千行百业稳步深化。国家和企业在面向人工智能、大数据等新兴领域需求强化算力支撑，持续赋能科技创新。各个算力和IT基础设施服务提供商也在持续加大高性能智算供给，加强先进存储产品部署，开展算力网络优化行动，加快构建云边端协同、算存运融合的一体化、多层次的算力基础设施体系。数字基础设施提供商安超云与算力厂商燧原科技联合推出了AI时代的云端算力解决方案，推动人工智能快速发展。

合作伙伴介绍

燧原科技专注人工智能领域云端和边缘算力产品，致力为通用人工智能打造算力底座，提供原始创新、具备自主知识产权的AI加速卡、系统集群和软硬件解决方案。凭借其高算力、高能效比的创新架构和高效易用的软件平台，产品可广泛应用于泛互联网、智算中心、智慧城市，智慧金融、科学计算、自动驾驶等多个行业和场景。

业务挑战

·人工智能快速的发展的过程中，有一个巨大的阻力就是算力不足。算力是人工智能发展的基础设施。AI需要对数据进行重复多轮次处理，数据处理能力主要依靠人工智能。

·适用于AI计算的GPU供不应求，导致一些企业和科研机构无法买到性价比合适的卡。

·而当前最关键的AI相关的GPU都被国际厂商所垄断，市场占有率达八成以上。此时政府和企事业单位更需要国产GPU 卡的出现和应用。

·在整体的人工智能体系中，有AI生态体系问题，有适配的问题，让用户面临着适配的复杂度和重复性工作。

解决方案

云燧T20训练加速卡是燧原科技基于 “邃思2.0”芯片打造的第二代人工智能训练加速卡。对比第一代训练加速卡，云燧T20将整个训练算力提升了1.6倍，同时，“ 邃思 2 . 0 ” 采取全新一代的GCU架构2.0，针对AI的特性进行了深度优化，全面支持多种数据精度，云燧T20也成为

国内首张支持TF32(单精度张量浮点) 的训练加速卡。同时，为与高性能算力匹配，在存储和带宽方面，云燧T20是国内首张支持HBM2E高端存储方案的训练加速卡，存储和数据的结合以及和算力的匹配，最终保证了云燧T20能够提供非常高的算力。同时，云燧T20能够支持数千张卡的集群进行互联，实现优秀的模型加速能力。云燧i20是燧原科技基于“邃思2.5”芯片打造的第二代人工智能推理加速卡，具有高算力高性能、大带宽低时延、模型覆盖面广、软件生态开放等特点。云燧i20 支持多种数据精度，也是国内首张支持 HBM2E存储方案的推理加速卡，相较第一代推理加速卡能力提升了3.5倍。

“云燧T20”和“云燧i20”面向整个互联网、传统行业以及新基建三大业务板块，可以为客户打造基于差异化的场景和整个的定制化的解决方案。安超云操作系统ArcherOS(安超超融合)是一款信创云就绪的全栈超融合基础设施软件产品，具有资源弹性扩展、应用感知、支持混合业务负载等特点，可为用户提供高性能、高可用、高效率及易于安装维护的IT基础设施，极速开启政府和企业上云进程。经安超云软件有限公司与上海燧原科技有限公司联合测试，完成了安超云操作系统软件V1.6与云燧i20/T20的互认证，共同打造了基于AI应用场景的算力解决方案。

方案亮点

·大模型现有生态接入:支持PyTorch、 TensorFlow、PaddlePaddle、 OneFlow、Megatron-LM、FairScale等主流AI框架和分布式加速库，支持 GPT-2、源1.0、悟道2.0、CPM等主流 AIGC大模型的Pretrain和Finetune。

·大模型极致性能提供:采用自主研发的GCU-LARE技术和ECCL分布式通信技术，提升大模型训练多机多卡高速互联的性能，支持数据并行、模型并行、流水线并行和混合并行等并行加速功能，支持ActivationCheckpointing、ZeRO 优化器、CPU offload、AMP(自动混合精度)等算力和显存优化方法，可快速高效地进行大模型训练。

·大模型业务高性价比推理加速:凭借云端推理产品云燧i20通过互联网社交应用服务上亿规模用户的成功经验，同时与广泛的落地场景进行打磨，燧原的推理产品在支持Stable Diffusion、 GPT-2、T5等AIGC大模型推理上具备高性价比，加速AIGC相关下游场景的商业落地。