弹性计算集群 AEC2

AI弹性计算集群 AEC2(AI Elastic Compute Cluster)提供了节点管理、集群管理、工作空间管理、预留配额管理四种功能,提供全面、高性能、高可靠的计算资源,承载训练推理微调多种工作负载。便于客户对算力资源与资源分配进行统一的管理。

弹性计算集群 AEC2

产品优势

高性能计算资源,高可靠性,灵活管理,支持多种工作负载。

高性能计算

提供高性能计算资源,适用于训练、推理和微调多种AI工作负载,确保任务高效执行。

高可靠性

通过高可靠性、容错调度的设计,保障计算任务的稳定运行,减少中断和错误,提升整体系统可靠性。

灵活资源管理

支持节点、集群、工作空间和预留配额管理,用户可根据需求灵活配置和分配资源,优化使用效率。

统一管理平台

提供统一的管理界面,便于客户对算力资源进行集中管理,简化操作流程,提高管理效率。

产品功能

丰富的资源管理,包含节点、集群、工作空间、预留配额管理。提供高性能、高可靠,支持多种工作负载的资源。

资源统一管理

支持客户按需购买和释放算力资源,支持所有新购算力资源的管理,为不同规格的计算资源提供统一的管理平台。

资源统一管理

资源按需分配

支持客户对算力资源进行分组管理,基于同一组资源进行分布式训练任务的运行。

资源按需分配

应用场景

为各种规模的AI应用提供灵活、高效的计算资源,支持从基础研究到商业应用的广泛AI场景。

  • AI模型训练

    快速、稳定、高效、可靠完成训练任务

    • 强大的分布式计算能力,顶级性能的计算服务器,高速低延时的RDMA网络。
    • 支持大规模AI模型训练,资源池具备弹性扩展能力。
    • 具备容错调度能力,全面满足模型训练的需求。
    • 实时监测节点健康,保护训练任务。
  • AI在线推理
  • 模型微调
  • 开发机技术验证
AI模型训练

用AI大模型,找商汤大装置

开始使用