弹性算力池ECP名词解释
名词解释
中文名 | 英文名 | 缩写 | 释义 |
---|---|---|---|
弹性算力池集群 | ECP Cluster | vc | 每个ECP Cluster对应一个控制面SenseCore托管的Kubernetes集群 |
高性能AI计算节点 | AI Compute Node | ACN | 用户从SenseCore平台下单的全托管算力资源,支持包月、按量等多种计费方式 |
Kubernetes节点 | Kubernetes Node | node | Kubernetes节点,分为master node和worker node,master node用户部署Kubernetes控制面组件,worker node为用户的Kubernetes的工作负载提供CPU、内存、GPU/NPU等资源。 在ECP Cluster中,master node由SenseCore全托管,用户不可见; 弹性算力池用户购买ACN节点加入集群后,成为Kubernetes的work node,为用户提交训练、推理等任务提供算力等资源。 |
参考Kubernetes集群架构如下:
- 弹性算力池提供了kubernetes集群的生命周期管理能力,每个弹性算力池集群对应一个Kubernetes集群,弹性算力池为完全托管Control Plane并为Control plane运行提供必要的CPU、内存等资源;
- 当计算节点ACN加入集群后,Kubernetes集群的Node1:1对应。kubernetes在Node上必需的组件kubelet、kube-proxy、CRI等,由平台托管,会占用少量的CPU、内存资源。用户的训练、推理等工作负载,最终将转化为Pod的形式被kubernetes调度至Node上,使用Node上的CPU、内存和GPU等资源运行。