英博云AI算力是什么
英博云AI算力是英博数科推出的专注于GPU智算服务的云平台,主要面向高校、企业和科研机构,提供高效、多样化的GPU算力解决方案。采用K8S Native架构,具备裸金属级控制权和SaaS级易用性,无缝对接K8S生态。通过自研的动态隔离控制平面(DICP),英博云为每个用户提供了独立的API Server和CRD空间,确保安全与隔离。
英博云系列智能算力产品与服务,涵盖智算中心建设运维、GPU容器服务、先进算力实验室和产业孵化器四大板块。其中,英博云 GPU 容器服务(Ebcloud Kubernetes Service,EKS) 是面向企业级应用的全托管 Kubernetes 容器管理服务。通过EKS,用户无需购买节点即可部署工作负载,GPU 容器服务还扩展支持了并行文件存储、块存储等产品,助力用户快速构建容器化应用。
英博云AI算力的主要功能
-
GPU容器服务:提供全托管的Kubernetes容器管理服务,支持用户无需购买节点即可部署工作负载,扩展支持并行文件存储和块存储,助力快速构建容器化应用。
-
开发机功能:为AI研发提供全流程工作环境,由高性能GPU算力集群驱动,预装主流深度学习框架和开发工具链,支持通过页面或K8S命令创建和管理开发机实例。
-
集群管理:用户可以通过页面创建和管理Kubernetes集群,并支持通过kubectl命令连接和操作集群,实现灵活的资源管理和调度。
-
多种计费模式:支持On-Demand(按需)、Reserved(包年包月)、Spot(竞价)、Booking(预约)等多种付费方式,满足不同用户需求,帮助用户灵活控制成本。
-
高性能存储:采用存储平面前置技术,通过IB网络和RDMA协议连接存储与计算节点,避免VPC网络拥塞,保障存储高性能。
-
安全隔离:基于自研的动态隔离控制平面(DICP),为每个用户分配独立的API Server和CRD空间,确保用户资源的安全与隔离。
英博云AI算力的核心优势
-
开发体验友好:K8S Native原生体验,支持SSH和kubectl多通道访问,Pod 级直连公网 IP,管理灵活、技术便利,可以让部署更直接、访问更高效,用户可以更加专注于业务开发。
-
快速交付:丰富的数据与镜像资源、支持镜像保存与复用,减少环境重构成本,提升调试与部署效率。
-
高效算力底座:GPU +CPU混合Kubernetes集群,企业级并行存储,高速直通存储与网络,轻松稳定支持大模型并行训练与多任务协作。
-
精细计费,秒级启停:计费精确到秒,用多少付多少,让 GPU 使用成本更可控,提升GPU有效利用率。
英博云提供丰富的预制镜像、开源模型和标准数据集,科研人员可快速搭建实验环境,进行算法验证与创新研究,加速科研成果迭代。算力预约模式保障课程集中使用,联盟账号和共享数据支持多用户协作,让老师能够灵活管理 GPU 资源,提升教学与实验效率。
如何使用英博云AI算力
-
注册与登录:访问英博云AI算力官网 www.ebtech.com,注册并登录平台。
-
创建集群:通过平台界面创建Kubernetes集群,选择合适的配置和资源规格,完成集群初始化。
-
侧边导航选择【集群】菜单,左上角分区切换为【华北一区】
-
点击【创建集群】,输入集群名称,点击【确定】,完成集群创建,集群创建需要2分钟左右时间,请耐心等待。
-
- 创建共享存储
- 侧边导航选择【存储】-【共享存储卷】菜单,选择分区为【华北一区】
- 点击【创建存储卷】,输入存储名称、选择存储空间大小,点击【确定】即可完成创建
-
创建开发机
-
侧边导航选择【开发机】菜单,选择分区为【华北一区】
- 点击【创建开发机】,完成基础信息配置,即可完成开发机创建,一般开发机创建需要几分钟时间,请耐心等待。创建成功后可通过 jupyterlab访问 或者 ssh公网访问 使用。
-
- 配置开发环境:在集群中创建开发机实例,选择所需的GPU算力配置和预装的深度学习框架,设置开发工具链。
- 部署应用:使用kubectl命令或通过平台界面将应用部署到集群中,支持容器化应用的快速部署和管理。
- 选择计费模式:根据需求选择On-Demand、Reserved、Spot或Booking等计费模式,优化成本。
- 监控与管理:通过平台提供的监控工具,实时查看集群状态、资源使用情况和性能指标,进行资源的动态管理和调整。
- 数据存储与管理:利用平台的高性能存储服务,配置存储资源,确保数据的高效读写和安全存储。
- 安全与隔离:利用动态隔离控制平面(DICP)技术,确保用户资源的安全隔离,保护数据和应用的安全性。
- 技术支持与服务:在使用过程中遇到问题,可联系英博云的技术支持团队获取帮助,确保平台的稳定运行。
英博云AI算力的应用场景
-
多机训练:支持大规模分布式训练任务,适用于需要多GPU协同工作的深度学习模型训练场景。
-
应用推理:为AI模型的在线推理提供高效算力支持,适用于实时性要求较高的应用场景。
-
科研实验:帮助科研人员快速搭建实验环境,进行算法验证和创新研究,加速科研成果的迭代。
-
课程教学:支持高校和培训机构的AI教学,提供稳定的GPU资源,保障课程集中使用,提升教学与实验效率。
-
企业级应用开发:助力企业快速部署和管理容器化应用,支持企业级应用的开发、测试和部署。
-
数据处理与分析:提供高性能计算资源,适用于大数据处理和复杂数据分析任务。
