确定性算力池化及AI开发训练平台软件CBPMLABS2025000332-采购结果
- 2025-12-16
项目名称: 确定性算力池化及AI开发训练平台软件CBPMLABS2025000332-采购结果
项目编号: CBPMLABS2025000332
招标公司: 紫金山实验室
中标公司: 北京趋动智能科技有限公司
采购标的物: 确定性算力池化及AI开发训练平台软件
项目地区:上海 上海
申购单号:CBPMLABS2025000332
申购主题:确定性算力池化及AI开发训练平台软件
成交总额:178750.00
采购单位:紫金山实验室
竞价开始时间:2025-12-11 17:46:02
竞价截至时间:2025-12-14 17:55:57
币种:人民币
付款方式:货到验收合格后付款
收货地址:******
送货时间:合同签订后20天内送达
安装要求:免费上门安装(含材料费)
预算:******人民币
备注说明:--
质疑说明:如果对成交结果有异议,请在发布成交结果之日起三个工作日内向采购单位提出质疑
序号
采购项
品牌/型号/厂家/产地
规格参数
质保及售后服务
数量单位/单价
成交总价
成交供应商
1
确定性算力池化及AI开发训练平台软件
品牌:不限
型号:不限
厂家:北京趋动智能科技有限公司
产地:北京
一、 总体要求1. 开放性:平台需采用开放的架构设计,支持与主流基础设施集成,避免供应商锁定。投标人需详细阐述其系统架构的开放性、可扩展性及API生态。2. 异构兼容性:平台需支持对多元异构算力进行统一池化、调度与管理。至少包括: - 国际GPU:支持NVIDIA各系列主流数据中心GPU。 - 国产算力:支持主流国产AI算力芯片,投标人需明确列出所适配的芯片型号、驱动及基础软件栈要求。3. 部署灵活性:平台软件需支持在物理服务器、虚拟机(如KVM/VMware)、容器化环境(如Kubernetes) 等多种基础架构上部署与运行,并提供一致的算力服务抽象。二、 核心算力池化与虚拟化能力4. 算力抽象与分割:支持对物理GPU/加速卡进行细粒度虚拟化,能够按计算能力(算力) 和显存两个维度进行灵活划分与组合,创建虚拟计算实例(vGPU/vAccelerator)。投标人需说明其最小划分颗粒度及划分方式。5. 资源聚合与跨节点调用:支持将位于多台物理服务器(≥2台) 上的虚拟算力实例聚合,供单个AI训练任务使用,以突破单机算力限制。支持通过高速网络(如RDMA)实现跨节点的算力远程直接调用。6. 资源超分配与智能调度:平台需具备资源超分配能力,通过智能调度算法提升整体资源利用率。投标人需阐述其超分配策略、资源隔离机制以及在超分配场景下保障任务运行稳定性和性能的技术方案。7. 动态资源调配:支持资源的按需分配与释放。当计算任务启动时分配资源,任务结束或空闲时立即回收资源,实现高弹性与高资源利用率。8. 强隔离与高可用:确保运行在同一物理设备上的多个虚拟算力实例间实现有效的计算、显存与故障隔离,单个实例的异常(如崩溃、显存溢出)不得影响其他实例及宿主机稳定性。三、 AI开发与训练全流程支持9. 一体化开发环境:提供基于Web的集成开发环境,须原生集成JupyterLab、终端、性能监控面板等工具。支持开发环境与训练任务的快速衔接。10. 数据与模型管理:提供数据集、模型、镜像的集中管理功能。支持对接外部存储(如NFS、S3兼容存储)和代码仓库(如GitLab、GitHub、Gitee)。11. 训练任务管理:支持灵活定义与启动训练任务,包括单机、分布式等多种模式。提供任务队列、优先级调度、资源配额管理等功能。12. 推理服务部署:支持将训练完成的模型部署为在线推理服务,具备版本管理、自动扩缩容、流量监控和标准API暴露能力。四、 平台运维与管理13. 统一监控运维:提供图形化管理控制台,实现对所有算力资源、平台服务、用户任务的统一监控、告警、日志审计与统计分析。14. 资源弹性管理:平台应支持计算任务的资源动态调整(纵向伸缩)以及在保证业务连续性的前提下,实现算力负载的智能调度与再平衡。投标人需说明其具体技术方案。15. 高可用与多集群:支持多集群部署模式,具备应对单点故障的能力,保障平台服务与用户数据的持久性与可用性。五、 兼容性与服务要求16. 广泛兼容:平台需支持主流x86及ARM服务器架构;支持CentOS、Ubuntu、麒麟、OpenEuler等操作系统;兼容PyTorch、TensorFlow、PaddlePaddle等主流AI框架。
提供完整的软件部署、配置与系统集成服务。提供不少于1年的原厂技术支持与软件升级服务,明确故障响应等级与处理时限(如7×24小时支持,P1级故障2小时响应)。
数量:1
单价:178750.00(人民币)
178750.00(人民币)
北京趋动智能科技有限公司