希 冀 智 算 平 台 (CG-AI4S)
产品概述
智能时代一体化算力服务平台解决方案
· 提供统一、灵活、易用、全面的算力资源管理与调度策略,解决传统算力使用场景中算力资源碎片化、用户需求多样化、运维管理工作量大等问题。
· 可整合零散、异构算力资源进行统一管理与调度,实现化零为整,提升算力资源整体利用率。
· 为算力租户提供一个可伸缩、可定制、相对隔离且开箱即用的在线计算环境,用户可通过浏览器使用平台的完整功能。
· 有效支撑用户研发过程闭环,提供数据准备→运行环境→训练/计算→成果归档/复用的研发全流程的环境/工具支持,促进智能生态蓬勃发展。
丰富、便捷的在线研发环境
-
· 支持云桌面、Jupyter、SSH 1、Web IDE、Web Terminal 2、低代码“拖拉拽”流程建模等多款开箱即用的算力使用环境,满足用户对不同研发环境的需求。
· 支持一键导入社区开源的Docker镜像,无需任何改动即可在线使用,提升科研效率。
· 用户可在浏览器使用平台的完整功能,达到“任何人、任何时间、任何地点”均能使用本平台的效果。
注1: 可针对校园机房安全策略提供直连及代理连接两种不同的SSH连接方式
注2: 基于CG WebTerminal实现在浏览器中执行shell命令以使用几乎任何类型的运行环境
基于共享的资源配额管理
-
· 管理员可为用户设置资源使用总配额及单个项目的资源上限,对CPU、内存、GPU等资源使用量进行限定。
· 用户(组)在配额限定范围内可自由申请资源及变更软件环境,无需管理员干预。
· 支持自动、手动、延迟等多种资源释放策略,在满足用户需求同时尽快回收算力资源。
· 支持灵活设置用户的项目最长运行时间,倒计时结束即可强制收回项目申请的资源。
多粒度GPU算力调度
-
· VGPU技术支持:多用户同时用一张卡。
-
· 分布式GPU算力支持:一个用户同时用多张卡。
应用中心
-
· 开发者可将开发完成的服务/应用发布到应用中心,供其它用户使用,促进成果交流。
-
· 用户可在此寻找对自己有帮助的应用,激发创作灵感。
-
· 其它平台的应用可直接使用应用中心内的服务或应用,提升系统研发效率。
全面支撑人工智能/机器学习相关任务
-
数据
支持多源数据集管理
支持数据在线预览
支持数据在线标注
-
算法
丰富的平台预设算法
支持代码片段管理
模型训练辅助工具
-
模型
丰富的平台预设模型
支持用户模型入库管理
支持模型文件预览
-
算力资源
基于容器云架构的调度
支持vGPU切分技术
支持GPU分布式计算
-
运行环境
丰富的平台预设镜像
灵活便捷的在线镜像定制
可私有化部署的镜像仓库
-
其它平台能力
丰富的在线开发环境
用户数据分享机制
离线任务支持
支持团队协同
多粒度资源监控
插件能力
计费、用量管理
页面风格定制能力
......
平台架构:轻量、易用、灵活、全面、开箱即用
-
开发环境
远程桌面
Jupyter
Web IDE
SSH
低代码建模
-
控制中心
用户管理
资源调度
资源监控
服务监控
系统管理
-
数据管理
数据集
数据预览
在线标注
-
模型管理
模型仓库
快速部署
模型发布
-
镜像管理
镜像仓库
镜像定制
镜像分享
-
项目管理
在线运行
离线任务
应用发布
-
多集群异构算力资源
Intel/AMD/龙芯/飞腾
A40/A100/A800/P100/...
学校网络中心集群
二级学院集群
学校超算中心集群