
为每一个具体客户定制的规模化私有云计划,基于符合当今先进规范的计算节点和高速互联端口和开放式的计算环境;
小、中、大型方案灵活部署;
FP32全精度数据计算能力可达1000TFlops-10000TFlops(10PFlops FP32)
FP16 AI ML数据计算能力可达5000TFlops-100000TFlops(100PFlops FP16)
------------------------------------------------------------------------------------------------
部分特性:
动态调配计算资源池,提高资源利用率;
封装完整驱动,预制CUDA-X, ROCM,NCCL等加速组件
支持Caffe,Mxnet,TensorFlow,PyTorch等主流深度学习框架;
可以分权限查看的任务运行状态,资源消耗情况以及运行日志;
自动生成ROC曲线,显示准确率及其他可视化分析内容;
用户能管理计算资源节点,资源分区,查看硬件健康状况;
基于开放接口所创建的存储区域,实现不同用户间存储区域相互隔离。
支持TensorFlow、Caffe、MxNet、CNTK等所有AI主流深度学习框架
支持SKLearn、XGBoost等传统机器学习方法;
模型包括CNN、RNN、LSTM、DBN等,支持图像语音识别、自然语言理解等;
通过平台可视化的操作界面,可以完成模型训练任务的创建、运行、结果比对;
可提供数据采集、清洗、规范化处理和智能标注等功能。
管理节点可进行故障自动转移,保证集群的高可用性;
任何运行监控指标达到警戒值时自动预警,并采取机内保护措施;
|
|