新葡萄8883论坛-欢迎您

解决方案
运用科技进行整合性创新
恒联云容器平台

· 云容器平台使用主流容器编排工具kubernetes搭建容器集群,并提供RBAC控制,容器及服务的生命周期管理和资源分配;

· 定制化的应用商店由Helm提供,可为多用户提供公开或用户定制的应用快速部署;

· 制化的私有容器镜像仓库由Harbor提供,可为多用户提供研究用户的容器镜像;

· 监控及日志分析由Prometheus和ELK提供,可实时监控平台内服务器、虚拟机、容器的使用情况;

· 方便结合CI/CD工具,如Jenkins。提供原厂CI/CD工具Rancher pipline;

· 提供GPU sharing。

DGX加速的数据中心
DGX系统支持NVIDIA的AI软件,包括为DGX优化的操作系统(OS dgx),集群管理和业务流程工具,可在NGC平台上下载的库和深度学习框架(为DGX系统优化)。
图1
图2
推荐说明:
NVIDIA推荐的AI软件栈建立在针对DGX硬件系统优化的OS系统,ubuntu操作系统上,包括认证的GPU驱动,网络应用组合,预设的NFS服务器配置,NVIDIA数据中心GPU管理工具(DCGM),支持GPU的docker容器,NVIDIA CUDA® SDK, cuDNN, NCCL和其他NVIDIA加速库,以及NVLINK/NVswitch技术。

用户可自行部署推荐的DGX系统管理应用平台来管理DGX系统,该管理应用平台也支持其他服务器。该平台是由多个运行在容器中的不同服务组件组成,示意图2。
·该管理平台利用DHCP和PXE技术实现DGX OS的网络远程安装;
·Ansible可以远程实现分发应用和库;
·可以 使用kubernetes对容器实例进行管理;
·可使用SLURM对DGX系统提交用户的作业任务,并实现作业任务的调度;
·推荐使用Prometheus为DGX系统做监控;
·推荐使用Grafana作为数据可视化工具;
·支持资源计费。
产品功能
恒联提供丰富的产品功能为用户解决问题
海量数据存储管理
Massive data storage management
通过分布式文件系统,可将海量各类原始数据、结果数据进行快速存储,并通过自带副本机制,完成对数据的多份备份。
灵活多样数据处理引擎
Flexible data processing engine
通过批量计算、内存计算框架、流式计算框架、多维数据分析计算、图计算等多种技术支持多种应用,计算引擎实现“术业有专攻”。
海量数据快速查询
Massive data quick query
通过低成本的硬件提供高性能的数据加载、索引和查询,具备对海量数据快速查询响应能力。
优化的分布式数据库
Optimized distributed database
面向结构化数据分析设计开发的,经过优化的MPP查询引擎,能够有效处理PB级别的数据量;性能超群TB数据秒级返回。
数据迁移
data migration
支持关系型数据库、大数据(OLAP)等数据源间的数据迁移。致力海量数据迁移需求下,解决远距离、毫秒级异步数据传输难题;同时数据迁移轻松构建安全、可扩展、高可用的数据传输架构。
系统高可用性
System high availability
结合各类分布式软件架构特性,通过引入HA热备方式,进一步提升系统的高可靠和高可用性。
系统运维监控
System operation and maintenance monitor
系统运维监控中心提供产品套件的快速安装部署、集群性能监控、组件服务管理、系统告警分析、主机管理、版本管理、日志管理等计算平台运维监控服务。通过统一的图形化界面实现对大数据平台运行服务状况的实时监控和管理,实现运维的健康化、自动化、智能化,大大降低了人力成本的投入。
资源统一调配管理
Unified resource management
通过统一的资源调度技术,可实现底层硬件资源的共享。将共享的各类计算资源根据需要划分为多个逻辑运行单元,按需动态分配给不同负载的应用,实现一个集群支撑多套不同的应用运行,在提升集群设备资源利用率的同时,降低日常运维工作量。
数据资产
Data asset
基于元数据、主数据等重要元素,构建数据资产管理平台,实现数据资产定义、可视化等管理能力,数据安全提供数据访问权限管理、隐私策略管理、数据加解密,依托大数据平台实现数据全生命周期的管理,支持以价值挖掘为导向的数据应用开发。
任务调度
Task scheduling
拥有先进可靠的自动化任务管理调度功能,提供可操作的 web 图形化管理满足多种场景下各种复杂的定时任务、Cron 任务调度和任务执行生命周期管理。有较好的伸缩性和扩展性,提供业务日志记录器。支持节点监控、任务执行监控,支持暂停/恢复任务,以及终止运行中任务,支持在线配置调度任务入参和在线查看调度结果。提供海量任务的情况下,严格精确定时触发任务服务。
QQ
返回顶部
Baidu
sogou