GPU计算是种极为先进的高密度计算应用,其单位计算密度较传统计算设备/服务器高出数百倍。
一套完整的GPU计算系统也是一样,所有需要GPU高性能系统的用户,都存在”长时间、高承载“的计算需求,系统任何一个元件不正常运行,都会影响整体计算性能。
GPU高性能系统运行时:
计算单元(GPU卡)高速运算时会产生极高热量、
PCIE汇流排处于高占用率、
存储单元(硬盘、SSD)大部分时处于高吞吐(IO)状态、
CPU多处于高负载运行、
系统内各元件处于高频率互动。。。
任何一个不正常因素都会导致系统运行缓慢,甚至宕机,这是多年GPU计算用户遭遇的最大通病:
系统不稳定,但又找不出原因!
这时候,你会这样?:
或者这样?:
还是想把系统供应商抓出来,这样?
。
。
。
。
如此重要的用户需求,怎么会少了华硕的智慧?
华硕高性能系列系统中,在配置两块CPU机种的服务器(ESC4000系列、ESC8000系列)、工作站(ESC2000系列、TS700-E8-RS8)内置支持iKVM功能的BMC(Baseboard management controller)模块,搭配基于Web技术的ASMB管理软件,用户只要通过浏览器便可以轻松完整掌握(一台甚至多台)GPU系统的所有运行状态与系统参数设定,这包括了:
远程操作系统安装
远程电源开启/关闭/重启
远程控制
远程硬件健康监控
系统事件日志
是不是现在觉得利用华硕的系统监控与远程管理软件,维护华硕高性能计算系统变得So Easy?!
从此BOSS再也不用担心我懵逼了!