大數據(ju)時(shi)代,算力不僅改變了(le)人們生產、生活(huo)方式(shi),更(geng)成為(wei)科技進步和經濟社會發(fa)展的關鍵“底(di)座”。從太空探索,到人類基因測序(xu)、醫(yi)藥研發(fa),再到消(xiao)費、出行,都需要強大的算力處理海量(liang)數據(ju)。
高(gao)性能:超算(suan)(suan)中(zhong)心最(zui)核心的(de)(de)服(fu)務能力是算(suan)(suan)力輸出,因此需要具備優質的(de)(de)智算(suan)(suan)服(fu)務、先(xian)進的(de)(de)計算(suan)(suan)能力。
安全可靠:作(zuo)為國家級(ji)計算(suan)中心,需要具有(you)穩定可靠的算(suan)力設備,避免突發(fa)事(shi)件對數(shu)據的破(po)壞(huai)。
靈活擴(kuo)展:算(suan)力集群需要(yao)(yao)與網絡、存儲(chu)等節點鏈接,因此需要(yao)(yao)更靈活的擴展能力。
易維護:出現故障(zhang),單(dan)獨排查運維成本高,因此需要打造管理集群,簡化運維操作。
安擎針對超算(suan)中心商(shang)用輔助(zhu)計算(suan)的需求,依托數十臺EG840-G30 4U服務器部署輔助(zhu)算(suan)力集(ji)群系(xi)統。
EG840-G30是專為計算密(mi)集型(xing)應用場景推出的新(xin)一(yi)代服務器,具有(you)高(gao)性能、高(gao)可靠(kao)、高(gao)擴展(zhan)的特點。
高性能(neng)
· 采用第三代英特爾? 至強? 可擴展系列處理(li)器(TDP 270W),每顆 CPU 最大提供 64 Lane PCI-E 4.0 總線;
· 在4U的空間內可支持10片(pian)全(quan)高全(quan)長雙寬專業GPU卡,單U算力可達1560TFLOPS。
高可靠
· 通(tong)(tong)過檢測、控制(zhi)并持(chi)續糾(jiu)正(zheng)錯(cuo)誤和(he)(he)故(gu)障,而不是(shi)通(tong)(tong)過強制(zhi)重置 GPU 來提高其(qi)正(zheng)常(chang)運行時間和(he)(he)可靠性(xing);在(zai)(zai)處理錯(cuo)誤和(he)(he)故(gu)障邏輯(ji)中(zhong),運用歸(gui)因、隔離、遏(e)制(zhi)等策略針對 MIG 環境,確保GPU在(zai)(zai)高性(xing)能計算(suan)環境中(zhong)的安全;
· 配置 2000W 鉑金(jin)級 2+2 冗余(yu)電源(yuan),防止瞬間(jian)掉電,提供更穩定(ding)可(ke)靠的系統電源(yuan)。
高擴展
· 配置12個(ge)PCI-E4.0 插槽(cao),可搭配 100G 以太網卡和Infiniband 網卡,組(zu)建低延時高擴展的存儲與計算網絡。
易管理
· 集成(cheng) IPMI 功(gong)能,可(ke)以對服務器(qi)進(jin)行遠程(cheng)操作和(he)維護,有效提高產品可(ke)靠性(xing)和(he)穩定性(xing);
· 智(zhi)慧BMC遠程管理(li),提供零接觸運維(wei),提高(gao)運維(wei)效率;支(zhi)持 IPMI 和 KVM Over IP 高(gao)級(ji)管理(li)功能。
靈活(huo)擴展(zhan),高速的存儲計(ji)算集(ji)群,滿足輔助計(ji)算需求;
持續穩定的算力輸出,打(da)造可靠的算力底(di)座;
數字化管理,降低管理運維成本。