中國存儲(chǔ)網(wǎng)消息,三星SDS于3月23日宣布,已通過其云平臺(tái)三星云平臺(tái),基于英偉達(dá)最新圖形處理單元B300 Blackwell Ultra推出GPU即服務(wù)(GPUaaS),這標(biāo)志著韓國首個(gè)此類服務(wù)。

SCP B300 GPUaaS的發(fā)布旨在滿足企業(yè)從人工智能模型開發(fā)進(jìn)入推理階段、在實(shí)際應(yīng)用中部署的高性能計(jì)算需求。

B300 GPU 配備了 12 層 HBM3E(第五代高帶寬存儲(chǔ)器),每塊 GPU 提供 288 GB 內(nèi)存容量,帶寬為每秒 8 TB。在需要復(fù)雜計(jì)算的AI推理工作負(fù)載中,它提供比H100高3.6倍的內(nèi)存容量和2.4倍更高的帶寬。

因此,數(shù)據(jù)瓶頸問題——即由于內(nèi)存?zhèn)鬏斔俣嚷浜笥贕PU處理速度而導(dǎo)致整體性能下降——在大型語言模型執(zhí)行過程中得到了顯著緩解。

三星SDS一直引領(lǐng)GPUaaS生態(tài)系統(tǒng)的發(fā)展,2021年提供基于A100的服務(wù),2023年提供基于H100的服務(wù),使GPU能夠作為跨云環(huán)境的核心AI基礎(chǔ)設(shè)施,包括基礎(chǔ)設(shè)施部署、運(yùn)營(yíng)和客戶服務(wù)。

采用SCP B300 GPUaaS的客戶可以通過高容量?jī)?nèi)存高效處理大型AI模型,最大限度地減少需要高性能的AI服務(wù)的延遲,如AI代理以及圖像、視頻和分析的生成和分析。

三星SDS云服務(wù)業(yè)務(wù)執(zhí)行副總裁兼負(fù)責(zé)人李浩俊表示,公司將積極支持向人工智能轉(zhuǎn)型的轉(zhuǎn)型,向韓國首個(gè)B300 GPU服務(wù),面向企業(yè)、中型企業(yè)和公共機(jī)構(gòu)整合人工智能,利用其GPU優(yōu)化能力,如資源效率和節(jié)能。