在技術(shù)創(chuàng)新論壇上,優(yōu)刻得高級(jí)技術(shù)經(jīng)理吳成斌發(fā)表了主題為《數(shù)據(jù)中心智能化的實(shí)踐與思考》的精彩演講。
吳成斌介紹,優(yōu)刻得烏蘭察布智算中心是公司緊貼“東數(shù)西算”國(guó)家戰(zhàn)略、按照國(guó)際A級(jí)數(shù)據(jù)中心標(biāo)準(zhǔn)所自建的“西部”智能算力中心,位于全國(guó)一體化算力網(wǎng)絡(luò)國(guó)家樞紐節(jié)點(diǎn)集寧大數(shù)據(jù)產(chǎn)業(yè)園,整體建筑面積約14萬(wàn)平方米,總計(jì)可容納12000個(gè)機(jī)柜,能夠提供高性能、靈活、安全可靠的算力支撐和技術(shù)支持,幫助用戶解決算力資源不足、成本高昂等問(wèn)題,為用戶帶來(lái)更高價(jià)值。
優(yōu)刻得烏蘭察布智算中心支持機(jī)房模塊布置、基礎(chǔ)設(shè)施配置的靈活部署、深度定制,可全面提供從數(shù)據(jù)中心、服務(wù)器、到計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全、架構(gòu)設(shè)計(jì)的一整套AIGC解決方案,將產(chǎn)品能力轉(zhuǎn)化成差異性的服務(wù)交付給客戶,為企業(yè)構(gòu)建穩(wěn)定可靠的大模型算力底座。目前,優(yōu)刻得烏蘭察布智算中心已經(jīng)形成可支持萬(wàn)億參數(shù)、千卡集群的大模型訓(xùn)練能力,以高性能算力服務(wù)于大模型訓(xùn)練和推理任務(wù)。
談及智算中心的“智能化”改造,吳成斌表示,數(shù)據(jù)集中管理是智能化的基礎(chǔ),而監(jiān)控系統(tǒng)是智能化的核心。優(yōu)刻得智能算力中心充分運(yùn)用RFID資產(chǎn)管理、機(jī)器人智能巡檢、DCIM系統(tǒng)監(jiān)控、AR遠(yuǎn)程運(yùn)維、數(shù)字孿生等技術(shù),實(shí)現(xiàn)了自動(dòng)化運(yùn)維、智能化巡檢、數(shù)字化管理。優(yōu)刻得積極投入數(shù)據(jù)中心創(chuàng)新技術(shù)研究,并作為參編單位參與了《數(shù)據(jù)中心浸沒(méi)液冷系統(tǒng)碳氟類(lèi)冷卻液技術(shù)要求和測(cè)試規(guī)范》的標(biāo)準(zhǔn)制定。當(dāng)前也正不斷探索運(yùn)用與人工智能相結(jié)合的先進(jìn)技術(shù),實(shí)現(xiàn)AI節(jié)能控制、故障自動(dòng)診斷與預(yù)測(cè)。
在算力基礎(chǔ)設(shè)施之上,優(yōu)刻得還構(gòu)建了智能、一體化的智算解決方案,基于優(yōu)刻得的云主機(jī)、裸金屬、高性能存儲(chǔ)和低延遲網(wǎng)絡(luò)等基礎(chǔ)設(shè)施,結(jié)合了“孔明”智算平臺(tái)和UModelVerse模型服務(wù)平臺(tái),能夠?yàn)榇竽P烷_(kāi)發(fā)者、應(yīng)用廠商、高校和科研機(jī)構(gòu)等提供一站式的AI計(jì)算開(kāi)發(fā)服務(wù)。其中,優(yōu)刻得孔明智算平臺(tái)具備多用戶管理、分布式訓(xùn)練、斷點(diǎn)續(xù)訓(xùn)和智能運(yùn)維等功能,面向眾行業(yè)用戶,提供一站式管理的算力資源和運(yùn)營(yíng)服務(wù),使得模型開(kāi)發(fā)者能夠更專(zhuān)注于模型開(kāi)發(fā),無(wú)需擔(dān)心底層訓(xùn)練環(huán)境的部署。
大會(huì)期間,優(yōu)刻得混合云業(yè)務(wù)中心總經(jīng)理唐立參與探討了“算力租賃是否一門(mén)好生意”的圓桌對(duì)話。他表示,優(yōu)刻得作為中立的云廠商,自身不做大模型業(yè)務(wù),但能夠?qū)ν馊孑敵鲆徽臼降闹撬惴⻊?wù)平臺(tái)能力,幫助用戶提升算力使用的便捷性,這種租賃的方式會(huì)極大地降低用戶的算力使用成本。
基于高性能計(jì)算和大規(guī)模數(shù)據(jù)處理能力,智算中心不僅成為科研、金融、制造、醫(yī)療等行業(yè)領(lǐng)域的關(guān)鍵基礎(chǔ)設(shè)施,也將成為數(shù)字經(jīng)濟(jì)發(fā)展的新引擎。作為云計(jì)算領(lǐng)軍型企業(yè),優(yōu)刻得將不斷加強(qiáng)技術(shù)創(chuàng)新與應(yīng)用實(shí)踐,持續(xù)推進(jìn)智算中心建設(shè),為人工智能和大模型產(chǎn)業(yè)發(fā)展提供強(qiáng)大堅(jiān)實(shí)的數(shù)字底座支撐。