0已點(diǎn)贊

阿里云PAI發(fā)布DeepRec Extension，打造穩(wěn)定高效的分布式訓(xùn)練

產(chǎn)品快訊 2024年05月24日 15:48:57來(lái)源：智能化網(wǎng)智薦頭條 21301

摘要近日，阿里云人工智能平臺(tái)PAI正式發(fā)布自研的 DeepRec Extension（即 DeepRec 擴(kuò)展），旨在以更低成本，更高效率進(jìn)行稀疏模型的分布式訓(xùn)練。

　　【儀表網(wǎng) 產(chǎn)品快訊】近日，阿里云人工智能平臺(tái)PAI正式發(fā)布自研的DeepRec Extension(即 DeepRec 擴(kuò)展)，旨在以更低成本，更高效率進(jìn)行稀疏模型的分布式訓(xùn)練。DeepRec Extension 在 DeepRec 訓(xùn)練推理框架之上，圍繞大規(guī)模稀疏模型分布式訓(xùn)練，創(chuàng)新性地從訓(xùn)練任務(wù)的視角提出了自動(dòng)彈性訓(xùn)練和分布式容錯(cuò)功能，進(jìn)一步提升稀疏模型訓(xùn)練的整體效率，助力 DeepRec 引擎在稀疏場(chǎng)景中發(fā)揮更大的優(yōu)勢(shì)。

　　DeepRec Extension 有效地解決了企業(yè)級(jí)場(chǎng)景大規(guī)模稀疏模型訓(xùn)練中的難點(diǎn)。隨著業(yè)務(wù)發(fā)展，模型尺寸增長(zhǎng)到百 GB / TB 量級(jí)，分布式訓(xùn)練往往會(huì)遇到分布式建模接口復(fù)雜、資源預(yù)估困難且無(wú)法彈性、分布式容錯(cuò)機(jī)制過(guò)于簡(jiǎn)單和分布式環(huán)境復(fù)雜等問(wèn)題，阻礙大尺寸模型高效、穩(wěn)定地完成訓(xùn)練。DeepRec Extension 提供易用、高效、高性價(jià)比的框架，使得模型能夠便捷地在分布式環(huán)境中運(yùn)行，切實(shí)解決上述問(wèn)題。

DeepRec Extension 設(shè)計(jì)思路及整體架構(gòu)

　　DeepRec Extension 推出分布式訓(xùn)練資源預(yù)估、自動(dòng)彈性訓(xùn)練、資源/計(jì)算圖監(jiān)控、自動(dòng)備份容錯(cuò)等功能，有效降低了大規(guī)模稀疏模型訓(xùn)練的技術(shù)門檻和成本，同時(shí)提升了分布式訓(xùn)練的效率和穩(wěn)定性。DeepRec Extension 簡(jiǎn)化分布式訓(xùn)練的工作流程，保障用戶聚焦于模型的構(gòu)建階段，更加專注于模型本身的創(chuàng)新與優(yōu)化，無(wú)需關(guān)注繁瑣的底層架構(gòu)配置。在性能提升方面，資源預(yù)估以及自動(dòng)彈性訓(xùn)練為用戶節(jié)約 20% ~ 60% 資源，在穩(wěn)定性方面，PS 發(fā)生異常后，模型 E2E 訓(xùn)練吞吐提升 10%。

　　一直以來(lái)，大規(guī)模稀疏模型分布式訓(xùn)練是備受關(guān)注的話題，阿里云人工智能平臺(tái)PAI正式將 DeepRec Extension 開(kāi)源，與AI開(kāi)發(fā)者共同打造更快更好的分布式訓(xùn)練框架，全面助力AI大模型發(fā)展！

我要評(píng)論

昵稱

匿名

文明上網(wǎng)，理性發(fā)言。（您還可以輸入200個(gè)字符)

表情

所有評(píng)論僅代表網(wǎng)友意見(jiàn)，與本站立場(chǎng)無(wú)關(guān)。

儀表網(wǎng)首頁(yè)資訊首頁(yè)

延伸閱讀

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明"來(lái)源：儀表網(wǎng)"的所有作品，版權(quán)均屬于儀表網(wǎng)，未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明"來(lái)源：儀表網(wǎng)"。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來(lái)源的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí)，必須保留本網(wǎng)注明的作品來(lái)源，并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問(wèn)題，請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。
合作、投稿、轉(zhuǎn)載授權(quán)等相關(guān)事宜，請(qǐng)聯(lián)系本網(wǎng)。聯(lián)系電話：0571-87759945，QQ：1103027433。