在日前召開的“2024中國光網(wǎng)絡(luò)研討會(huì)”上,華為技術(shù)有限公司光模塊高級(jí)技術(shù)專家段建宏發(fā)表題為《AI場(chǎng)景光模塊的技術(shù)趨勢(shì)及面臨的挑戰(zhàn)》的主題演講。
他表示,大模型之戰(zhàn)帶來模型規(guī)模和訓(xùn)練算力需求爆發(fā)式增長,智算中心是業(yè)界AI模型開發(fā)的共同選擇。業(yè)界主流模型從千億稠密到萬億稀疏,逐步走向百萬級(jí)超長序列和多模態(tài),穩(wěn)定性、高性能為AI大集群客戶核心訴求。
“文本、圖像乃至視頻AI的高速發(fā)展對(duì)算力規(guī)模提升提出更大挑戰(zhàn),千卡/萬卡等高效互聯(lián)的AI集群是必然發(fā)展趨勢(shì),而高速網(wǎng)絡(luò)互聯(lián)是提升系統(tǒng)集群算力的關(guān)鍵一環(huán)。”
段建宏指出,光模塊“麻雀雖小,五臟俱全”,在AI計(jì)算網(wǎng)絡(luò)典型組網(wǎng)中的應(yīng)用廣泛,可在參數(shù)面網(wǎng)絡(luò)用于智能集群分布式訓(xùn)練,業(yè)務(wù)面網(wǎng)絡(luò)用于系統(tǒng)業(yè)務(wù)調(diào)度和管理,存儲(chǔ)面網(wǎng)絡(luò)用于訪問存儲(chǔ)區(qū)數(shù)據(jù),光模塊/AOC用于三張網(wǎng)絡(luò)中的長距接入和設(shè)備互聯(lián)。
同時(shí),智算中心機(jī)房?jī)?nèi)互聯(lián)以2km為主,端口速率已到800G,持續(xù)向高速率(1.6T/3.2T)演進(jìn)中。并且未來5年短距光模塊將快速增長,AI集群光模塊份額占比從2023年的25%提升到2028年的38%,800G光模塊在今年上量部署,1.6T光模塊預(yù)計(jì)在2026年上市。
段建宏提出了AI場(chǎng)景下光模塊的技術(shù)趨勢(shì)及面臨的挑戰(zhàn)。他認(rèn)為,AI場(chǎng)景下光互聯(lián)技術(shù)高速發(fā)展,呈現(xiàn)差異化的特性需求。其中,聯(lián)接速率高,需要大寬帶;互聯(lián)規(guī)模大,需要低功耗、低時(shí)延;因性能/可靠性導(dǎo)致的閃斷影響訓(xùn)練業(yè)務(wù),需要穩(wěn)定、高可靠;智能運(yùn)維,開局或者過程檢測(cè),快速故障定位,需要高可用。
具體來說,在大帶寬方面,224G/Lane待進(jìn)一催熟,高速率對(duì)傳輸距離影響待進(jìn)一步研究,此外,還有小型化封裝低功耗、散熱問題。
低功耗、低時(shí)延方面,LPO 具備相對(duì)優(yōu)勢(shì),但持續(xù)演進(jìn)仍有待討論。另外標(biāo)準(zhǔn)生態(tài)是LPO落地商用的關(guān)鍵,互通性應(yīng)用還在進(jìn)一步研究。速率提升加速單模下沉,硅光預(yù)估迎來高速增長。
高可靠方面,AI計(jì)算對(duì)光互聯(lián)高可靠提出挑戰(zhàn),要求系統(tǒng)端到段設(shè)計(jì)優(yōu)化;系統(tǒng)與光模塊優(yōu)化系統(tǒng)風(fēng)道設(shè)計(jì),光模塊聯(lián)合散熱優(yōu)化;光器件合理提升系統(tǒng)集成度;光芯片優(yōu)化芯片設(shè)計(jì),降低缺陷率,降低電流密度,提升發(fā)光線率。
高可用方面,高速率模塊鏈路潔凈度要求更高,且高密光互聯(lián)架構(gòu),故障定位代價(jià)大,AI網(wǎng)絡(luò)需要注入智能化技術(shù),提升運(yùn)維效率,AI場(chǎng)景下光模塊智能運(yùn)維助力系統(tǒng)實(shí)現(xiàn)高可用特性。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...