C114訊 9月12日消息(蘭茜)9月11-13日,第25屆中國國際光電博覽會在深圳舉行,在同期舉辦的“智算中心光技術創(chuàng)新發(fā)展論壇”上,中國信通院技術與標準研究所副所長趙文玉應邀作了題為《智算中心光互聯(lián)技術發(fā)展探討》的主題演講。
趙文玉表示,我國出臺系列政策布局算力基礎設施快速發(fā)展,截至2023年底,全國在用數(shù)據(jù)中心機架總規(guī)模超過810萬標準機架,算力總規(guī)模達到230 EFLOPS(每秒浮點運算次數(shù)),位居全球第二。智算與光互聯(lián)雙向賦能,高速率、低時延/低能耗、高可靠/高集成、智管理等多種光互聯(lián)技術持續(xù)加速演進。
智算與光互聯(lián)雙向賦能 高性能智算中心網(wǎng)絡構(gòu)建成熱點
趙文玉介紹,在大背景下,我國智能算力需求激增,高性能智算中心網(wǎng)絡構(gòu)建成為熱點。2003-2024近二十年間智能算力需求增長百億倍。AI大模型的突破性進展激發(fā)全球智能算力發(fā)展熱潮,智算中心開始構(gòu)建萬卡規(guī)模集群進行AI大模型訓練。
同時,智算與光互聯(lián)雙向賦能,多種光互聯(lián)技術持續(xù)加速演進。趙文玉表示,光連接作用日益突出。大型的人工智能模型需要100至10000個GPU,新型光互聯(lián)技術逐步應用,模塊/xPU比例將進一步上升。
智算逐步成為光互聯(lián)的重要應用。目前人工智能應用占比逐漸增,AI在以太網(wǎng)、InfiniBand、NVLink等中的應用還將推動光互聯(lián)帶寬跳躍式增長。預計用于人工智能集群應用的光模塊的銷售額將從2023年的12億美元增加到2024年的30億美元,2025年達到50億美元。
光模塊數(shù)量和速率需求實現(xiàn)數(shù)倍提升,如何加速構(gòu)建低能耗、集成化網(wǎng)絡以支撐智能算力發(fā)展需求成為業(yè)界關注熱點。
光互聯(lián)技術在智算中心應用前景廣闊
趙文玉表示,光互聯(lián)技術以其高速率、低能耗/低時延、高可靠、智管理的特點逐漸成為智算的必需硬件。
在高速率方面,數(shù)據(jù)/智算中心主導驅(qū)動光模塊芯片提速革新,800Gb/s和1.6Tb/s光模塊研發(fā)加速。趙文玉介紹,AI智算引入后數(shù)據(jù)中心迭代周期呈現(xiàn)縮短趨勢,當前處于800Gb/s速率,預計未來1~2年進入1.6Tb/s速率,2030年3.2Tb/s將走向規(guī)模應用。
在低能耗/低時延方面,LPO/CPO/OIO、新型光纖等技術持續(xù)推進低時延和低能耗。LPO光模塊功耗和延時可大幅降低,滿足AI大模型預訓練的短距、大寬帶、低延時互聯(lián)需求;交換網(wǎng)絡場景中的CPO技術、算存網(wǎng)絡場景中的OIO技術,均可實現(xiàn)集成度的提升和比特能耗下降;超低損光纖適配400G+超高速長距離、C+L多波段大容量,成為智算中心間互聯(lián)應用優(yōu)配。
在高可靠/高集成方面,光互聯(lián)可靠性成為關注新熱點。趙文玉表示,計算架構(gòu)中的誤碼率要求比以太網(wǎng)中的更加嚴格,光互聯(lián)的可靠性直接關系到計算集群的性能和維護成本。為實現(xiàn)更高的可靠性,一方面需提升激光器可靠性,另一方面需硅光技術結(jié)合微電子和光子優(yōu)勢,開辟“芯”賽道。
在智管理方面,AI助力提升算網(wǎng)協(xié)同運維效率。當前,人工智能技術賦能智算中心網(wǎng)絡智能化運維,網(wǎng)絡運營者積極擁抱智能化運維,標準化體系初步建立。信通院協(xié)同業(yè)界積極開展自智網(wǎng)絡、運維大模型評測等產(chǎn)業(yè)推動工作,推動面向智算中心網(wǎng)絡等場景大模型應用落地。
最后,趙文玉指出,面對數(shù)據(jù)中心與算力、AI及大模型等引發(fā)的諸多創(chuàng)新業(yè)務與應用承載需求,面向智算應用的高速互聯(lián)技術應用遠景和愿景可期。希望產(chǎn)學研用各主體協(xié)同聚力共推光通信技術與產(chǎn)業(yè)革新演進,賦能新質(zhì)生產(chǎn)力發(fā)展。