直指GPU利用率痛點(diǎn),是德科技發(fā)布KAI解決方案
供稿 / 2025-07-17 14:353736近日,NVIDIA將向中國(guó)市場(chǎng)銷售H20芯片的新聞引發(fā)關(guān)注。在AI時(shí)代,GPU等算力核心器件無(wú)疑是企業(yè)創(chuàng)新發(fā)展的命脈所在,如果說(shuō)模型是AI的大腦,那么數(shù)據(jù)中心就如同心臟一般輸送著算力血液。但數(shù)據(jù)中心耗費(fèi)不菲,其高效可持續(xù)發(fā)展議題吸引人們關(guān)注。6月26日,在是德科技Keysight World Tech Day 2025上,是德科技揭曉了算力中心面臨的瓶頸,以及其用于大規(guī)模AI數(shù)據(jù)中心的系列解決方案。
AI大模型時(shí)代,算力中心面臨挑戰(zhàn)
是德科技大中華區(qū)高速數(shù)字市場(chǎng)部經(jīng)理李堅(jiān)介紹,早期人工智能的應(yīng)用基本呈現(xiàn)單向性,主要聚焦于識(shí)別功能,基于的算力、參數(shù)和數(shù)據(jù)規(guī)模相對(duì)較小。如今,人工智能不僅限于簡(jiǎn)單的識(shí)別,其模式基于大模型,參數(shù)規(guī)模上升至萬(wàn)億量級(jí),算力集群也從千卡集群向萬(wàn)卡、十萬(wàn)卡集群演進(jìn)。大模型需要大算力、大數(shù)據(jù)和大帶寬支持,算力中心規(guī)模龐大,建設(shè)投入高達(dá)數(shù)百億元人民幣。
在這些投入中,GPU的成本無(wú)疑占據(jù)很大比重。然而,數(shù)據(jù)顯示,GPU并非時(shí)刻都在“工作”,在進(jìn)行模型訓(xùn)練時(shí),GPU的等待時(shí)間超過(guò)了50%,真正處于工作狀態(tài)的時(shí)間大概只有38%。投入幾百億元建設(shè)的數(shù)據(jù)中心,核心部件GPU利用率卻不高,投資回報(bào)率顯得很低。這背后的原因是網(wǎng)絡(luò)在進(jìn)行數(shù)據(jù)交換時(shí)遇到阻礙,數(shù)據(jù)沒(méi)有及時(shí)給到GPU。就像早上上班路上堵車,上班就會(huì)遲到,自然也就沒(méi)辦法按時(shí)開(kāi)始工作。

另一個(gè)值得關(guān)注的狀況是數(shù)據(jù)中心中故障頻發(fā)。大模型訓(xùn)練一次就能順利完成任務(wù)的概率大概只有57%。這是因?yàn)樵谟?xùn)練過(guò)程中,會(huì)出現(xiàn)各種各樣的硬件或軟件故障,尤其是硬件故障。如今速率提升得非常快,很多器件已經(jīng)接近其物理極限,在高溫、高速且24小時(shí)不間斷的工作環(huán)境下,很多器件不堪重負(fù)甚至崩潰。網(wǎng)絡(luò)可靠性問(wèn)題頻發(fā),只要其中任何一個(gè)器件出現(xiàn)故障,整個(gè)系統(tǒng)可能都無(wú)法正常運(yùn)行。
當(dāng)下算力中心建設(shè)正如火如荼地推進(jìn),然而不少算力中心其實(shí)是“帶病上線”,存在諸多問(wèn)題。投入了巨額資金,但這些資金的投資回報(bào)率能否達(dá)到期望,還有沒(méi)有優(yōu)化的空間?李堅(jiān)的回答是“有很多空間”。
是德科技深耕測(cè)試測(cè)量領(lǐng)域八十余載,一直密切關(guān)注產(chǎn)業(yè)發(fā)展,希望與產(chǎn)業(yè)界攜手合作,共同提升數(shù)據(jù)中心基層硬件和軟件的指標(biāo),及時(shí)察覺(jué)網(wǎng)絡(luò)中可能潛藏的各種問(wèn)題,疏通網(wǎng)絡(luò)流量,讓網(wǎng)絡(luò)運(yùn)行更加有效。
Keysight AI解決方案,助力數(shù)據(jù)中心優(yōu)化
基于對(duì)算力中心挑戰(zhàn)的認(rèn)知,是德科技與眾多AI產(chǎn)業(yè)客戶開(kāi)展了大量工作,逐步梳理了產(chǎn)品線,針對(duì)人工智能市場(chǎng)重新定義了產(chǎn)品矩陣,推出用于大規(guī)模AI數(shù)據(jù)中心的系列解決方案,統(tǒng)一命名為“Keysight AI”,簡(jiǎn)稱“KAI”。產(chǎn)品矩陣分四大板塊:

· KAI高速計(jì)算:涵蓋算力板卡相關(guān)的所有測(cè)試手段,助力打造更穩(wěn)定可靠的算力。主要包括電子設(shè)計(jì)自動(dòng)化套件、誤碼儀、示波器和任意波形發(fā)生器。
· KAI互連:驗(yàn)證光學(xué)和電氣通道,面向連接板塊的電纜、光模塊、光連接等。這些在高速率下工作的器件數(shù)量眾多,必須保證質(zhì)量。該板塊主要包括采樣示波器、光子功率計(jì)和網(wǎng)絡(luò)測(cè)試儀。
· KAI網(wǎng)絡(luò):對(duì)AI網(wǎng)絡(luò)性能進(jìn)行基準(zhǔn)測(cè)試,檢測(cè)瓶頸,優(yōu)化AI工作負(fù)載分配。主要包括AI工作負(fù)載仿真器、分布式網(wǎng)絡(luò)流量生成器和網(wǎng)絡(luò)流量仿真器。
· KAI能效:“數(shù)據(jù)中心的盡頭是電站。”一個(gè)十萬(wàn)板卡的算力中心,其耗電量堪比甚至超過(guò)一座百萬(wàn)人口城市的耗電量。KAI能效解決方案助力優(yōu)化數(shù)據(jù)中心組件的電源效率和能源管理。主要包括示波器、電源軌探頭和電子設(shè)計(jì)自動(dòng)化套件。
人工智能引發(fā)廣泛關(guān)注,源于其背后的巨大機(jī)會(huì)。是德科技高級(jí)副總裁兼通信解決方案事業(yè)部總裁Kailash Narayanan強(qiáng)調(diào),AI已從概念走向現(xiàn)實(shí),大量投資涌入該領(lǐng)域。是德科技展現(xiàn)出前瞻性的戰(zhàn)略眼光與強(qiáng)大的技術(shù)實(shí)力,為人工智能提供全棧、全生命周期的解決方案,為人工智能產(chǎn)業(yè)的蓬勃發(fā)展注入強(qiáng)勁動(dòng)力。
直指GPU利用率痛點(diǎn),是德科技發(fā)布KAI解決方案














滬公網(wǎng)安備 31010702005758號(hào)
發(fā)表評(píng)論注冊(cè)|登錄