在晶片競逐的洪流中,華為的最新動向無疑是一石激起千層浪。這不僅是技術層面的較量,更是國家戰略與產業生態重塑的縮影。當全球目光聚焦於AI算力軍備競賽時,中國科技巨頭華為傳出正在測試其最新的AI晶片「昇騰910D」,並冀望這款產品能夠在特定領域挑戰甚至取代長期以來佔據主導地位的輝達(Nvidia)高階晶片,特別是其旗艦產品H100。這一步棋,在當前複雜的地緣政治與技術封鎖背景下,顯得格外引人注目。
自主芯路,崎嶇而行
華為測試昇騰910D的消息,由多家國際媒體引述知情人士報導披露。據悉,華為已與部分中國科技公司展開接觸,希望透過實際應用測試來評估910D的技術可行性與實際效能。首批測試樣本最快有望在五月底交付。儘管開發尚處早期,但華為顯然抱有雄心壯志,期望這款新晶片能在性能上超越輝達於2022年推出的AI訓練熱門晶片H100。在此之前,華為已推出了昇騰910B和910C版本,持續在AI晶片領域強化自身技術實力。
這一系列動作,是中國半導體產業在外部壓力下尋求自主可控的具體體現。自2019年被美國列入貿易黑名單以來,華為展現了強大的韌性,並成為推動中國半導體自主化戰略的重要力量。去年推出的Mate 60手機搭載國產處理器即是一例,引起市場與美國政府的高度關注。美國對輝達高階AI晶片的出口限制,包括最新的H20晶片,無疑為華為等中國本土AI晶片企業提供了搶佔市場份額的寶貴機會。據報導,今年華為預計向國內客戶出貨超過80萬片昇騰910B和910C晶片,部分客戶因輝達產品受限已在洽談追加訂單,顯示國產晶片需求正在急速上升。
挑戰巨頭,性能幾何?
華為希望昇騰910D能夠超越輝達H100,這是一個大膽的目標。輝達的H100基於其Hopper架構,以強大的平行計算能力和高頻寬記憶體(HBM3)著稱,在大型語言模型訓練等AI應用領域建立了領先地位。公開資料顯示,H100在FP16運算方面擁有近千TFLOPS的理論峰值算力,並配備高達80GB的HBM3記憶體。
相較之下,華為先前的昇騰910C晶片據稱透過先進整合技術將兩個910B處理器組合成一個封裝,性能接近輝達H100。知情人士稱,910C的運算能力和記憶體容量是910B的兩倍,並在支援多樣化AI工作負載數據方面有所提升。然而,實際使用過這兩款晶片的工程師表示,華為晶片的表現仍略遜於輝達。有分析指出,昇騰910C執行推論的效能約為H100的60%。儘管單晶片性能存在差距,但華為正透過系統層級創新來彌補。今年四月,華為發表的CloudMatrix 384運算系統,能夠連結多達384顆昇騰910C晶片,在部分條件下甚至超越了輝達由72顆Blackwell晶片組成的旗艦系統。雖然這套系統的耗電量較高,但透過並聯大量晶片來提升整體算力,是華為在先進製程受限下的策略選擇。
製造瓶頸與生態建設
華為在AI晶片領域的進展令人矚目,但其面臨的製造瓶頸依然嚴峻。由於美國的限制,華為無法取得台積電等領先晶圓代工廠的先進製程支援,中國本土最大的晶片製造商中芯國際也因無法獲得最先進的設備而受限。這意味著華為在單晶片性能提升上遭遇極大挑戰。有報導指出,昇騰910C採用中芯國際的N+2工藝,FP16算力接近輝達H100的60%-70%。 在無法利用最尖端製程的情況下,華為高層將重點放在打造更有效率的系統,而非單純追求單一晶片的極致性能。
除了硬體,生態系統的建設同樣關鍵。輝達之所以在AI領域獨佔鰲頭,很大程度上得益於其成熟的CUDA軟體平台,為開發者提供了強大的支持。華為也正積極構建自己的昇騰計算生態,包括MindSpore深度學習框架和CANN計算架構,努力降低開發者的遷移成本,吸引更多合作夥伴。昇騰DeepSeek一體機即是華為基於昇騰晶片與DeepSeek大模型結合的AI解決方案,旨在提供國產化AI算力平台。 北京當局的鼓勵也發揮了作用,許多中國AI開發者和國家級數據中心已優先採購國產晶片,以提升自主可控程度。
展望未來
華為測試昇騰910D並劍指輝達H100,是中國在半導體和AI領域力圖突破封鎖、實現自給自足的重要一步。儘管面臨製造工藝、軟體生態等多重挑戰,華為展現出的研發韌性和系統整合能力不容小覷。這場晶片競逐不僅影響著華為和輝達兩家公司,更牽動著全球科技產業格局的變化。隨著華為新晶片的測試與推廣,中國本土AI算力供給有望得到進一步提升,為中國的數字經濟發展提供基礎支撐。然而,能否在性能、良率、成本以及最重要的生態建設上全面追趕甚至超越輝達,仍需時間驗證。這是一條充滿挑戰的道路,但華為已經邁出了堅實的步伐。