中國報告大廳網訊,近期AI領域迎來兩則重要進展:DeepSeekV3版本更新性能表現超預期,而螞蟻集團推出的大模型"百靈"系列更以國產低性能GPU實現同等參數規模訓練,將成本降低近20%。這一成果不僅展現了中國在晶片適配與大模型研發上的技術突破,也為AI普及提供了新的路徑選擇。
中國報告大廳發布的《2025-2030年全球及中國晶片行業市場現狀調研及發展前景分析報告》指出,螞蟻團隊推出的百靈系列包含168億參數的Lite版和2900億參數的Plus版(激活參數分別為27.5億和288億),其核心創新在於通過國產低性能GPU完成3000億級MoE模型訓練。實驗證明,這類晶片在處理混合專家架構時與英偉達H100/H800等高性能GPU的訓練效果相當,打破了大模型對高端硬體的高度依賴。這種技術突破為降低AI研發門檻提供了關鍵支撐。
面對不同品牌晶片性能差異帶來的協同難題,百靈團隊開發了分布式集群與跨異構計算方案。通過動態平衡多型號GPU的算力輸出,系統能有效彌補硬體性能差距。在實際測試中,該技術成功支持5種配置的混合硬體環境訓練Plus版本模型,證明國產化基礎設施可支撐超大規模模型研發。
實驗數據顯示,在完成1萬億token預訓練時,採用高性能GPU的成本約為635萬元,而優化後的低規格硬體僅需約508萬元。這一降幅達19.4%的成果,意味著在保持與通義千問2.5、DeepSeekV2.5等主流模型相當性能的同時,顯著降低了技術落地門檻。值得注意的是,該數據基於實驗室環境得出,真實場景中的表現仍需進一步驗證。
目前百靈大模型已在生活服務、金融風控、醫療診斷等領域實現應用。螞蟻集團表示將持續優化不同晶片適配方案,並計劃逐步開放Plus和Lite版本的原始碼。此舉將推動更多開發者參與國產AI生態建設,加速技術在實體經濟中的滲透。
總結來看,百靈系列通過技術創新與成本控制,在大模型研發領域實現了"性能不降、價格走低"的雙重突破。其成功經驗不僅為國內企業提供了可複製的技術路徑參考,更驗證了國產晶片在複雜計算任務中的可行性。隨著開源計劃推進和應用場景擴展,這類技術成果有望成為推動AI產業規模化發展的關鍵動力。
更多晶片行業研究分析,詳見中國報告大廳《晶片行業報告匯總》。這裡匯聚海量專業資料,深度剖析各行業發展態勢與趨勢,為您的決策提供堅實依據。
更多詳細的行業數據盡在【資料庫】,涵蓋了宏觀數據、產量數據、進出口數據、價格數據及上市公司財務數據等各類型數據內容。