0
雷峰網(公眾號:雷峰網)消息顯示,當地時間10月27日,高通宣布推出針對數據中心場景的AI推理優化解決方案。該方案由Qualcomm AI200、AI250云端AI芯片,及對應的加速卡、機架等組成。
千億級云端推理市場的入局動態,讓高通在資本市場收獲積極反饋。其股價在交易時段內最高上漲22%,收盤時漲幅收窄至11%。截至美股10月27日收盤,高通股價報187.68美元/股,公司市值約2025億美元,市值單日增加近200億美元。
“站在美國的角度看,英偉達的市值已經很高了,再向上漲一個數量級有比較高的難度,而美股近期能夠上漲的股票都跟AI概念相掛鉤,高通推出AI推理芯片屬于補漲。”芯片行業分析師陳沖表示。
不少行業人士告訴雷峰網,高通在端側芯片有很多經驗和技術上的積累,進軍AI推理芯片可以為高通帶來新的業務增量,并且市場也不想看到英偉達一家獨大,因此此舉在行業預期之內。關于國內外AI芯片市場的競爭格局,歡迎添加微信 YONGGANLL6662 交流更多信息。
但這份行業預期背后,高通的低TCO主張能否真正形成競爭力,仍需接受檢驗。
“高通主打行業最低總擁有成本(TCO)的概念,而其高能效和內存處理能力是否有足夠的競爭優勢還需要在實際場景中驗證后才能判斷。”二級市場分析師張翔表示,“AI推理芯片主要看的是固定成本下的Token吞吐率,即在一段時間內產生的Token數量與總成本的比例,在這個方面,英偉達具備很大的優勢,其迭代能力太強了。”
從Blackwell到新一代Rubin,英偉達的迭代速度在不斷加快。
Rubin CPX以解耦推理設計支持百萬級Token處理,GDDR7內存讓成本大降,投資回報率達30-50倍,Vera Rubin NVL144平臺算力較前代提升3.3倍,單位Token成本進一步攤薄。
面對競爭,高通也在通過實際合作推進產品落地驗證,其宣布了與沙特AI公司HUMAIN的合作。
根據規劃,HUMAIN將從2026年起部署高通AI200、AI250機架解決方案,總規模達200兆瓦,同時雙方還將聯合開發尖端AI數據中心,落地云到邊緣混合AI推理服務。
“大規模訂單合作往往伴隨定制化開發邏輯。現階段模型網絡架構已趨于成熟,不會出現顛覆性變化,因此無需過度追求通用性很高的產品,通過定制化模式可以精準匹配客戶特定需求,實現深度性能優化。”國產芯片廠商從業者李沐表示,“而高通在成本管理及端側NPU領域積累的經驗,也能為這種模式提供支撐,理論上具備一定可行空間。”
聚焦AI推理賽道,則是當前高通面對英偉達的最優選。
據QYResearch調研顯示,2024年全球推理AI芯片市場規模大約為142.1億美元,預計2031年將達到690.1億美元,2025-2031期間,年復合增長率為25.7%。
AI推理包含Prefill(預填充)和Decode(解碼)兩個階段,和模型訓練相比,它對硬件的要求存在明顯差異,推理更看重顯存帶寬的穩定性、適配性以及充足的顯存容量,同時無需訓練所需的極致浮點算力,轉而追求高效能效比與低延遲。
在集群建設方面,存力的重要性也日益凸顯。
“算力集群的計算過程是將數據從存儲搬運到計算單元,計算完成之后,計算的中間結果以及最終結果會返存回存力集群,在這個過程中,存力是不是能以更大的帶寬、更低的時延將數據搬移到算力集群中進行計算,將影響整個計算單元的算力利用率。”存儲芯片專家陳峰表示。
此外,由于計算集群會不定時發生故障,此時需要將中間的參數以及計算結果定期保存回存力集群,這個檢查點的保存時間耗時越短,那整個計算過程被中斷的時間便越少,同樣可以進一步提升計算的效率,且保證計算的可靠性。
高通此次推出AI推理芯片的重要亮點便是更高的內存容量,Qualcomm AI200支持每卡768 GB LPDDR,而Qualcomm AI250則將首次采用基于近內存計算的創新內存架構,通過提供超過10倍的有效內存帶寬和更低的功耗,實現AI推理工作負載效能的提升。
“現在推理Token用量每個月都在大幅上漲,高通的推理卡顯存非常大,單卡可以支持768GB,相當于單卡可以跑完整的DeepSeek,是當前所有卡中顯存最大的,方便私有化部署。”陳沖表示。

除了硬件上的顯存容量與內存架構創新,高通在軟件生態建設上也同步發力,為產品落地鋪路。
其AI軟件棧覆蓋從應用層到系統層的端到端鏈路,并針對AI推理場景做了優化,支持領先的機器學習框架、推理引擎、生成式AI框架及LLM/LMM推理優化技術。開發者可以通過相關套件,實現模型導入與Hugging Face模型一鍵部署。
“英偉達在云端芯片市場一家獨大,但憑借差異化的硬件設計以及豐富的軟件棧,高通的入局具有合理性,后續將其網絡芯片集成進去,能打造出具有性能優勢的產品。”大廠數據中心專家江杰表示。
作者長期追蹤芯片行業相關動態,歡迎添加微信 YONGGANLL6662 互通有無。
注:文中陳沖、張翔、李沐、陳峰、江杰均為化名。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。