英特爾、SambaNova與鴻海正聯手打造生產就緒的機架設備,將AI推理任務分拆至三種晶片架構上執行。
英特爾、SambaNova與鴻海正聯手打造生產就緒的機架設備,將AI推理任務分拆至三種晶片架構上執行。

英特爾、SambaNova與鴻海正聯手打造生產就緒的機架設備,將AI推理任務分拆至三種晶片架構上執行。
英特爾週一在台北Computex 2026上展示了一套分離式推理系統,該系統將AI推理中的預填充與解碼階段分別交由不同處理器執行。這套系統基於英特爾的Vector Core Compute資料中心平台,由Xeon 6處理器進行編排,採用SambaNova的SN40 RDU進行解碼,並使用Nvidia的Blackwell GPU進行預填充。全球最大電子製造商鴻海提供系統整合支援,並在展會上展示了生產就緒的機架設備。
「此架構讓客戶能夠獨立優化推理的各個階段,而不是迫使所有任務都透過單一GPU管道處理,」一位英特爾代表在會場表示。該方案針對當前AI部署中的一個結構性低效問題:預填充——即處理用戶提示的運算密集型初始階段——與解碼——即逐標記生成回應的過程——具有截然不同的硬體需求,單一種類的晶片無法同時高效滿足。
這種分離式模型解決了企業在實際運行大型語言模型時日益嚴重的痛點。預填充需要高記憶體頻寬與矩陣運算能力,這正是Nvidia H100與Blackwell GPU的強項。相對而言,解碼對延遲更為敏感,且能受益於SambaNova RDU(可重構數據流單元)的專用數據流架構。透過拆分工作負載,英特爾的Xeon 6充當編排者,將每個階段路由至最佳的處理器。
英特爾還發表了其Xeon 6+處理器產品線,以及用於分離式推理的代理雲端服務,進一步擴展其在AI資料中心市場的布局。目前Nvidia在AI訓練與推理晶片營收中佔據約八成市佔率。英特爾與SambaNova(這家新創公司在2024年融資後估值超過50億美元)以及鴻海的合作,為其提供了能夠交付完整機架設備——而非僅僅是晶片——的製造與整合夥伴。
此時機點極具策略性。Nvidia在週一自己的Computex主題演講中發表了RTX Spark超級晶片——其首款消費級PC處理器,並確認其Vera Rubin資料中心平台已進入全面量產。Nvidia最近一季的資料中心營收達到356億美元,遠超英特爾資料中心與AI業務的41億美元。然而,英特爾押注異構推理——在單一工作負載中使用多種晶片類型——為那些希望避免被Nvidia CUDA生態系全面綁死的企業提供了一個差異化價值主張。
對投資人而言,問題在於英特爾能否將此架構轉化為營收。英特爾最近一季的資料中心與AI營收年減8%,且該公司在AI運算領域持續流失市佔給Nvidia與AMD。與鴻海的合作為量產提供了路徑:這家代工廠具備大規模整合、測試與出貨完整機架的能力,有助於加速企業採用。英特爾股價今年迄今累計上漲約200%,反映市場對其轉型前景的樂觀情緒,但該公司目前的估值仍低於Nvidia 35倍的本益比。
本文僅供資訊參考,不構成投資建議。