洞見AIoT 2.0時代密碼,瑞芯微端側AI大模型與具身智能方案亮相2025云棲大會
2025-10-21
9月24日至26日,以“云智一體·碳硅共生”為主題的2025云棲大會在杭州隆重召開。本次大會全面呈現了從基礎設施、大模型到Agent與具身智能的AI技術演進與產業落地路徑。瑞芯微電子股份有限公司(以下簡稱“瑞芯微”)攜多款創新芯片與端側AI解決方案深度參與,重點展示了首顆端側大算力協處理器RK182X、新一代4K視覺處理器RV1126B,以及具身智能機器人核心方案,成為展會中備受關注的硬科技焦點。
RK182X是瑞芯微在第九屆開發者大會首度發布的協處理器芯片,具備高算力、高帶寬等特性,專為端側大模型應用設計。該芯片采用專為AI設計的NPU架構,支持通過PCIe高速接口與主SoC協同工作,并內置高帶寬DRAM,可顯著提升大模型在終端設備上的本地推理效率。用戶還可根據實際算力需求靈活疊加多個RK182X,極大增強了端側AI部署的適應性與擴展性。
瑞芯微和阿里云深度合作,在RK1828、RV1126B平臺上完成通義千問0.6B~7B的大模型端側部署,可實現離線狀態下即時且精準的多輪人機對話問答以及視頻分析。未來,雙方將攜手打造面向應用開發者和終端設備廠商的生成式AI軟硬件生態,基于瑞芯微平臺適配更多參數版本的通義大模型,共同探索面向大眾的AI智能體(AI Agent)服務場景新機遇。
瑞芯微產品總監Kever Yang在本次云棲大會的主題演講中表示,端側大模型正引領 AIoT2.0 變革。當前模型呈 “同等尺寸下性能躍升化” 發展,端側硬件算力與帶寬同步提升。瑞芯微未來堅持“主控 + 協處理器” 芯片路線,以RK182X系列為代表的算力協處理器芯片以 3D 堆疊 DRAM 突破帶寬瓶頸,實現百GB級帶寬,覆蓋多模態任務。在端云結合的方案下,賦能安防、教育、辦公、機器人等場景,實現低延時、高隱私的AI應用,全面提升智能設備體驗。
在性能層面,RK1828(RK182X系列中的旗艦型號)表現尤為突出。在運行Qwen 2.5-7B大模型時,首幀延遲控制在160毫秒左右,每秒可生成50+個Token(TPS),性能處于行業領先水平。現場還展示了基于RK1828 端側運行通義千問3B VLM,每秒生成Tokens達80+ TPS,可以實時、準確的分析攝像頭畫面內容。RK3576+RK1820同聲傳譯系統及虛擬數字人方案,全面體現其在高并發、復雜場景下的可靠算力支撐。

同時亮相的新一代4K視覺處理器RV1126B,集成3TOPS強勁算力,可流暢運行2B參數規模以內的大語言與多模態模型。在現場展示了基于RV1126B的端云協同方案,即端側運行通義千問端側0.6B的ViT視覺大模型,云端LLM,可以實現本地脫敏上傳,隱私合規,成本較云端可以降低一半以上。該芯片搭載定制AI-ISP架構,支持動態拼接、數字防抖、超級編碼、AI Remosaic、AOV3.0低功耗等先進處理技術,并強化了硬件安全機制,適用于智能安防攝像頭、復雜機器視覺系統、智能車載設備、機器人等高要求場景。

展會中特別演示的紅外熱成像(IRFPA)方案,最大支持 16bit 數據輸入,支持包括OCC(探測器像素偏置校正)、自動NUC(非均勻性校正)、去橫豎條紋、3D及2D降噪、動態范圍壓縮等在內的多個功能,廣泛應用于安防監控、工業檢測、醫療診斷、消費電子等領域,進一步拓展了其在多元環境下的應用潛力。

具身智能作為下一代新質生產力的關鍵載體,正深刻重塑制造與服務領域的效率范式。瑞芯微展出了具身智能機器人/機器狗的RK MotionCore核心方案,該方案依托RK3588芯片強大的Hybrid計算架構,充分發揮CPU、GPU和NPU的協同算力,實現高幀率強化學習控制策略部署,可完成多種高難度動態動作的實時生成與執行,展現了端側智能向運動決策和環境交互延伸的技術突破。

云棲大會不僅是技術創新的展示平臺,更是產業與生態共創的橋梁。瑞芯微通過此次展會,全面呈現了在端側AI、具身智能與新質生產力融合中的深度布局與技術積累。在AIoT 2.0時代,端側算力正成為推動智能普及的關鍵基石,而具身智能則昭示著人機共融、虛實聯動的未來方向。瑞芯微將持續聚焦底層硬件創新與開放生態建設,與行業伙伴共同推進端側大模型與智能體技術的規模化落地,賦能百業數字化轉型,助力新質生產力真正扎根于場景、服務于未來。

歡迎聯系瑞芯微業務團隊
獲取更多詳細資料
聯系方式:
400-7700-590
service@rock-chips.com

閩公網安備 35010202001061號