新闻详情

一块SSD,让大模型在迷你主机上“跑起来”

发表时间:2026-04-29 16:16

当一台普通笔记本电脑就能流畅运行 120B 参数大模型并处理 64K 超长上下文,当中小企业无需购置昂贵服务器就能实现本地 AI 部署,人工智能普惠化进程正在显著加速。4月27日,在深圳福田会展中心开幕的2026 年广东省首届人工智能应用对接大会上,国家专精特新 "小巨人" 企业铨兴科技展出了新一代 AI 超显存融合解决方案,以 "一卡两用" 的创新设计,为迷你主机、笔记本等显存受限设备实现超大模型部署,提供了一条更具性价比的技术路径。



本次大会是由广东省发展改革委、深圳市人民政府联合主办的首届全省性 AI 应用盛会,标志着广东 AI 发展正式从技术突围迈向全域赋能的新阶段。广东省委副书记、省长孟凡利出席大会并致辞,近 200 家国内外顶尖 AI 企业参展,铨兴科技受邀参展,吸引了众多政府领导、行业专家前来参观交流。



“一卡两用”:让SSD化身GPU的“外部内存池”


大模型推理时,海量的KV Cache会迅速占满有限的板载显存,导致设备无法运行大参数、长上下文的模型,或并发能力骤降。传统解法是堆叠更高带宽的HBM显存,成本呈指数级上升,直接将端侧设备排除在外。



铨兴科技另辟蹊径,方案核心的“添翼AI SSD”并非一普通的固态硬盘,其通过系统级软硬件协同设计,实现了一卡两用:在作为高速可靠的数据存储介质的同时,化身为GPU的高效外部内存池。借助TB级高容量与领先的高耐久特性,这张SSD可以承接那些访问频率相对较低但数据量庞大的KV Cache与长上下文数据,将宝贵的板载显存释放给更关键的即时计算。


就如同给一台内存紧张的电脑插上了一根超大容量的“外置记忆条”,这种方式巧妙地将推理瓶颈从单一算力问题,转化为“算力+内存层级+调度协同”的系统问题。


算法+硬件双轮驱动:让数据在显存与SSD间“智慧流动”


当然,要让“外置显存”不拖慢推理速度,需要极高的调度智慧,铨兴AI 超显存融合解决方案搭载PCIe 5.0企业级“添翼AI SSD”的同时,自主研发 “添翼AI Link Plus”算法平台,构成了方案的决策大脑。同时配备“QXClaw”智能体软件,为希望将大模型能力部署到分支机构、零售终端、研发边缘设备上的企业客户,以及追求高性价比实验环境的AI开发者与个人用户实现开箱即用的便捷部署。



方案实现实时监测显存压力与任务特征,动态地将部分KV Cache下沉至SSD侧,并在需要时通过预取、复用与异步调度机制无缝调回,相较于完全依赖高带宽显存的传统方案,有效缓解显存压力,实现推理成本下降90%,推理并发性能提升50%,为AI Agent部署及边缘侧智能应用提供了一条兼顾性能与经济性的技术路径。


生态协同:携手共建广东 AI 产业新高地


作为扎根深圳、服务全国的本土科技企业,铨兴科技始终致力于通过技术创新推动 AI 产业的发展。本次在广东省首届人工智能应用对接大会上发布新一代 AI 超显存融合解决方案,正是公司响应广东省 "智联千行、赋能百业" 号召的重要举措。


当前,广东正加速建设能源、医疗、消费等领域的国家级人工智能应用中试基地。铨兴科技将继续扎根大湾区,协同上下游伙伴,推动AI技术在各场景快速落地,实现本地大模型“随处可见、随时可用、人人用得起”,为人工智能产业的高质量发展贡献存力智慧。


分享到: