芯原可扩展高性能GPGPU-AI计算IP赋能汽车与边缘服务器

中国人物访谈网

admin

2025-06-11 17:49

提供高算力密度的AI加速能力、多芯片扩展支持及3D堆叠内存集成能力

芯原股份（芯原，股票代码：688521.SH）今日宣布其高性能、可扩展的GPGPU-AI计算IP的最新进展，这些IP现已为新一代汽车电子和边缘服务器应用提供强劲赋能。通过将可编程并行计算能力与人工智能（AI）加速器相融合，这些IP在热和功耗受限的环境下，能够高效支持大语言模型（LLM）推理、多模态感知以及实时决策等复杂的AI工作负载。

芯原的GPGPU-AI计算IP基于高性能通用图形处理器（GPGPU）架构，并集成专用AI加速器，可为AI应用提供卓越的计算能力。其可编程AI加速器与稀疏感知计算引擎通过先进的调度技术，可加速Transformer等矩阵密集型模型的运行。此外，这些IP支持用于混合精度计算的多种数据格式，包括INT4/8、FP4/8、BF16、FP16/32/64和TF32，并支持多种高带宽接口，包括3D堆叠内存、LPDDR5X、HBM、PCIe Gen5/Gen6和CXL。该IP还支持多芯片、多卡扩展部署，具备系统级可扩展性，满足大规模AI应用的部署需求。

芯原的GPGPU-AI计算IP原生支持PyTorch、TensorFlow、ONNX和TVM等主流AI框架，覆盖训练与推理流程。此外，它还支持与主流的GPGPU编程语言兼容的通用计算语言（GPCL），以及主流的编译器。这些能力高度契合当前大语言模型在算力和可扩展性方面的需求，包括DeepSeek等代表性模型。

“边缘服务器在推理与增量训练等场景下对AI算力的需求正呈指数级增长。这一趋势不仅要求极高的计算效率，也对架构的可编程性提出了更高要求。芯原的GPGPU-AI计算处理器在架构设计上实现了GPGPU通用计算与AI加速器的深度融合，可在极细粒度层面实现高效协同，相关优势已在多个高性能AI计算系统中得到验证。”芯原首席战略官、执行副总裁、IP事业部总经理戴伟进表示，“近期DeepSeek的技术突破进一步凸显出提升AI计算效率以应对日益复杂工作负载的重要性。我们最新一代GPGPU-AI计算IP已全面优化，可高效支持专家混合（MoE）模型，并提升了核间通信效率。同时，通过与多家领先AI计算客户的深度合作，我们已对处理器架构进行了优化，以充分利用3D堆叠存储技术所提供的充足带宽。芯原将持续携手生态合作伙伴，加速推动这些先进技术在实际应用中的规模化落地。”

关于芯原

芯原微电子（上海）股份有限公司（芯原股份，688521.SH）是一家依托自主半导体IP，为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业。