芯原股份(芯原,股票代码:688521.SH)今日宣布其高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲赋能。通过将可编程并行计算能力与人工智能(AI)加速器相融合,这些IP在热和功耗受限的环境下,能够高效支持大语言模型(LLM)推理、多模态感知以及实时决策等复杂的AI工作负载。
芯原的GPGPU-AI计算IP基于高性能通用图形处理器(GPGPU)架构,并集成专用AI加速器,可为AI应用提供卓越的计算能力。其可编程AI加速器与稀疏感知计算引擎通过先进的调度技术,可加速Transformer等矩阵密集型模型的运行。此外,这些IP支持用于混合精度计算的多种数据格式,包括INT4/8、FP4/8、BF16、FP16/32/64和TF32,并支持多种高带宽接口,包括3D堆叠内存、LPDDR5X、HBM、PCIe Gen5/Gen6和CXL。该IP还支持多芯片、多卡扩展部署,具备系统级可扩展性,满足大规模AI应用的部署需求。
芯原的GPGPU-AI计算IP原生支持PyTorch、TensorFlow、ONNX和TVM等主流AI框架,覆盖训练与推理流程。此外,它还支持与主流的GPGPU编程语言兼容的通用计算语言(GPCL),以及主流的编译器。这些能力高度契合当前大语言模型在算力和可扩展性方面的需求,包括DeepSeek等代表性模型。
“边缘服务器在推理与增量训练等场景下对AI算力的需求正呈指数级增长。这一趋势不仅要求极高的计算效率,也对架构的可编程性提出了更高要求。芯原的GPGPU-AI计算处理器在架构设计上实现了GPGPU通用计算与AI加速器的深度融合,可在极细粒度层面实现高效协同,相关优势已在多个高性能AI计算系统中得到验证。”芯原首席战略官、执行副总裁、IP事业部总经理戴伟进表示,“近期DeepSeek的技术突破进一步凸显出提升AI计算效率以应对日益复杂工作负载的重要性。我们最新一代GPGPU-AI计算IP已全面优化,可高效支持专家混合(MoE)模型,并提升了核间通信效率。同时,通过与多家领先AI计算客户的深度合作,我们已对处理器架构进行了优化,以充分利用3D堆叠存储技术所提供的充足带宽。芯原将持续携手生态合作伙伴,加速推动这些先进技术在实际应用中的规模化落地。”
关于芯原
芯原微电子(上海)股份有限公司(芯原股份,688521.SH)是一家依托自主半导体IP,为客户提供平台化、全方位、一站式芯片定制服务和半导体IP授权服务的企业。
书赞桉诺亮相2022年上海纸浆周,用实际行动践
北美首台搭载nLIGHT技术的AMCM M290-2 FLX
AGC推出不使用表面活性剂及含氟聚合溶剂的创新
三叶草生物制药启动武汉冠状病毒重组疫苗的研
知临集团首席执行官认购本公司股份
DEGIRO将欧洲在线经纪业务零售化
Snowplus在疫情期间仍实现全球业务增长
CNE Direct, Inc 商业名称“illumy
全球领导人齐聚一堂出席10.14日的2021年全球包容
博莱克威奇为使用点制氢提供指导,以推进车辆
Velodyne Lidar荣获2022年SXSW创新奖
铠侠推出PCIe(R) 4.0 SCM
壳牌新能源部署Beacon Platform以开发
智原科技将于ICCAD 2020展出最新IoT/MCU
衡水市公安机关全方位多元化宣传,打好“亮剑
袁匡任——2019年最受人民喜爱的艺术家
米尔肯研究院和莫特赛比基金会启动技术奖励计
中医秉承一脉传 顶礼尚师北京宴
遵义电力:当好产业发展的“先行军”
SSA Marine任命Nicolas Gauthie
FLIR Systems获得美国国防部4,810万美元合同
ROSEN鼓励D-MARKET股东聘请律师
水木未来宣布完成天使轮融资
QpiAI完成650万美元A轮前融资