面向大模型的软硬件协同算力优化技术

成果单位:
发布时间:2025/12/17
浏览量:1

研发团队

清华大学

技术领域

人工智能

项目简介

融合算法压缩(混合位宽量化)、软件加速(异步并行注意力计算)及硬件加速(FPGA异构架构),在A100 GPU推理速度提升37%,U280 FPGA能效较V100S提高6倍。