|
研发团队 |
清华大学 |
|
技术领域 |
人工智能 |
|
项目简介 |
融合算法压缩(混合位宽量化)、软件加速(异步并行注意力计算)及硬件加速(FPGA异构架构),在A100 GPU推理速度提升37%,U280 FPGA能效较V100S提高6倍。 |
|
研发团队 |
清华大学 |
|
技术领域 |
人工智能 |
|
项目简介 |
融合算法压缩(混合位宽量化)、软件加速(异步并行注意力计算)及硬件加速(FPGA异构架构),在A100 GPU推理速度提升37%,U280 FPGA能效较V100S提高6倍。 |