清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,成功开源大模型推理引擎“赤兔Chitu”。这一突破性技术首次实现了在非英伟达Hopper架构GPU及多种国产芯片上原生运行FP8精度模型,有效解决了FP8精度模型对NVIDIA Hopper架构(如H100/H200)的硬件依赖问题,为国内AI芯片广泛应用和生态建设提供了全新机遇。硬件依赖破局,推理效率大幅提升“赤兔Chitu...