执行demo,推理时间超过10分钟,请问正常吗
8 个 3090
我们内部测试半精度下,3张3090用huggingface原生的model.generate方法就可以比较快的生成了
· Sign up or log in to comment