fix bug

2023-05-02 19:13:13 +09:00 · 2023-05-02 19:13:13 +09:00 · 1388acac94
commit 1388acac94
parent 6c23e5b3a5
1 changed files with 1 additions and 1 deletions
--- a/auto_gptq/modeling/llama.py
+++ b/auto_gptq/modeling/llama.py
@ -109,7 +109,7 @@ class LlamaGPTQForCausalLM(BaseGPTQForCausalLM):
        )
        
        if fused_attn:
-            make_quant_attn(model, use_triton=use_triton, desc_act=quantize_config.desc_act)
+            make_quant_attn(model, use_triton=use_triton, group_size = quantize_config.group_size, desc_act=quantize_config.desc_act,)
        if use_triton and fused_mlp:
            make_fused_mlp(model)
        model_config = model.config.to_dict()