Spaces:

NewBreaker
/

chatglm-6b-int4

Runtime error

NewBreaker commited on Apr 25, 2023

Commit

3126b53

•

2 Parent(s): 1b76687 d498a70

Merge branch 'main' of https://huggingface.co/spaces/NewBreaker/chatglm-6b-int4

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,8 +1,8 @@
 from transformers import AutoTokenizer, AutoModel
 import gradio as gr
-tokenizer = AutoTokenizer.from_pretrained(".\\models\\chatglm-6b-int4", trust_remote_code=True, revision="")
-model = AutoModel.from_pretrained(".\\models\\chatglm-6b-int4", trust_remote_code=True, revision="").half().cuda().cpu()
 # from transformers import AutoTokenizer, AutoModel
@@ -12,9 +12,9 @@ model = AutoModel.from_pretrained(".\\models\\chatglm-6b-int4", trust_remote_cod
 # kernel_file = "./models/chatglm-6b-int4/quantization_kernels.so"
-# tokenizer = AutoTokenizer.from_pretrained("./models/chatglm-6b-int4", trust_remote_code=True, revision="")
 # model = AutoModel.from_pretrained("./models/chatglm-6b-int4", trust_remote_code=True, revision="").half().cuda()
-# model = AutoModel.from_pretrained("./models/chatglm-6b-int4", trust_remote_code=True, revision="").half()

 from transformers import AutoTokenizer, AutoModel
 import gradio as gr
+# tokenizer = AutoTokenizer.from_pretrained(".\\models\\chatglm-6b-int4", trust_remote_code=True, revision="")
+# model = AutoModel.from_pretrained(".\\models\\chatglm-6b-int4", trust_remote_code=True, revision="").half().cuda().cpu()
 # from transformers import AutoTokenizer, AutoModel
 # kernel_file = "./models/chatglm-6b-int4/quantization_kernels.so"
+tokenizer = AutoTokenizer.from_pretrained("./models/chatglm-6b-int4", trust_remote_code=True, revision="")
 # model = AutoModel.from_pretrained("./models/chatglm-6b-int4", trust_remote_code=True, revision="").half().cuda()
+model = AutoModel.from_pretrained("./models/chatglm-6b-int4", trust_remote_code=True, revision="").float()