zai-org
/

chatglm-6b

Model card Files Files and versions

accelerate tokenizer

#98

by lugim - opened Sep 13, 2023

base: refs/heads/main

←

from: refs/pr/98

Discussion Files changed

Files changed (1) hide show

tokenization_chatglm.py +3 -0

tokenization_chatglm.py CHANGED Viewed

@@ -439,5 +439,8 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
                 encoded_inputs["position_ids"] = np.pad(encoded_inputs["position_ids"],
                                                         pad_width=[(0, 0), (difference, 0)])
             encoded_inputs[self.model_input_names[0]] = [self.pad_token_id] * difference + required_input
         return encoded_inputs

                 encoded_inputs["position_ids"] = np.pad(encoded_inputs["position_ids"],
                                                         pad_width=[(0, 0), (difference, 0)])
             encoded_inputs[self.model_input_names[0]] = [self.pad_token_id] * difference + required_input
+        encoded_inputs["attention_mask"] = encoded_inputs["attention_mask"].tolist()
+        encoded_inputs["position_ids"] = encoded_inputs["position_ids"].tolist()
         return encoded_inputs