mikasenghaas
/

GLM-4-32B-Base-0414-Qwen-Chat-Template

Text Generation

Model card Files Files and versions

mikasenghaas commited on Sep 1

Commit

16ed168

·

unverified ·

1 Parent(s): e9aca51

Add test tokenization script

Files changed (1) hide show

test_tokenization.py +26 -0

test_tokenization.py ADDED Viewed

	@@ -0,0 +1,26 @@

+# /// script
+# requires-python = ">=3.12"
+# dependencies = ["transformers", "jinja2"]
+# ///
+from transformers import AutoTokenizer
+# Initialize tokenizer
+local_tokenizer = AutoTokenizer.from_pretrained(".")
+qwen3_tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-Coder-30B-A3B-Instruct")
+# User message with custom system message
+messages = [
+    {"role": "system", "content": "You are a helpful assistant."},
+    {"role": "user", "content": "What is the capital of France?"},
+]
+print("Local")
+print(local_tokenizer.apply_chat_template(messages, tokenize=False))
+print(local_tokenizer.apply_chat_template(messages, tokenize=True))
+print("\n\nQwen3-Coder")
+print(qwen3_tokenizer.apply_chat_template(messages, tokenize=False))
+print(qwen3_tokenizer.apply_chat_template(messages, tokenize=True))