Fix no template prompt + top_k sampling (#1166)

* fix no template prompt * add top_k sampling * fix chinese
2025-12-15 01:42:31 +08:00 · 2024-12-18 18:46:50 -08:00
parent 845efddc8c
commit db109184b7
3 changed files with 58 additions and 11 deletions
--- a/llms/mlx_lm/generate.py
+++ b/llms/mlx_lm/generate.py
@@ -1,7 +1,6 @@
 # Copyright © 2023-2024 Apple Inc.

 import argparse
-import codecs
 import json
 import sys

@@ -189,8 +188,8 @@ def main():
    elif using_cache:
        tokenizer.chat_template = metadata["chat_template"]

-    prompt = codecs.decode(args.prompt, "unicode_escape")
-
+    prompt = args.prompt.replace("\\n", "\n").replace("\\t", "\t")
+    prompt = sys.stdin.read() if prompt == "-" else prompt
    if not args.ignore_chat_template and (
        hasattr(tokenizer, "apply_chat_template")
        and tokenizer.chat_template is not None
@@ -199,12 +198,7 @@ def main():
            messages = [{"role": "system", "content": args.system_prompt}]
        else:
            messages = []
-        messages.append(
-            {
-                "role": "user",
-                "content": sys.stdin.read() if prompt == "-" else prompt,
-            }
-        )
+        messages.append({"role": "user", "content": prompt})
        prompt = tokenizer.apply_chat_template(
            messages, tokenize=False, add_generation_prompt=True
        )