fix mlx_lm generator for chinese (#321)

* fix generator for chinese * add REPLACEMENT_CHAR --------- Co-authored-by: cg <cg@qq.com>
2025-12-14 17:28:59 +08:00 · 2024-01-16 23:13:33 +08:00
parent b0870ed679
commit 2287294723
1 changed files with 6 additions and 3 deletions
--- a/llms/mlx_lm/utils.py
+++ b/llms/mlx_lm/utils.py
@@ -122,6 +122,8 @@ def generate(
    tokens = []
    skip = 0
    REPLACEMENT_CHAR = '\ufffd'
    for token, _ in zip(generate_step(prompt, model, temp), range(max_tokens)):
        if token == tokenizer.eos_token_id:
            break
@@ -130,10 +132,11 @@ def generate(
        if verbose:
            s = tokenizer.decode(tokens)
            if REPLACEMENT_CHAR not in s:
                print(s[skip:], end="", flush=True)
                skip = len(s)
-    tokens = tokenizer.decode(tokens)
+    tokens = tokenizer.decode(tokens).replace(REPLACEMENT_CHAR, '')
    if verbose:
        print(tokens[skip:], flush=True)
    return tokens