From 22872947238a20c7422f1ab7610ab39b2b3e7500 Mon Sep 17 00:00:00 2001
From: someone <1571831+someoneAlready@users.noreply.github.com>
Date: Tue, 16 Jan 2024 23:13:33 +0800
Subject: [PATCH] fix mlx_lm generator for chinese (#321)

* fix generator for chinese

* add REPLACEMENT_CHAR

---------

Co-authored-by: cg <cg@qq.com>
---
 llms/mlx_lm/utils.py | 9 ++++++---
 1 file changed, 6 insertions(+), 3 deletions(-)

diff --git a/llms/mlx_lm/utils.py b/llms/mlx_lm/utils.py
index 9e0e51ea..f134bb70 100644
--- a/llms/mlx_lm/utils.py
+++ b/llms/mlx_lm/utils.py
@@ -122,6 +122,8 @@ def generate(
 
     tokens = []
     skip = 0
+    REPLACEMENT_CHAR = '\ufffd'
+
     for token, _ in zip(generate_step(prompt, model, temp), range(max_tokens)):
         if token == tokenizer.eos_token_id:
             break
@@ -130,10 +132,11 @@ def generate(
 
         if verbose:
             s = tokenizer.decode(tokens)
-            print(s[skip:], end="", flush=True)
-            skip = len(s)
+            if REPLACEMENT_CHAR not in s:
+                print(s[skip:], end="", flush=True)
+                skip = len(s)
 
-    tokens = tokenizer.decode(tokens)
+    tokens = tokenizer.decode(tokens).replace(REPLACEMENT_CHAR, '')
     if verbose:
         print(tokens[skip:], flush=True)
     return tokens