Update LLM generation docs to use chat template (#973)

* fix docs * add template to model cards as well * revert * version
2025-08-09 18:36:38 +08:00 · 2024-09-07 06:06:15 -07:00 · 2024-09-07 06:06:15 -07:00 · c3e3411756
commit c3e3411756
parent 324184d670
3 changed files with 24 additions and 3 deletions
--- a/llms/README.md
+++ b/llms/README.md
@ -29,7 +29,14 @@ from mlx_lm import load, generate
 model, tokenizer = load("mlx-community/Mistral-7B-Instruct-v0.3-4bit")
-response = generate(model, tokenizer, prompt="hello", verbose=True)
+prompt = "Write a story about Einstein"
 messages = [{"role": "user", "content": prompt}]
 prompt = tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
 )
 response = generate(model, tokenizer, prompt=prompt, verbose=True)
 ```
 To see a description of all the arguments you can do:
@ -79,6 +86,11 @@ model, tokenizer = load(repo)
 prompt = "Write a story about Einstein"
 messages = [{"role": "user", "content": prompt}]
 prompt = tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
 )
 for t in stream_generate(model, tokenizer, prompt, max_tokens=512):
    print(t, end="", flush=True)
 print()
--- a/llms/mlx_lm/_version.py
+++ b/llms/mlx_lm/_version.py
@ -1,3 +1,3 @@
 # Copyright © 2023-2024 Apple Inc.
-__version__ = "0.18.1"
+__version__ = "0.18.2"
--- a/llms/mlx_lm/utils.py
+++ b/llms/mlx_lm/utils.py
@ -577,7 +577,16 @@ def upload_to_hub(path: str, upload_repo: str, hf_path: str):
        from mlx_lm import load, generate
        model, tokenizer = load("{upload_repo}")
-        response = generate(model, tokenizer, prompt="hello", verbose=True)
+
        prompt="hello"
        if hasattr(tokenizer, "apply_chat_template") and tokenizer.chat_template is not None:
            messages = [{"role": "user", "content": prompt}]
            prompt = tokenizer.apply_chat_template(
                messages, tokenize=False, add_generation_prompt=True
            )
        response = generate(model, tokenizer, prompt=prompt, verbose=True)
        ```
        """
    )
`@ -1,3 +1,3 @@`
	`# Copyright © 2023-2024 Apple Inc.`	`# Copyright © 2023-2024 Apple Inc.`

	`__version__ = "0.18.1"`	`__version__ = "0.18.2"`