nits

2025-08-11 19:56:42 +08:00 · 2025-02-13 21:46:30 +01:00 · 2025-02-13 21:46:30 +01:00 · 65a49dda0e
commit 65a49dda0e
parent 8179b99436
1 changed files with 3 additions and 2 deletions
--- a/llms/mlx_lm/tuner/datasets.py
+++ b/llms/mlx_lm/tuner/datasets.py
@ -34,6 +34,7 @@ class GRPODataset:
                The reasoning process and answer are enclosed within <think> </think> and <answer> </answer> tags, respectively, i.e., <think> reasoning process here </think><answer> answer here </answer>."""},
                    {'role': 'user', 'content': prompt_str}
                    ],
+                    add_generation_prompt=True
                )
                answer_tokens = tokenizer.encode(answer_str)
            else:
@ -307,10 +308,10 @@ def load_dataset(args, tokenizer: PreTrainedTokenizer):
    else:
        data_path = Path(args.data)
        if data_path.exists():
-            train, valid, test = load_local_dataset(args, data_path, tokenizer, args)
+            train, valid, test = load_local_dataset(args, data_path, tokenizer, args.config)
        else:
            print(f"Loading Hugging Face dataset {args.data}.")
-            train, valid, test = load_hf_dataset(args, args.data, tokenizer, args)
+            train, valid, test = load_hf_dataset(args, args.data, tokenizer, args.config)

    if args.train and len(train) == 0:
        raise ValueError(