Hub: Update quantization configuration fields

2025-09-02 05:04:37 +08:00 · 2024-08-27 15:04:19 +08:00
parent bf21789b17
commit 8cdc91a92e
1 changed files with 1 additions and 1 deletions
--- a/llms/mlx_lm/utils.py
+++ b/llms/mlx_lm/utils.py
@@ -646,7 +646,7 @@ def quantize_model(
    """
    quantized_config = copy.deepcopy(config)
    nn.quantize(model, q_group_size, q_bits)
-    quantized_config["quantization"] = {"group_size": q_group_size, "bits": q_bits}
+    quantized_config["quantization_config"] = {"group_size": q_group_size, "bits": q_bits}
    quantized_weights = dict(tree_flatten(model.parameters()))

    return quantized_weights, quantized_config