revert is sliding pattern

2025-12-16 02:08:55 +08:00 · 2025-03-12 09:48:14 +01:00
parent 645b666890
commit 2d30f6787a
1 changed files with 2 additions and 1 deletions
--- a/llms/mlx_lm/models/gemma3_text.py
+++ b/llms/mlx_lm/models/gemma3_text.py
@@ -60,7 +60,7 @@ class Attention(nn.Module):
        self.q_norm = RMSNorm(dims=head_dim, eps=args.rms_norm_eps)
        self.k_norm = RMSNorm(dims=head_dim, eps=args.rms_norm_eps)
-        self.is_sliding = (layer_idx + 1) % args.sliding_window_pattern == 0
+        self.is_sliding = (layer_idx + 1) % args.sliding_window_pattern != 0
        self.rope = nn.RoPE(
            head_dim,
@@ -102,6 +102,7 @@ class Attention(nn.Module):
            if mask.shape[-1] != key_len:
                mask = mask[..., :key_len]
        output = mx.fast.scaled_dot_product_attention(
            queries, keys, values, scale=self.scale, mask=mask
        )