more clean ups

2025-12-16 02:08:55 +08:00 · 2025-03-04 22:44:24 +01:00
parent d828bc0c2d
commit 230abad426
1 changed files with 5 additions and 9 deletions
--- a/llms/mlx_lm/models/olmoe.py
+++ b/llms/mlx_lm/models/olmoe.py
@@ -48,15 +48,11 @@ class Attention(nn.Module):
        self.head_dim = head_dim = args.head_dim or args.hidden_size // n_heads
        self.scale = head_dim**-0.5
-        if hasattr(args, "attention_bias"):
+        
-            attention_bias = args.attention_bias
+        self.q_proj = nn.Linear(dim, n_heads * head_dim, bias=args.attention_bias)
-        else:
+        self.k_proj = nn.Linear(dim, n_kv_heads * head_dim, bias=args.attention_bias)
-            attention_bias = False
+        self.v_proj = nn.Linear(dim, n_kv_heads * head_dim, bias=args.attention_bias)
-
+        self.o_proj = nn.Linear(n_heads * head_dim, dim, bias=args.attention_bias)
        self.q_proj = nn.Linear(dim, n_heads * head_dim, bias=attention_bias)
        self.k_proj = nn.Linear(dim, n_kv_heads * head_dim, bias=attention_bias)
        self.v_proj = nn.Linear(dim, n_kv_heads * head_dim, bias=attention_bias)
        self.o_proj = nn.Linear(n_heads * head_dim, dim, bias=attention_bias)
        self.rope = initialize_rope(
            self.head_dim,