Fix mypy errors with models/{qwen2,qwen2_moe,startcoder2}.py (#835)

* Fix starcoder.py * Fix qwen2 * Remvoe unnecessary assert not None
2025-12-15 17:58:54 +08:00 · 2024-06-14 09:44:50 -07:00
parent d8b073e3a7
commit a7598e9456
3 changed files with 13 additions and 11 deletions
--- a/llms/mlx_lm/models/starcoder2.py
+++ b/llms/mlx_lm/models/starcoder2.py
@@ -4,7 +4,7 @@ from typing import Optional, Tuple
 import mlx.core as mx
 import mlx.nn as nn

-from .base import BaseModelArgs
+from .base import BaseModelArgs, KVCache


@dataclass
@@ -43,7 +43,7 @@ class Attention(nn.Module):
        self,
        x: mx.array,
        mask: Optional[mx.array] = None,
-        cache: Optional[Tuple[mx.array, mx.array]] = None,
+        cache: Optional[KVCache] = None,
    ) -> mx.array:
        B, L, D = x.shape

@@ -98,7 +98,7 @@ class TransformerBlock(nn.Module):
        self,
        x: mx.array,
        mask: Optional[mx.array] = None,
-        cache: Optional[Tuple[mx.array, mx.array]] = None,
+        cache: Optional[KVCache] = None,
    ) -> mx.array:
        r = self.self_attn(self.input_layernorm(x), mask, cache)
        h = x + r