Switch to fast RMS/LN Norm (#603)

* use nn.RMSNorm, use sdpa, cleanup * bump mlx versions * minor update * use fast layer norm * version bump * update requirement for whisper * update requirement for gguf
2025-12-16 02:08:55 +08:00 · 2024-03-23 07:13:51 -07:00
parent fbed720d6f
commit b8a348c1b8
44 changed files with 144 additions and 1155 deletions
--- a/llms/llama/requirements.txt
+++ b/llms/llama/requirements.txt
@@ -1,4 +1,4 @@
-mlx>=0.0.6
+mlx>=0.8.0
 sentencepiece
 torch
 numpy