mlx-examples

mirror of https://github.com/ml-explore/mlx-examples.git synced 2025-07-29 18:11:13 +08:00

History

L fc93c55723 feat(mlx_lm): Nemotron (#949 ) * feat: Nemotron https://huggingface.co/nvidia/Minitron-4B-Base This is basically Llama with partial RoPE and LayerNorm instead of BatchNorm. Also they add 1 to the LayerNorm weight for some reason. * fixup! feat: Nemotron * nits --------- Co-authored-by: Awni Hannun <awni@apple.com>		2024-08-29 21:08:57 -07:00
..
__init__.py	Mlx llm package (#301 )	2024-01-12 10:25:56 -08:00
base.py	Add the ability to load the KV cache from a file (#956 )	2024-08-28 22:11:45 -07:00
cohere.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
dbrx.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
deepseek_v2.py	Use fast rope (#945 )	2024-08-23 13:18:51 -07:00
deepseek.py	feat: DeepSeek MoE v1 (#942 )	2024-08-17 07:18:09 -07:00
gemma2.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
gemma.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
gpt2.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
gpt_bigcode.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
gpt_neox.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
internlm2.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
llama.py	Use fast rope (#945 )	2024-08-23 13:18:51 -07:00
minicpm.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
mixtral.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
nemotron.py	feat(mlx_lm): Nemotron (#949 )	2024-08-29 21:08:57 -07:00
olmo.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
openelm.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
phi3.py	Use fast rope (#945 )	2024-08-23 13:18:51 -07:00
phi3small.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
phi.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
phimoe.py	Add Phi-3.5-MoE (#946 )	2024-08-24 06:52:33 -07:00
phixtral.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
plamo.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
qwen2_moe.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
qwen2.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
qwen.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
recurrent_gemma.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
stablelm.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
starcoder2.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00
su_rope.py	Add Phi-3.5-MoE (#946 )	2024-08-24 06:52:33 -07:00
switch_layers.py	Handle longer prompt/generation (#931 )	2024-08-16 15:28:39 -07:00