[CUDA] Bundle CCCL for JIT compilation (#2357)

* Ship CCCL for JIT compilation * Remove cexpf
2025-12-16 01:49:05 +08:00 · 2025-07-12 10:45:37 +09:00
parent 42cc9cfbc7
commit 6325f60d52
9 changed files with 48 additions and 176 deletions
--- a/mlx/backend/cuda/device/atomic_ops.cuh
+++ b/mlx/backend/cuda/device/atomic_ops.cuh
@@ -58,12 +58,7 @@ inline __device__ void atomic_add(cuComplex* out, cuComplex val) {

 inline __device__ void atomic_add(__nv_bfloat16* out, __nv_bfloat16 val) {
 #if __CUDA_ARCH__ < 800
-#if CCCL_VERSION >= 2008000
  atomic_add_general(out, val);
-#else
-  bool cccl_version_too_old_for_bfloat16_atomic_add = false;
-  assert(cccl_version_too_old_for_bfloat16_atomic_add);
-#endif
 #else
  atomicAdd(out, val);
 #endif