build/html/cpu_2unary_8h_source.html

// Copyright © 2023 Apple Inc.


#pragma once


#include "mlx/allocator.h"

#include "mlx/array.h"

#include "mlx/backend/common/utils.h"

#include "mlx/backend/cpu/encoder.h"

#include "mlx/backend/cpu/simd/simd.h"

#include "mlx/utils.h"


namespace mlx::core {


void set_unary_output_data(const array& in, array& out) {

  if (in.flags().contiguous) {

    if (is_donatable(in, out)) {

      out.copy_shared_buffer(in);

    } else {

      auto size = in.data_size();

      out.set_data(

          allocator::malloc_or_wait(size * out.itemsize()),

          size,

          in.strides(),

          in.flags());

    }

  } else {

    out.set_data(allocator::malloc_or_wait(out.nbytes()));

  }

}


template <typename T, typename U = T, typename Op>


void unary_op(const T* a, U* out, size_t shape, size_t stride) {

  for (size_t i = 0; i < shape; i += 1) {

    out[i] = Op{}(*a);

    a += stride;

  }

}


template <typename T, typename U = T, typename Op>


void unary_op(const array& a, array& out, Op) {

  const T* src = a.data<T>();

  U* dst = out.data<U>();

  auto ndim = a.ndim();

  if (a.flags().contiguous) {

    auto size = a.data_size();

    constexpr int N = simd::max_size<T>;

    while (size >= N) {

      simd::store(dst, Op{}(simd::load<T, N>(src)));

      size -= N;

      src += N;

      dst += N;

    }

    while (size > 0) {

      *dst = Op{}(*src);

      size--;

      dst++;

      src++;

    }

  } else {

    size_t shape = ndim > 0 ? a.shape().back() : 1;

    size_t stride = ndim > 0 ? a.strides().back() : 1;

    if (ndim <= 1) {

      unary_op<T, U, Op>(src, dst, shape, stride);

      return;

    }

    auto it = ContiguousIterator(a.shape(), a.strides(), ndim - 1);

    for (size_t elem = 0; elem < a.size(); elem += shape) {

      unary_op<T, U, Op>(src + it.loc, dst + elem, shape, stride);

      it.step();

    }

  }

}


template <typename Op>


void unary(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch([a = array::unsafe_weak_copy(a),

                    out = array::unsafe_weak_copy(out),

                    op = op]() mutable {

    switch (out.dtype()) {

      case bool_:

        unary_op<bool>(a, out, op);

        break;

      case uint8:

        unary_op<uint8_t>(a, out, op);

        break;

      case uint16:

        unary_op<uint16_t>(a, out, op);

        break;

      case uint32:

        unary_op<uint32_t>(a, out, op);

        break;

      case uint64:

        unary_op<uint64_t>(a, out, op);

        break;

      case int8:

        unary_op<int8_t>(a, out, op);

        break;

      case int16:

        unary_op<int16_t>(a, out, op);

        break;

      case int32:

        unary_op<int32_t>(a, out, op);

        break;

      case int64:

        unary_op<int64_t>(a, out, op);

        break;

      case float16:

        unary_op<float16_t>(a, out, op);

        break;

      case float32:

        unary_op<float>(a, out, op);

        break;

      case float64:

        unary_op<double>(a, out, op);

        break;

      case bfloat16:

        unary_op<bfloat16_t>(a, out, op);

        break;

      case complex64:

        unary_op<complex64_t>(a, out, op);

        break;

    }

  });

}


template <typename Op>


void unary_real_fp(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch([a = array::unsafe_weak_copy(a),

                    out = array::unsafe_weak_copy(out),

                    op = op]() mutable {

    switch (out.dtype()) {

      case bfloat16:

        unary_op<bfloat16_t>(a, out, op);

        break;

      case float16:

        unary_op<float16_t>(a, out, op);

        break;

      case float32:

        unary_op<float>(a, out, op);

        break;

      case float64:

        unary_op<double>(a, out, op);

        break;

      default:

        std::ostringstream err;

        err << "[unary_real] Does not support " << out.dtype();

        throw std::runtime_error(err.str());

    }

  });

}


template <typename Op>


void unary_fp(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch([a = array::unsafe_weak_copy(a),

                    out = array::unsafe_weak_copy(out),

                    op = op]() mutable {

    switch (out.dtype()) {

      case bfloat16:

        unary_op<bfloat16_t>(a, out, op);

        break;

      case float16:

        unary_op<float16_t>(a, out, op);

        break;

      case float32:

        unary_op<float>(a, out, op);

        break;

      case float64:

        unary_op<double>(a, out, op);

        break;

      case complex64:

        unary_op<complex64_t>(a, out, op);

        break;

      default:

        std::ostringstream err;

        err << "[unary_fp] Does not support " << out.dtype();

        throw std::runtime_error(err.str());

    }

  });

}


template <typename Op>


void unary_signed(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch([a = array::unsafe_weak_copy(a),

                    out = array::unsafe_weak_copy(out),

                    op = op]() mutable {

    switch (out.dtype()) {

      case int8:

        unary_op<int8_t>(a, out, op);

        break;

      case int16:

        unary_op<int16_t>(a, out, op);

        break;

      case int32:

        unary_op<int32_t>(a, out, op);

        break;

      case int64:

        unary_op<int64_t>(a, out, op);

        break;

      case float16:

        unary_op<float16_t>(a, out, op);

        break;

      case float32:

        unary_op<float>(a, out, op);

        break;

      case float64:

        unary_op<double>(a, out, op);

        break;

      case bfloat16:

        unary_op<bfloat16_t>(a, out, op);

        break;

      case complex64:

        unary_op<complex64_t>(a, out, op);

        break;

      default:

        throw std::runtime_error("[Abs] Called on unsigned type");

    }

  });

}


template <typename Op>


void unary_complex(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch([a = array::unsafe_weak_copy(a),

                    out = array::unsafe_weak_copy(out),

                    op = op]() mutable { unary_op<complex64_t>(a, out, op); });

}


template <typename Op>


void unary_complex_to_float(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch(

      [a = array::unsafe_weak_copy(a),

       out = array::unsafe_weak_copy(out),

       op = op]() mutable { unary_op<complex64_t, float>(a, out, op); });

}


template <typename Op>


void unary_int(const array& a, array& out, Op op, Stream stream) {

  set_unary_output_data(a, out);

  auto& encoder = cpu::get_command_encoder(stream);

  encoder.set_input_array(a);

  encoder.set_output_array(out);

  encoder.dispatch([a = array::unsafe_weak_copy(a),

                    out = array::unsafe_weak_copy(out),

                    op = op]() mutable {

    switch (out.dtype()) {

      case uint8:

        unary_op<uint8_t>(a, out, op);

        break;

      case uint16:

        unary_op<uint16_t>(a, out, op);

        break;

      case uint32:

        unary_op<uint32_t>(a, out, op);

        break;

      case uint64:

        unary_op<uint64_t>(a, out, op);

        break;

      case int8:

        unary_op<int8_t>(a, out, op);

        break;

      case int16:

        unary_op<int16_t>(a, out, op);

        break;

      case int32:

        unary_op<int32_t>(a, out, op);

        break;

      case int64:

        unary_op<int64_t>(a, out, op);

        break;

      default:

        std::ostringstream err;

        err << "[unary_int] Does not support " << out.dtype();

        throw std::runtime_error(err.str());

    }

  });

}


} // namespace mlx::core

allocator.h

array.h

utils.h

mlx::core::array
Definition array.h:24

mlx::core::array::flags
const Flags & flags() const
Get the Flags bit-field.
Definition array.h:313

mlx::core::array::shape
const Shape & shape() const
The shape of the array as a vector of integers.
Definition array.h:103

mlx::core::array::strides
const Strides & strides() const
The strides of the array.
Definition array.h:117

mlx::core::array::nbytes
size_t nbytes() const
The number of bytes in the array.
Definition array.h:93

mlx::core::array::ndim
size_t ndim() const
The number of dimensions of the array.
Definition array.h:98

mlx::core::array::size
size_t size() const
The number of elements in the array.
Definition array.h:88

mlx::core::array::data
T * data()
Definition array.h:349

mlx::core::array::unsafe_weak_copy
static array unsafe_weak_copy(const array &other)
Get a new array that refers to the same data as the input but with a non-owning pointer to it.

mlx::core::array::copy_shared_buffer
void copy_shared_buffer(const array &other, const Strides &strides, Flags flags, size_t data_size, size_t offset=0)

mlx::core::array::dtype
Dtype dtype() const
Get the arrays data type.
Definition array.h:131

mlx::core::array::itemsize
size_t itemsize() const
The size of the array's datatype in bytes.
Definition array.h:83

mlx::core::array::set_data
void set_data(allocator::Buffer buffer, Deleter d=allocator::free)

mlx::core::array::data_size
size_t data_size() const
The size (in elements) of the underlying buffer the array points to.
Definition array.h:327

encoder.h

mlx::core::allocator::malloc_or_wait
Buffer malloc_or_wait(size_t size)

mlx::core::cpu::get_command_encoder
CommandEncoder & get_command_encoder(Stream stream)

mlx::core::simd::load
Simd< T, N > load(const T *x)
Definition base_simd.h:28

mlx::core::simd::max_size
static constexpr int max_size
Definition base_simd.h:14

mlx::core::simd::store
void store(T *dst, Simd< T, N > x)
Definition base_simd.h:33

mlx::core
Definition allocator.h:7

mlx::core::unary_complex_to_float
void unary_complex_to_float(const array &a, array &out, Op op, Stream stream)
Definition unary.h:247

mlx::core::unary
void unary(const array &a, array &out, Op op, Stream stream)
Definition unary.h:75

mlx::core::bool_
constexpr Dtype bool_
Definition dtype.h:68

mlx::core::uint64
constexpr Dtype uint64
Definition dtype.h:73

mlx::core::uint16
constexpr Dtype uint16
Definition dtype.h:71

mlx::core::float64
constexpr Dtype float64
Definition dtype.h:82

mlx::core::set_unary_output_data
void set_unary_output_data(const array &in, array &out)
Definition unary.h:14

mlx::core::unary_int
void unary_int(const array &a, array &out, Op op, Stream stream)
Definition unary.h:259

mlx::core::bfloat16
constexpr Dtype bfloat16
Definition dtype.h:83

mlx::core::int32
constexpr Dtype int32
Definition dtype.h:77

mlx::core::float32
constexpr Dtype float32
Definition dtype.h:81

mlx::core::unary_fp
void unary_fp(const array &a, array &out, Op op, Stream stream)
Definition unary.h:160

mlx::core::int16
constexpr Dtype int16
Definition dtype.h:76

mlx::core::int8
constexpr Dtype int8
Definition dtype.h:75

mlx::core::int64
constexpr Dtype int64
Definition dtype.h:78

mlx::core::unary_real_fp
void unary_real_fp(const array &a, array &out, Op op, Stream stream)
Definition unary.h:131

mlx::core::uint8
constexpr Dtype uint8
Definition dtype.h:70

mlx::core::unary_complex
void unary_complex(const array &a, array &out, Op op, Stream stream)
Definition unary.h:236

mlx::core::unary_op
void unary_op(const T *a, U *out, size_t shape, size_t stride)
Definition unary.h:32

mlx::core::float16
constexpr Dtype float16
Definition dtype.h:80

mlx::core::uint32
constexpr Dtype uint32
Definition dtype.h:72

mlx::core::unary_signed
void unary_signed(const array &a, array &out, Op op, Stream stream)
Definition unary.h:193

mlx::core::is_donatable
bool is_donatable(const array &in, const array &out)
Definition utils.h:155

mlx::core::complex64
constexpr Dtype complex64
Definition dtype.h:84

simd.h

mlx::core::ContiguousIterator
Definition utils.h:73

mlx::core::Stream
Definition stream.h:9

mlx::core::array::Flags::contiguous
bool contiguous
Definition array.h:238

utils.h