src/ATen/ScalarOps.h

*da0073e9SAndroid Build Coastguard Worker#pragma once
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker#include <ATen/Tensor.h>
*da0073e9SAndroid Build Coastguard Worker#include <c10/core/Scalar.h>
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker#ifndef AT_PER_OPERATOR_HEADERS
*da0073e9SAndroid Build Coastguard Worker#include <ATen/Functions.h>
*da0073e9SAndroid Build Coastguard Worker#else
*da0073e9SAndroid Build Coastguard Worker#include <ATen/ops/scalar_tensor.h>
*da0073e9SAndroid Build Coastguard Worker#endif
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workernamespace at::detail {
*da0073e9SAndroid Build Coastguard Worker// When filling a number to 1-element CPU tensor, we want to skip
*da0073e9SAndroid Build Coastguard Worker// everything but manipulate data ptr directly.
*da0073e9SAndroid Build Coastguard Worker// Ideally this fast pass should be implemented in TensorIterator,
*da0073e9SAndroid Build Coastguard Worker// but we also want to skip compute_types which in not avoidable
*da0073e9SAndroid Build Coastguard Worker// in TensorIterator for now.
*da0073e9SAndroid Build Coastguard WorkerTensor& scalar_fill(Tensor& self, const Scalar& value);
*da0073e9SAndroid Build Coastguard WorkerTORCH_API Tensor scalar_tensor_static(
*da0073e9SAndroid Build Coastguard Worker    const Scalar& s,
*da0073e9SAndroid Build Coastguard Worker    std::optional<ScalarType> dtype_opt,
*da0073e9SAndroid Build Coastguard Worker    std::optional<Device> device_opt);
*da0073e9SAndroid Build Coastguard Worker} // namespace at::detail
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker// This is in the c10 namespace because we use ADL to find the functions in it.
*da0073e9SAndroid Build Coastguard Workernamespace c10 {
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker// FIXME: this should be (and was) Scalar::toTensor, but there is currently no
*da0073e9SAndroid Build Coastguard Worker// way to implement this without going through Derived Types (which are not part
*da0073e9SAndroid Build Coastguard Worker// of core).
*da0073e9SAndroid Build Coastguard Workerinline at::Tensor scalar_to_tensor(
*da0073e9SAndroid Build Coastguard Worker    const Scalar& s,
*da0073e9SAndroid Build Coastguard Worker    const Device device = at::kCPU) {
*da0073e9SAndroid Build Coastguard Worker  // This is the fast track we have for CPU scalar tensors.
*da0073e9SAndroid Build Coastguard Worker  if (device == at::kCPU) {
*da0073e9SAndroid Build Coastguard Worker    return at::detail::scalar_tensor_static(s, s.type(), at::kCPU);
*da0073e9SAndroid Build Coastguard Worker  }
*da0073e9SAndroid Build Coastguard Worker  return at::scalar_tensor(s, at::device(device).dtype(s.type()));
*da0073e9SAndroid Build Coastguard Worker}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker} // namespace c10
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workernamespace at::native {
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Workerinline Tensor wrapped_scalar_tensor(
*da0073e9SAndroid Build Coastguard Worker    const Scalar& scalar,
*da0073e9SAndroid Build Coastguard Worker    const Device device = at::kCPU) {
*da0073e9SAndroid Build Coastguard Worker  auto tensor = scalar_to_tensor(scalar, device);
*da0073e9SAndroid Build Coastguard Worker  tensor.unsafeGetTensorImpl()->set_wrapped_number(true);
*da0073e9SAndroid Build Coastguard Worker  return tensor;
*da0073e9SAndroid Build Coastguard Worker}
*da0073e9SAndroid Build Coastguard Worker
*da0073e9SAndroid Build Coastguard Worker} // namespace at::native