validation/reference/PixelWiseMultiplication.cpp

*c217d954SCole Faust/*
*c217d954SCole Faust * Copyright (c) 2017-2020 Arm Limited.
*c217d954SCole Faust *
*c217d954SCole Faust * SPDX-License-Identifier: MIT
*c217d954SCole Faust *
*c217d954SCole Faust * Permission is hereby granted, free of charge, to any person obtaining a copy
*c217d954SCole Faust * of this software and associated documentation files (the "Software"), to
*c217d954SCole Faust * deal in the Software without restriction, including without limitation the
*c217d954SCole Faust * rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
*c217d954SCole Faust * sell copies of the Software, and to permit persons to whom the Software is
*c217d954SCole Faust * furnished to do so, subject to the following conditions:
*c217d954SCole Faust *
*c217d954SCole Faust * The above copyright notice and this permission notice shall be included in all
*c217d954SCole Faust * copies or substantial portions of the Software.
*c217d954SCole Faust *
*c217d954SCole Faust * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
*c217d954SCole Faust * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
*c217d954SCole Faust * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
*c217d954SCole Faust * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
*c217d954SCole Faust * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
*c217d954SCole Faust * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
*c217d954SCole Faust * SOFTWARE.
*c217d954SCole Faust */
*c217d954SCole Faust#include "PixelWiseMultiplication.h"
*c217d954SCole Faust
*c217d954SCole Faust#include "tests/validation/Helpers.h"
*c217d954SCole Faust
*c217d954SCole Faustnamespace arm_compute
*c217d954SCole Faust{
*c217d954SCole Faustnamespace test
*c217d954SCole Faust{
*c217d954SCole Faustnamespace validation
*c217d954SCole Faust{
*c217d954SCole Faustnamespace reference
*c217d954SCole Faust{
*c217d954SCole Fausttemplate <class T>
*c217d954SCole Fauststruct is_floating_point
*c217d954SCole Faust    : std::integral_constant < bool,
*c217d954SCole Faust      std::is_same<float, typename std::remove_cv<T>::type>::value || std::is_same<half_float::half, typename std::remove_cv<T>::type>::value
*c217d954SCole Faust      || std::is_same<double, typename std::remove_cv<T>::type>::value || std::is_same<long double, typename std::remove_cv<T>::type>::value >
*c217d954SCole Faust{
*c217d954SCole Faust};
*c217d954SCole Faust
*c217d954SCole Faustnamespace
*c217d954SCole Faust{
*c217d954SCole Faustconstexpr float scale1_constant = 1.f;
*c217d954SCole Faust
*c217d954SCole Faust/** Compute the result of `src1 * src2 * scale`. The result type always matches the type of @p src2.
*c217d954SCole Faust *
*c217d954SCole Faust * @param[in] src1            An input value. Data types supported: U8/S16/F16/F32.
*c217d954SCole Faust * @param[in] src2            An input value. Data types supported: same as @p src1.
*c217d954SCole Faust * @param[in] scale           Scale to apply after multiplication.
*c217d954SCole Faust *                            Scale must be positive and its value must be either 1/255 or 1/2^n where n is between 0 and 15.
*c217d954SCole Faust * @param[in] convert_policy  Overflow policy. Supported overflow policies: Wrap, Saturate
*c217d954SCole Faust * @param[in] rounding_policy Rounding policy. Supported rounding modes: to zero, to nearest even.
*c217d954SCole Faust */
*c217d954SCole Fausttemplate <typename T1, typename T2, typename T3>
*c217d954SCole FaustT3 mul(const T1 src1, const T2 src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy)
*c217d954SCole Faust{
*c217d954SCole Faust    using intermediate_type = typename common_promoted_signed_type<T1, T2, T3>::intermediate_type;
*c217d954SCole Faust
*c217d954SCole Faust    const double val = static_cast<intermediate_type>(src1) * static_cast<intermediate_type>(src2) * static_cast<double>(scale);
*c217d954SCole Faust
*c217d954SCole Faust    if(is_floating_point<T3>::value)
*c217d954SCole Faust    {
*c217d954SCole Faust        const auto result = static_cast<T3>(val);
*c217d954SCole Faust
*c217d954SCole Faust        return result;
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        double rounded_val = 0;
*c217d954SCole Faust        switch(rounding_policy)
*c217d954SCole Faust        {
*c217d954SCole Faust            case(RoundingPolicy::TO_ZERO):
*c217d954SCole Faust                rounded_val = support::cpp11::trunc(val);
*c217d954SCole Faust                break;
*c217d954SCole Faust            case(RoundingPolicy::TO_NEAREST_UP):
*c217d954SCole Faust                rounded_val = round_half_up(val);
*c217d954SCole Faust                break;
*c217d954SCole Faust            case(RoundingPolicy::TO_NEAREST_EVEN):
*c217d954SCole Faust                rounded_val = round_half_even(val);
*c217d954SCole Faust                break;
*c217d954SCole Faust            default:
*c217d954SCole Faust                ARM_COMPUTE_ERROR("Unsupported rounding policy");
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        const auto result = static_cast<T3>((convert_policy == ConvertPolicy::SATURATE) ? saturate_cast<T3>(rounded_val) : rounded_val);
*c217d954SCole Faust
*c217d954SCole Faust        return result;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <>
*c217d954SCole Faustint32_t mul(const int32_t src1, const int32_t src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy)
*c217d954SCole Faust{
*c217d954SCole Faust    const int64_t intermediate_val = static_cast<int64_t>(src1) * static_cast<int64_t>(src2);
*c217d954SCole Faust
*c217d954SCole Faust    if(std::abs(scale - scale1_constant) < 0.00001f)
*c217d954SCole Faust    {
*c217d954SCole Faust        // Use bit-accurate integer arithmetic for scale == 1
*c217d954SCole Faust        // Apply conversion
*c217d954SCole Faust        if(convert_policy == ConvertPolicy::SATURATE)
*c217d954SCole Faust        {
*c217d954SCole Faust            return saturate_cast<int32_t>(intermediate_val);
*c217d954SCole Faust        }
*c217d954SCole Faust        else
*c217d954SCole Faust        {
*c217d954SCole Faust            // Correct wrapping behaviour for int32_t
*c217d954SCole Faust            const auto i32_hi              = static_cast<int64_t>(std::numeric_limits<int32_t>::max());
*c217d954SCole Faust            const auto i32_lo              = static_cast<int64_t>(std::numeric_limits<int32_t>::lowest());
*c217d954SCole Faust            const auto i32_wi              = static_cast<int64_t>(1) << 32;
*c217d954SCole Faust            int64_t    wrapped_rounded_val = intermediate_val - i32_wi * static_cast<int64_t>(support::cpp11::trunc(static_cast<double>(intermediate_val) / i32_wi));
*c217d954SCole Faust            if(wrapped_rounded_val <= i32_hi)
*c217d954SCole Faust            {
*c217d954SCole Faust                return static_cast<int32_t>(wrapped_rounded_val);
*c217d954SCole Faust            }
*c217d954SCole Faust            else
*c217d954SCole Faust            {
*c217d954SCole Faust                // Values beyond i32_hi wrap around to negatives
*c217d954SCole Faust                return static_cast<int32_t>((wrapped_rounded_val - i32_hi) + i32_lo - 1);
*c217d954SCole Faust            }
*c217d954SCole Faust        }
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        // Use double arithmetic for scale != 1; may not be bit-accurate
*c217d954SCole Faust        // Apply scaling
*c217d954SCole Faust        // scale == 1 / 2^scale_exponent
*c217d954SCole Faust        int scale_exponent = 0;
*c217d954SCole Faust        std::frexp(scale, &scale_exponent);
*c217d954SCole Faust        // Store the positive exponent. We know that we compute 1/2^n
*c217d954SCole Faust        // Additionally we need to subtract 1 to compensate that frexp used a mantissa of 0.5
*c217d954SCole Faust        scale_exponent         = std::abs(scale_exponent - 1);
*c217d954SCole Faust        const double scale_inv = static_cast<int64_t>(1) << scale_exponent;
*c217d954SCole Faust        const double val       = intermediate_val / scale_inv;
*c217d954SCole Faust        // Apply rounding
*c217d954SCole Faust        double rounded_val = 0;
*c217d954SCole Faust        switch(rounding_policy)
*c217d954SCole Faust        {
*c217d954SCole Faust            case(RoundingPolicy::TO_ZERO):
*c217d954SCole Faust                rounded_val = support::cpp11::trunc(val);
*c217d954SCole Faust                break;
*c217d954SCole Faust            case(RoundingPolicy::TO_NEAREST_UP):
*c217d954SCole Faust                rounded_val = round_half_up(val);
*c217d954SCole Faust                break;
*c217d954SCole Faust            case(RoundingPolicy::TO_NEAREST_EVEN):
*c217d954SCole Faust                rounded_val = round_half_even(val);
*c217d954SCole Faust                break;
*c217d954SCole Faust            default:
*c217d954SCole Faust                ARM_COMPUTE_ERROR("Unsupported rounding policy");
*c217d954SCole Faust        }
*c217d954SCole Faust        // Apply conversion
*c217d954SCole Faust        if(convert_policy == ConvertPolicy::SATURATE)
*c217d954SCole Faust        {
*c217d954SCole Faust            return saturate_cast<int32_t>(rounded_val);
*c217d954SCole Faust        }
*c217d954SCole Faust        else
*c217d954SCole Faust        {
*c217d954SCole Faust            // Correct wrapping behaviour for int32_t
*c217d954SCole Faust            const auto i32_hi              = static_cast<double>(std::numeric_limits<int32_t>::max());
*c217d954SCole Faust            const auto i32_lo              = static_cast<double>(std::numeric_limits<int32_t>::lowest());
*c217d954SCole Faust            const auto i32_wi              = static_cast<double>(static_cast<int64_t>(1) << 32);
*c217d954SCole Faust            double     wrapped_rounded_val = rounded_val - i32_wi * std::floor(rounded_val / i32_wi);
*c217d954SCole Faust            if(wrapped_rounded_val <= i32_hi)
*c217d954SCole Faust            {
*c217d954SCole Faust                return static_cast<int32_t>(wrapped_rounded_val);
*c217d954SCole Faust            }
*c217d954SCole Faust            else
*c217d954SCole Faust            {
*c217d954SCole Faust                // Values beyond i32_hi wrap around to negatives
*c217d954SCole Faust                return static_cast<int32_t>((wrapped_rounded_val - i32_hi) + i32_lo - 1);
*c217d954SCole Faust            }
*c217d954SCole Faust        }
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <size_t dim>
*c217d954SCole Fauststruct BroadcastUnroll
*c217d954SCole Faust{
*c217d954SCole Faust    template <typename T1, typename T2, typename T3>
*c217d954SCole Faust    static void unroll(const SimpleTensor<T1> &src1, const SimpleTensor<T2> &src2, SimpleTensor<T3> &dst,
*c217d954SCole Faust                       float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                       Coordinates &id_src1, Coordinates &id_src2, Coordinates &id_dst)
*c217d954SCole Faust    {
*c217d954SCole Faust        const bool src1_is_broadcast = (src1.shape()[dim - 1] != dst.shape()[dim - 1]);
*c217d954SCole Faust        const bool src2_is_broadcast = (src2.shape()[dim - 1] != dst.shape()[dim - 1]);
*c217d954SCole Faust
*c217d954SCole Faust        id_src1.set(dim - 1, 0);
*c217d954SCole Faust        id_src2.set(dim - 1, 0);
*c217d954SCole Faust        id_dst.set(dim - 1, 0);
*c217d954SCole Faust
*c217d954SCole Faust        for(size_t i = 0; i < dst.shape()[dim - 1]; ++i, ++id_dst[dim - 1])
*c217d954SCole Faust        {
*c217d954SCole Faust            BroadcastUnroll < dim - 1 >::unroll(src1, src2, dst, scale, convert_policy, rounding_policy, id_src1, id_src2, id_dst);
*c217d954SCole Faust
*c217d954SCole Faust            id_src1[dim - 1] += !src1_is_broadcast;
*c217d954SCole Faust            id_src2[dim - 1] += !src2_is_broadcast;
*c217d954SCole Faust        }
*c217d954SCole Faust    }
*c217d954SCole Faust};
*c217d954SCole Faust
*c217d954SCole Fausttemplate <>
*c217d954SCole Fauststruct BroadcastUnroll<0>
*c217d954SCole Faust{
*c217d954SCole Faust    template <typename T1, typename T2, typename T3>
*c217d954SCole Faust    static void unroll(const SimpleTensor<T1> &src1, const SimpleTensor<T2> &src2, SimpleTensor<T3> &dst,
*c217d954SCole Faust                       float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                       Coordinates &id_src1, Coordinates &id_src2, Coordinates &id_dst)
*c217d954SCole Faust    {
*c217d954SCole Faust        dst[coord2index(dst.shape(), id_dst)] = mul<T1, T2, T3>(src1[coord2index(src1.shape(), id_src1)], src2[coord2index(src2.shape(), id_src2)], scale, convert_policy, rounding_policy);
*c217d954SCole Faust    }
*c217d954SCole Faust};
*c217d954SCole Faust} // namespace
*c217d954SCole Faust
*c217d954SCole Fausttemplate <typename T1, typename T2, typename T3>
*c217d954SCole FaustSimpleTensor<T3> pixel_wise_multiplication(const SimpleTensor<T1> &src1, const SimpleTensor<T2> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                                           DataType dt_out, const QuantizationInfo &qout)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_UNUSED(qout);
*c217d954SCole Faust
*c217d954SCole Faust    SimpleTensor<T3> dst(TensorShape::broadcast_shape(src1.shape(), src2.shape()), dt_out);
*c217d954SCole Faust
*c217d954SCole Faust    if(scale < 0)
*c217d954SCole Faust    {
*c217d954SCole Faust        ARM_COMPUTE_ERROR("Scale of pixel-wise multiplication must be non-negative");
*c217d954SCole Faust    }
*c217d954SCole Faust
*c217d954SCole Faust    Coordinates id_src1{};
*c217d954SCole Faust    Coordinates id_src2{};
*c217d954SCole Faust    Coordinates id_dst{};
*c217d954SCole Faust
*c217d954SCole Faust    BroadcastUnroll<Coordinates::num_max_dimensions>::unroll(src1, src2, dst, scale, convert_policy, rounding_policy, id_src1, id_src2, id_dst);
*c217d954SCole Faust
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <>
*c217d954SCole FaustSimpleTensor<uint8_t> pixel_wise_multiplication(const SimpleTensor<uint8_t> &src1, const SimpleTensor<uint8_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                                                DataType dt_out, const QuantizationInfo &qout)
*c217d954SCole Faust{
*c217d954SCole Faust    SimpleTensor<uint8_t> dst(TensorShape::broadcast_shape(src1.shape(), src2.shape()), dt_out, 1, qout);
*c217d954SCole Faust
*c217d954SCole Faust    if(src1.data_type() == DataType::QASYMM8 && src2.data_type() == DataType::QASYMM8)
*c217d954SCole Faust    {
*c217d954SCole Faust        SimpleTensor<float> src1_tmp = convert_from_asymmetric(src1);
*c217d954SCole Faust        SimpleTensor<float> src2_tmp = convert_from_asymmetric(src2);
*c217d954SCole Faust        SimpleTensor<float> dst_tmp  = pixel_wise_multiplication<float, float, float>(src1_tmp, src2_tmp, scale, convert_policy, rounding_policy, DataType::F32, qout);
*c217d954SCole Faust        dst                          = convert_to_asymmetric<uint8_t>(dst_tmp, qout);
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        if(scale < 0)
*c217d954SCole Faust        {
*c217d954SCole Faust            ARM_COMPUTE_ERROR("Scale of pixel-wise multiplication must be non-negative");
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        Coordinates id_src1{};
*c217d954SCole Faust        Coordinates id_src2{};
*c217d954SCole Faust        Coordinates id_dst{};
*c217d954SCole Faust        BroadcastUnroll<Coordinates::num_max_dimensions>::unroll(src1, src2, dst, scale, convert_policy, rounding_policy, id_src1, id_src2, id_dst);
*c217d954SCole Faust    }
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <>
*c217d954SCole FaustSimpleTensor<int16_t> pixel_wise_multiplication(const SimpleTensor<uint8_t> &src1, const SimpleTensor<uint8_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                                                DataType dt_out, const QuantizationInfo &qout)
*c217d954SCole Faust{
*c217d954SCole Faust    SimpleTensor<int16_t> dst(TensorShape::broadcast_shape(src1.shape(), src2.shape()), dt_out, 1, qout);
*c217d954SCole Faust
*c217d954SCole Faust    if(src1.data_type() == DataType::QASYMM8 && src2.data_type() == DataType::QASYMM8)
*c217d954SCole Faust    {
*c217d954SCole Faust        SimpleTensor<float> src1_tmp = convert_from_asymmetric(src1);
*c217d954SCole Faust        SimpleTensor<float> src2_tmp = convert_from_asymmetric(src2);
*c217d954SCole Faust        SimpleTensor<float> dst_tmp  = pixel_wise_multiplication<float, float, float>(src1_tmp, src2_tmp, scale, convert_policy, rounding_policy, DataType::F32, qout);
*c217d954SCole Faust        dst                          = convert_to_symmetric<int16_t>(dst_tmp, qout);
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        if(scale < 0)
*c217d954SCole Faust        {
*c217d954SCole Faust            ARM_COMPUTE_ERROR("Scale of pixel-wise multiplication must be non-negative");
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        Coordinates id_src1{};
*c217d954SCole Faust        Coordinates id_src2{};
*c217d954SCole Faust        Coordinates id_dst{};
*c217d954SCole Faust        BroadcastUnroll<Coordinates::num_max_dimensions>::unroll(src1, src2, dst, scale, convert_policy, rounding_policy, id_src1, id_src2, id_dst);
*c217d954SCole Faust    }
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <>
*c217d954SCole FaustSimpleTensor<int8_t> pixel_wise_multiplication(const SimpleTensor<int8_t> &src1, const SimpleTensor<int8_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                                               DataType dt_out, const QuantizationInfo &qout)
*c217d954SCole Faust{
*c217d954SCole Faust    SimpleTensor<int8_t> dst(TensorShape::broadcast_shape(src1.shape(), src2.shape()), dt_out, 1, qout);
*c217d954SCole Faust
*c217d954SCole Faust    if(src1.data_type() == DataType::QASYMM8_SIGNED && src2.data_type() == DataType::QASYMM8_SIGNED)
*c217d954SCole Faust    {
*c217d954SCole Faust        SimpleTensor<float> src1_tmp = convert_from_asymmetric(src1);
*c217d954SCole Faust        SimpleTensor<float> src2_tmp = convert_from_asymmetric(src2);
*c217d954SCole Faust        SimpleTensor<float> dst_tmp  = pixel_wise_multiplication<float, float, float>(src1_tmp, src2_tmp, scale, convert_policy, rounding_policy, DataType::F32, qout);
*c217d954SCole Faust        dst                          = convert_to_asymmetric<int8_t>(dst_tmp, qout);
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        if(scale < 0)
*c217d954SCole Faust        {
*c217d954SCole Faust            ARM_COMPUTE_ERROR("Scale of pixel-wise multiplication must be non-negative");
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        Coordinates id_src1{};
*c217d954SCole Faust        Coordinates id_src2{};
*c217d954SCole Faust        Coordinates id_dst{};
*c217d954SCole Faust        BroadcastUnroll<Coordinates::num_max_dimensions>::unroll(src1, src2, dst, scale, convert_policy, rounding_policy, id_src1, id_src2, id_dst);
*c217d954SCole Faust    }
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fausttemplate <>
*c217d954SCole FaustSimpleTensor<int16_t> pixel_wise_multiplication(const SimpleTensor<int16_t> &src1, const SimpleTensor<int16_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy,
*c217d954SCole Faust                                                DataType dt_out, const QuantizationInfo &qout)
*c217d954SCole Faust{
*c217d954SCole Faust    SimpleTensor<int16_t> dst(TensorShape::broadcast_shape(src1.shape(), src2.shape()), dt_out, 1, qout);
*c217d954SCole Faust
*c217d954SCole Faust    if(src1.data_type() == DataType::QSYMM16 && src2.data_type() == DataType::QSYMM16)
*c217d954SCole Faust    {
*c217d954SCole Faust        SimpleTensor<float> src1_tmp = convert_from_symmetric<int16_t>(src1);
*c217d954SCole Faust        SimpleTensor<float> src2_tmp = convert_from_symmetric<int16_t>(src2);
*c217d954SCole Faust        SimpleTensor<float> dst_tmp  = pixel_wise_multiplication<float, float, float>(src1_tmp, src2_tmp, scale, convert_policy, rounding_policy, DataType::F32, qout);
*c217d954SCole Faust        dst                          = convert_to_symmetric<int16_t>(dst_tmp, qout);
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        if(scale < 0)
*c217d954SCole Faust        {
*c217d954SCole Faust            ARM_COMPUTE_ERROR("Scale of pixel-wise multiplication must be non-negative");
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        Coordinates id_src1{};
*c217d954SCole Faust        Coordinates id_src2{};
*c217d954SCole Faust        Coordinates id_dst{};
*c217d954SCole Faust        BroadcastUnroll<Coordinates::num_max_dimensions>::unroll(src1, src2, dst, scale, convert_policy, rounding_policy, id_src1, id_src2, id_dst);
*c217d954SCole Faust    }
*c217d954SCole Faust    return dst;
*c217d954SCole Faust}
*c217d954SCole Faust// *INDENT-OFF*
*c217d954SCole Faust// clang-format off
*c217d954SCole Fausttemplate SimpleTensor<int16_t> pixel_wise_multiplication(const SimpleTensor<uint8_t> &src1, const SimpleTensor<int16_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy, DataType dt_out, const QuantizationInfo &qout);
*c217d954SCole Fausttemplate SimpleTensor<int32_t> pixel_wise_multiplication(const SimpleTensor<int16_t> &src1, const SimpleTensor<int16_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy, DataType dt_out, const QuantizationInfo &qout);
*c217d954SCole Fausttemplate SimpleTensor<int32_t> pixel_wise_multiplication(const SimpleTensor<int32_t> &src1, const SimpleTensor<int32_t> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy, DataType dt_out, const QuantizationInfo &qout);
*c217d954SCole Fausttemplate SimpleTensor<float> pixel_wise_multiplication(const SimpleTensor<float> &src1, const SimpleTensor<float> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy, DataType dt_out, const QuantizationInfo &qout);
*c217d954SCole Fausttemplate SimpleTensor<half_float::half> pixel_wise_multiplication(const SimpleTensor<half_float::half> &src1, const SimpleTensor<half_float::half> &src2, float scale, ConvertPolicy convert_policy, RoundingPolicy rounding_policy, DataType dt_out, const QuantizationInfo &qout);
*c217d954SCole Faust// clang-format on
*c217d954SCole Faust// *INDENT-ON*
*c217d954SCole Faust} // namespace reference
*c217d954SCole Faust} // namespace validation
*c217d954SCole Faust} // namespace test
*c217d954SCole Faust} // namespace arm_compute