NEON/functions/NEDepthwiseConvolutionLayer.cpp

*c217d954SCole Faust/*
*c217d954SCole Faust * Copyright (c) 2017-2021 Arm Limited.
*c217d954SCole Faust *
*c217d954SCole Faust * SPDX-License-Identifier: MIT
*c217d954SCole Faust *
*c217d954SCole Faust * Permission is hereby granted, free of charge, to any person obtaining a copy
*c217d954SCole Faust * of this software and associated documentation files (the "Software"), to
*c217d954SCole Faust * deal in the Software without restriction, including without limitation the
*c217d954SCole Faust * rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
*c217d954SCole Faust * sell copies of the Software, and to permit persons to whom the Software is
*c217d954SCole Faust * furnished to do so, subject to the following conditions:
*c217d954SCole Faust *
*c217d954SCole Faust * The above copyright notice and this permission notice shall be included in all
*c217d954SCole Faust * copies or substantial portions of the Software.
*c217d954SCole Faust *
*c217d954SCole Faust * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
*c217d954SCole Faust * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
*c217d954SCole Faust * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
*c217d954SCole Faust * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
*c217d954SCole Faust * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
*c217d954SCole Faust * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
*c217d954SCole Faust * SOFTWARE.
*c217d954SCole Faust */
*c217d954SCole Faust#include "arm_compute/runtime/NEON/functions/NEDepthwiseConvolutionLayer.h"
*c217d954SCole Faust
*c217d954SCole Faust#include "arm_compute/core/utils/misc/InfoHelpers.h"
*c217d954SCole Faust#include "arm_compute/core/utils/misc/ShapeCalculator.h"
*c217d954SCole Faust#include "arm_compute/core/utils/quantization/AsymmHelpers.h"
*c217d954SCole Faust#include "arm_compute/runtime/NEON/NEScheduler.h"
*c217d954SCole Faust#include "src/common/utils/Log.h"
*c217d954SCole Faust#include "src/cpu/operators/CpuDepthwiseConv2d.h"
*c217d954SCole Faust
*c217d954SCole Faustusing namespace arm_compute::misc;
*c217d954SCole Faustusing namespace arm_compute::misc::shape_calculator;
*c217d954SCole Faust
*c217d954SCole Faustnamespace arm_compute
*c217d954SCole Faust{
*c217d954SCole FaustNEDepthwiseConvolutionLayer::~NEDepthwiseConvolutionLayer() = default;
*c217d954SCole Faust
*c217d954SCole Fauststruct NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerOptimizedInternal::Impl
*c217d954SCole Faust{
*c217d954SCole Faust    ITensor       *src{ nullptr }; // SRC_0
*c217d954SCole Faust    ITensor       *dst{ nullptr }; // DST_0
*c217d954SCole Faust    const ITensor *weights
*c217d954SCole Faust    {
*c217d954SCole Faust        nullptr
*c217d954SCole Faust    }; // SRC_1
*c217d954SCole Faust    const ITensor *biases
*c217d954SCole Faust    {
*c217d954SCole Faust        nullptr
*c217d954SCole Faust    };                                                           // SRC_2
*c217d954SCole Faust    Tensor                                   permuted_input{};   // INT_0
*c217d954SCole Faust    Tensor                                   permuted_weights{}; // INT_1
*c217d954SCole Faust    Tensor                                   permuted_output{};  // INT_2
*c217d954SCole Faust    Tensor                                   workspace{};        // INT_3
*c217d954SCole Faust    Tensor                                   packed_weights{};   // INT_4
*c217d954SCole Faust    std::shared_ptr<cpu::CpuDepthwiseConv2d> op{ nullptr };
*c217d954SCole Faust    bool                                     is_prepared{ false };
*c217d954SCole Faust    bool                                     permute{ false };
*c217d954SCole Faust};
*c217d954SCole Faust
*c217d954SCole FaustNEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerOptimizedInternal::NEDepthwiseConvolutionLayerOptimizedInternal(std::shared_ptr<IMemoryManager> memory_manager)
*c217d954SCole Faust    : _memory_group(memory_manager), _impl(std::make_unique<Impl>())
*c217d954SCole Faust{
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerOptimizedInternal::configure(ITensor       *input,
*c217d954SCole Faust                                                                                          const ITensor *weights,
*c217d954SCole Faust                                                                                          const ITensor *biases,
*c217d954SCole Faust                                                                                          ITensor *output, const PadStrideInfo &conv_info,
*c217d954SCole Faust                                                                                          unsigned int               depth_multiplier,
*c217d954SCole Faust                                                                                          const ActivationLayerInfo &act_info,
*c217d954SCole Faust                                                                                          const Size2D              &dilation)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON_NULLPTR(input, weights, output);
*c217d954SCole Faust
*c217d954SCole Faust    bool is_nhwc   = input->info()->data_layout() == DataLayout::NCHW;
*c217d954SCole Faust    _impl->src     = input;
*c217d954SCole Faust    _impl->weights = weights;
*c217d954SCole Faust    _impl->biases  = biases;
*c217d954SCole Faust    _impl->dst     = output;
*c217d954SCole Faust    _impl->permute = is_nhwc;
*c217d954SCole Faust
*c217d954SCole Faust    _impl->op = std::make_unique<cpu::CpuDepthwiseConv2d>();
*c217d954SCole Faust    ConvolutionInfo info{ conv_info, depth_multiplier, act_info, dilation };
*c217d954SCole Faust    _impl->op->configure(_impl->src->info(), _impl->weights->info(), _impl->biases == nullptr ? nullptr : _impl->biases->info(),
*c217d954SCole Faust                         _impl->dst->info(), info);
*c217d954SCole Faust
*c217d954SCole Faust    // Configure pipeline
*c217d954SCole Faust    ActivationLayerInfo act_info_to_use            = ActivationLayerInfo();
*c217d954SCole Faust    const bool          is_relu                    = arm_compute::utils::info_helpers::is_relu(act_info);
*c217d954SCole Faust    const bool          is_relu6                   = arm_compute::utils::info_helpers::is_relu6(act_info);
*c217d954SCole Faust    bool                is_activationlayer_enabled = act_info.enabled() && !(is_relu || is_relu6);
*c217d954SCole Faust
*c217d954SCole Faust    if(!is_activationlayer_enabled)
*c217d954SCole Faust    {
*c217d954SCole Faust        act_info_to_use = act_info;
*c217d954SCole Faust    }
*c217d954SCole Faust    info = ConvolutionInfo{ conv_info, depth_multiplier, act_info_to_use, dilation };
*c217d954SCole Faust
*c217d954SCole Faust    auto dwc_optimized_func = std::make_unique<cpu::CpuDepthwiseConv2dAssemblyDispatch>();
*c217d954SCole Faust
*c217d954SCole Faust    if(is_nhwc)
*c217d954SCole Faust    {
*c217d954SCole Faust        auto permute_input   = std::make_unique<cpu::CpuPermute>();
*c217d954SCole Faust        auto permute_weights = std::make_unique<cpu::CpuPermute>();
*c217d954SCole Faust        auto permute_output  = std::make_unique<cpu::CpuPermute>();
*c217d954SCole Faust
*c217d954SCole Faust        _memory_group.manage(&_impl->permuted_input);
*c217d954SCole Faust        _memory_group.manage(&_impl->permuted_weights);
*c217d954SCole Faust        _memory_group.manage(&_impl->permuted_output);
*c217d954SCole Faust
*c217d954SCole Faust        // Configure the function to transform the input tensor from NCHW -> NHWC
*c217d954SCole Faust        permute_input->configure(input->info(), _impl->permuted_input.info(), PermutationVector(2U, 0U, 1U));
*c217d954SCole Faust        _impl->permuted_input.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust
*c217d954SCole Faust        // Configure the function to transform the weights tensor from IHW -> HWI
*c217d954SCole Faust        permute_weights->configure(weights->info(), _impl->permuted_weights.info(), PermutationVector(2U, 0U, 1U));
*c217d954SCole Faust        _impl->permuted_weights.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust
*c217d954SCole Faust        _impl->permuted_output.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust        _impl->permuted_output.info()->set_quantization_info(output->info()->quantization_info());
*c217d954SCole Faust
*c217d954SCole Faust        // Configure optimized depthwise
*c217d954SCole Faust        dwc_optimized_func->configure(_impl->permuted_input.info(), _impl->permuted_weights.info(), biases == nullptr ? nullptr : biases->info(), _impl->permuted_output.info(), info);
*c217d954SCole Faust
*c217d954SCole Faust        // Configure the function to transform the convoluted output to ACL's native ordering format NCHW
*c217d954SCole Faust        _impl->permuted_output.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust        permute_output->configure(_impl->permuted_output.info(), output->info(), PermutationVector(1U, 2U, 0U));
*c217d954SCole Faust
*c217d954SCole Faust        _impl->permuted_input.allocator()->allocate();
*c217d954SCole Faust        _impl->permuted_output.allocator()->allocate();
*c217d954SCole Faust    }
*c217d954SCole Faust    else
*c217d954SCole Faust    {
*c217d954SCole Faust        dwc_optimized_func->configure(_impl->src->info(), _impl->weights->info(), biases == nullptr ? nullptr : biases->info(), _impl->dst->info(), info);
*c217d954SCole Faust    }
*c217d954SCole Faust
*c217d954SCole Faust    // Allocate memory based on the internal memory requirements
*c217d954SCole Faust    experimental::MemoryRequirements mem_req = dwc_optimized_func->workspace();
*c217d954SCole Faust    _impl->workspace.allocator()->init(TensorInfo(TensorShape{ mem_req[0].size + mem_req[0].alignment }, 1, DataType::S8), mem_req[0].alignment);
*c217d954SCole Faust    _impl->packed_weights.allocator()->init(TensorInfo(TensorShape{ mem_req[1].size + mem_req[1].alignment }, 1, DataType::S8), mem_req[1].alignment);
*c217d954SCole Faust    _memory_group.manage(&_impl->workspace);
*c217d954SCole Faust    _memory_group.manage(&_impl->packed_weights);
*c217d954SCole Faust    _impl->workspace.allocator()->allocate();
*c217d954SCole Faust    _impl->packed_weights.allocator()->allocate();
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole FaustStatus NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerOptimizedInternal::validate(const ITensorInfo         *input,
*c217d954SCole Faust                                                                                           const ITensorInfo         *weights,
*c217d954SCole Faust                                                                                           const ITensorInfo         *biases,
*c217d954SCole Faust                                                                                           const ITensorInfo         *output,
*c217d954SCole Faust                                                                                           const PadStrideInfo       &conv_info,
*c217d954SCole Faust                                                                                           unsigned int               depth_multiplier,
*c217d954SCole Faust                                                                                           const ActivationLayerInfo &act_info,
*c217d954SCole Faust                                                                                           const Size2D              &dilation)
*c217d954SCole Faust{
*c217d954SCole Faust    ConvolutionInfo info{ conv_info, depth_multiplier, act_info, dilation };
*c217d954SCole Faust    return cpu::CpuDepthwiseConv2d::validate(input, weights, biases, output, info);
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerOptimizedInternal::run()
*c217d954SCole Faust{
*c217d954SCole Faust    prepare();
*c217d954SCole Faust    MemoryGroupResourceScope scope_mg(_memory_group);
*c217d954SCole Faust
*c217d954SCole Faust    ITensorPack pack;
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_SRC_0, _impl->src);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_SRC_1, _impl->weights);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_SRC_2, _impl->biases);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_0, &_impl->permuted_input);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_1, &_impl->permuted_weights);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_2, &_impl->permuted_output);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_3, &_impl->workspace);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_4, &_impl->packed_weights);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_DST_0, _impl->dst);
*c217d954SCole Faust
*c217d954SCole Faust    _impl->op->run(pack);
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerOptimizedInternal::prepare()
*c217d954SCole Faust{
*c217d954SCole Faust    if(!_impl->is_prepared)
*c217d954SCole Faust    {
*c217d954SCole Faust        // Permute weights
*c217d954SCole Faust        if(_impl->permute)
*c217d954SCole Faust        {
*c217d954SCole Faust            _impl->permuted_weights.allocator()->allocate();
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        if(!_impl->permuted_weights.is_used())
*c217d954SCole Faust        {
*c217d954SCole Faust            _impl->permuted_weights.allocator()->free();
*c217d954SCole Faust        }
*c217d954SCole Faust
*c217d954SCole Faust        _impl->is_prepared = true;
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Fauststruct NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerGeneric::Impl
*c217d954SCole Faust{
*c217d954SCole Faust    Tensor                                   permuted_input{};
*c217d954SCole Faust    Tensor                                   permuted_weights{};
*c217d954SCole Faust    Tensor                                   permuted_output{};
*c217d954SCole Faust    bool                                     is_prepared{ false };
*c217d954SCole Faust    bool                                     is_nchw{ false };
*c217d954SCole Faust    bool                                     is_activationlayer_enabled{ false };
*c217d954SCole Faust    const ITensor                           *weights{ nullptr };
*c217d954SCole Faust    const ITensor                           *biases{ nullptr };
*c217d954SCole Faust    const ITensor                           *src{ nullptr };
*c217d954SCole Faust    ITensor                                 *dst{ nullptr };
*c217d954SCole Faust    std::shared_ptr<cpu::CpuDepthwiseConv2d> op{ nullptr };
*c217d954SCole Faust};
*c217d954SCole Faust
*c217d954SCole FaustNEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerGeneric::NEDepthwiseConvolutionLayerGeneric()
*c217d954SCole Faust    : _impl(std::make_unique<Impl>())
*c217d954SCole Faust{
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerGeneric::configure(ITensor *input, const ITensor *weights, const ITensor *biases, ITensor *output, const PadStrideInfo &conv_info,
*c217d954SCole Faust                                                                                unsigned int depth_multiplier, const ActivationLayerInfo &act_info, const Size2D &dilation)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_ERROR_ON_NULLPTR(input, weights, output);
*c217d954SCole Faust    ARM_COMPUTE_ERROR_THROW_ON(NEDepthwiseConvolutionLayer::validate(input->info(), weights->info(), (biases == nullptr) ? nullptr : biases->info(),
*c217d954SCole Faust                                                                     output->info(), conv_info, depth_multiplier, act_info, dilation));
*c217d954SCole Faust
*c217d954SCole Faust    const ConvolutionInfo info{ conv_info, depth_multiplier, act_info, dilation };
*c217d954SCole Faust    _impl->op = std::make_unique<cpu::CpuDepthwiseConv2d>();
*c217d954SCole Faust    _impl->op->configure(input->info(), weights->info(), biases == nullptr ? nullptr : biases->info(), output->info(), info);
*c217d954SCole Faust
*c217d954SCole Faust    _impl->src         = input;
*c217d954SCole Faust    _impl->dst         = output;
*c217d954SCole Faust    _impl->weights     = weights;
*c217d954SCole Faust    _impl->biases      = biases;
*c217d954SCole Faust    _impl->is_nchw     = input->info()->data_layout() == DataLayout::NCHW;
*c217d954SCole Faust    _impl->is_prepared = !_impl->is_nchw;
*c217d954SCole Faust
*c217d954SCole Faust    ITensor       *input_to_use   = input;
*c217d954SCole Faust    const ITensor *weights_to_use = weights;
*c217d954SCole Faust    ITensor       *output_to_use  = output;
*c217d954SCole Faust    if(_impl->is_nchw)
*c217d954SCole Faust    {
*c217d954SCole Faust        auto permute_input   = std::make_unique<cpu::CpuPermute>();
*c217d954SCole Faust        auto permute_weights = std::make_unique<cpu::CpuPermute>();
*c217d954SCole Faust
*c217d954SCole Faust        permute_input->configure(input->info(), _impl->permuted_input.info(), PermutationVector(2U, 0U, 1U));
*c217d954SCole Faust        _impl->permuted_input.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust        input_to_use = &_impl->permuted_input;
*c217d954SCole Faust
*c217d954SCole Faust        permute_weights->configure(weights->info(), _impl->permuted_weights.info(), PermutationVector(2U, 0U, 1U));
*c217d954SCole Faust        _impl->permuted_weights.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust        weights_to_use = &_impl->permuted_weights;
*c217d954SCole Faust
*c217d954SCole Faust        _impl->permuted_output.allocator()->init(output->info()->clone()->set_is_resizable(true).reset_padding().set_tensor_shape(TensorShape()));
*c217d954SCole Faust        output_to_use = &_impl->permuted_output;
*c217d954SCole Faust    }
*c217d954SCole Faust
*c217d954SCole Faust    auto depthwise_conv_kernel = std::make_unique<cpu::kernels::CpuDepthwiseConv2dNativeKernel>();
*c217d954SCole Faust    depthwise_conv_kernel->configure(input_to_use->info(), weights_to_use->info(), biases == nullptr ? nullptr : biases->info(), output_to_use->info(), info);
*c217d954SCole Faust
*c217d954SCole Faust    if(_impl->is_nchw)
*c217d954SCole Faust    {
*c217d954SCole Faust        auto permute_output = std::make_unique<cpu::CpuPermute>();
*c217d954SCole Faust        permute_output->configure(_impl->permuted_output.info(), output->info(), PermutationVector(1U, 2U, 0U));
*c217d954SCole Faust        _impl->permuted_output.info()->set_data_layout(DataLayout::NHWC);
*c217d954SCole Faust
*c217d954SCole Faust        _impl->permuted_input.allocator()->allocate();
*c217d954SCole Faust        _impl->permuted_weights.allocator()->allocate();
*c217d954SCole Faust        _impl->permuted_output.allocator()->allocate();
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole FaustStatus NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerGeneric::validate(const ITensorInfo *input, const ITensorInfo *weights, const ITensorInfo *biases, const ITensorInfo *output,
*c217d954SCole Faust                                                                                 const PadStrideInfo &conv_info,
*c217d954SCole Faust                                                                                 unsigned int depth_multiplier, const ActivationLayerInfo &act_info, const Size2D &dilation)
*c217d954SCole Faust{
*c217d954SCole Faust    ConvolutionInfo info{ conv_info, depth_multiplier, act_info, dilation };
*c217d954SCole Faust    return cpu::CpuDepthwiseConv2d::validate(input, weights, biases, output, info);
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayerGeneric::run()
*c217d954SCole Faust{
*c217d954SCole Faust    ITensorPack pack;
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_SRC_0, _impl->src);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_SRC_1, _impl->weights);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_SRC_2, _impl->biases);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_0, &_impl->permuted_input);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_1, &_impl->permuted_weights);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_INT_2, &_impl->permuted_output);
*c217d954SCole Faust    pack.add_tensor(TensorType::ACL_DST_0, _impl->dst);
*c217d954SCole Faust
*c217d954SCole Faust    _impl->op->run(pack);
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole FaustNEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayer(std::shared_ptr<IMemoryManager> memory_manager)
*c217d954SCole Faust    : _memory_group(std::move(memory_manager)), _impl(std::make_unique<Impl>())
*c217d954SCole Faust{
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faust#ifndef DOXYGEN_SKIP_THIS
*c217d954SCole Fauststruct NEDepthwiseConvolutionLayer::NEDepthwiseConvolutionLayer::Impl
*c217d954SCole Faust{
*c217d954SCole Faust    DepthwiseConvolutionFunction                 depth_conv_func{ DepthwiseConvolutionFunction::OPTIMIZED };
*c217d954SCole Faust    NEDepthwiseConvolutionLayerOptimizedInternal func_optimized{ nullptr };
*c217d954SCole Faust    NEDepthwiseConvolutionLayerGeneric           func_generic{};
*c217d954SCole Faust    std::shared_ptr<cpu::CpuDepthwiseConv2d>     op{ nullptr };
*c217d954SCole Faust};
*c217d954SCole Faust#endif // DOXYGEN_SKIP_THIS
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::configure(ITensor *input, const ITensor *weights, const ITensor *biases, ITensor *output, const PadStrideInfo &conv_info, unsigned int depth_multiplier,
*c217d954SCole Faust                                            const ActivationLayerInfo &act_info, const Size2D &dilation)
*c217d954SCole Faust{
*c217d954SCole Faust    ARM_COMPUTE_LOG_PARAMS(input, weights, output, conv_info, depth_multiplier, biases, act_info, dilation);
*c217d954SCole Faust
*c217d954SCole Faust    const ConvolutionInfo info{ conv_info, depth_multiplier, act_info, dilation };
*c217d954SCole Faust    _impl->op              = std::make_shared<cpu::CpuDepthwiseConv2d>();
*c217d954SCole Faust    _impl->depth_conv_func = _impl->op->get_depthwiseconvolution_function(input->info(), weights->info(), (biases != nullptr) ? biases->info() : nullptr, output->info(),
*c217d954SCole Faust                                                                          info);
*c217d954SCole Faust    switch(_impl->depth_conv_func)
*c217d954SCole Faust    {
*c217d954SCole Faust        case DepthwiseConvolutionFunction::OPTIMIZED:
*c217d954SCole Faust            _impl->func_optimized.configure(input, weights, biases, output, conv_info, depth_multiplier, act_info, dilation);
*c217d954SCole Faust            break;
*c217d954SCole Faust        case DepthwiseConvolutionFunction::GENERIC:
*c217d954SCole Faust            _impl->func_generic.configure(input, weights, biases, output, conv_info, depth_multiplier, act_info, dilation);
*c217d954SCole Faust            break;
*c217d954SCole Faust        default:
*c217d954SCole Faust            ARM_COMPUTE_ERROR("Unsupported DepthwiseConvolutionFunction");
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole FaustStatus NEDepthwiseConvolutionLayer::validate(const ITensorInfo *input, const ITensorInfo *weights, const ITensorInfo *biases, const ITensorInfo *output, const PadStrideInfo &conv_info,
*c217d954SCole Faust                                             unsigned int depth_multiplier, const ActivationLayerInfo &act_info, const Size2D &dilation)
*c217d954SCole Faust{
*c217d954SCole Faust    ConvolutionInfo info{ conv_info, depth_multiplier, act_info, dilation };
*c217d954SCole Faust    return cpu::CpuDepthwiseConv2d::validate(input, weights, biases, output, info);
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::run()
*c217d954SCole Faust{
*c217d954SCole Faust    switch(_impl->depth_conv_func)
*c217d954SCole Faust    {
*c217d954SCole Faust        case DepthwiseConvolutionFunction::OPTIMIZED:
*c217d954SCole Faust            _impl->func_optimized.run();
*c217d954SCole Faust            break;
*c217d954SCole Faust        case DepthwiseConvolutionFunction::GENERIC:
*c217d954SCole Faust            _impl->func_generic.run();
*c217d954SCole Faust            break;
*c217d954SCole Faust        default:
*c217d954SCole Faust            ARM_COMPUTE_ERROR("DepthwiseConvolutionFunction not properly configured");
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust
*c217d954SCole Faustvoid NEDepthwiseConvolutionLayer::prepare()
*c217d954SCole Faust{
*c217d954SCole Faust    switch(_impl->depth_conv_func)
*c217d954SCole Faust    {
*c217d954SCole Faust        case DepthwiseConvolutionFunction::OPTIMIZED:
*c217d954SCole Faust            _impl->func_optimized.prepare();
*c217d954SCole Faust            break;
*c217d954SCole Faust        case DepthwiseConvolutionFunction::GENERIC:
*c217d954SCole Faust            _impl->func_generic.prepare();
*c217d954SCole Faust            break;
*c217d954SCole Faust        default:
*c217d954SCole Faust            ARM_COMPUTE_ERROR("DepthwiseConvolutionFunction not properly configured");
*c217d954SCole Faust    }
*c217d954SCole Faust}
*c217d954SCole Faust} // namespace arm_compute