external/android-nn-driver/ConversionUtils_1_3.hpp

*3e777be0SXin Li//
*3e777be0SXin Li// Copyright © 2020,2022 Arm Ltd and Contributors. All rights reserved.
*3e777be0SXin Li// SPDX-License-Identifier: MIT
*3e777be0SXin Li//
*3e777be0SXin Li
*3e777be0SXin Li#pragma once
*3e777be0SXin Li
*3e777be0SXin Li#include "ConversionUtils_1_2.hpp"
*3e777be0SXin Li
*3e777be0SXin Liusing Half = half_float::half;
*3e777be0SXin Li
*3e777be0SXin Linamespace armnn_driver
*3e777be0SXin Li{
*3e777be0SXin Li
*3e777be0SXin Liusing namespace armnn;
*3e777be0SXin Liusing namespace android::nn;
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy,
*3e777be0SXin Li         typename HalOperation = typename HalPolicy::Operation,
*3e777be0SXin Li         typename HalModel     = typename HalPolicy::Model>
*3e777be0SXin Libool ConvertElu(const HalOperation& operation, const HalModel& model, ConversionData& data)
*3e777be0SXin Li{
*3e777be0SXin Li    using HalOperandType = typename HalPolicy::OperandType;
*3e777be0SXin Li
*3e777be0SXin Li    LayerInputHandle input0 = ConvertToLayerInputHandle<HalPolicy>(operation, 0, model, data);
*3e777be0SXin Li    if (!input0.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Determine data type of input tensor
*3e777be0SXin Li    HalOperandType inputType;
*3e777be0SXin Li    if (!GetOperandType<HalPolicy>(operation, 0, model, inputType))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    ActivationDescriptor desc;
*3e777be0SXin Li    desc.m_Function = ActivationFunction::Elu;
*3e777be0SXin Li
*3e777be0SXin Li    // Read alpha
*3e777be0SXin Li    if (inputType == HalOperandType::TENSOR_FLOAT16)
*3e777be0SXin Li    {
*3e777be0SXin Li        Half alpha;
*3e777be0SXin Li
*3e777be0SXin Li        if (!GetInputScalar<HalPolicy>(operation, 1, HalOperandType::FLOAT16, alpha, model, data))
*3e777be0SXin Li        {
*3e777be0SXin Li            return Fail("%s: Operation has invalid inputs (FLOAT16)", __func__);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        desc.m_A = static_cast<float>(alpha);
*3e777be0SXin Li    }
*3e777be0SXin Li    else if (inputType == HalOperandType::TENSOR_FLOAT32)
*3e777be0SXin Li    {
*3e777be0SXin Li        if (!GetInputScalar<HalPolicy>(operation, 1, HalOperandType::FLOAT32, desc.m_A, model, data))
*3e777be0SXin Li        {
*3e777be0SXin Li            return Fail("%s: Operation has invalid inputs (FLOAT32)", __func__);
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Unsupported input tensor type: %d", __func__, inputType);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return ::ConvertToActivation<HalPolicy>(operation, __func__, desc, model, data);
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy,
*3e777be0SXin Li    typename HalOperation = typename HalPolicy::Operation,
*3e777be0SXin Li    typename HalModel     = typename HalPolicy::Model>
*3e777be0SXin Libool ConvertFill(const HalOperation& operation, const HalModel& model, ConversionData& data)
*3e777be0SXin Li{
*3e777be0SXin Li    using HalOperand     = typename HalPolicy::Operand;
*3e777be0SXin Li    using HalOperandType = typename HalPolicy::OperandType;
*3e777be0SXin Li
*3e777be0SXin Li    LayerInputHandle input = ConvertToLayerInputHandle<HalPolicy>(operation, 0, model, data);
*3e777be0SXin Li    if (!input.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    const HalOperand* output = GetOutputOperand<HalPolicy>(operation, 0, model);
*3e777be0SXin Li    if (!output)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read output", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    const TensorInfo& inputInfo  = input.GetTensorInfo();
*3e777be0SXin Li    const TensorInfo& outputInfo = GetTensorInfoForOperand(*output);
*3e777be0SXin Li    if (IsDynamicTensor(outputInfo))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Dynamic output tensors are not supported", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Determine data type of output tensor
*3e777be0SXin Li    HalOperandType outputType = output->type;
*3e777be0SXin Li    FillDescriptor descriptor;
*3e777be0SXin Li    // Read the scalar fill value
*3e777be0SXin Li    if (outputType == HalOperandType::TENSOR_FLOAT16)
*3e777be0SXin Li    {
*3e777be0SXin Li        Half value;
*3e777be0SXin Li
*3e777be0SXin Li        if (!GetInputScalar<HalPolicy>(operation, 1, HalOperandType::FLOAT16, value, model, data))
*3e777be0SXin Li        {
*3e777be0SXin Li            return Fail("%s: Operation has invalid inputs %d", __func__, outputType);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        descriptor.m_Value = static_cast<float>(value);
*3e777be0SXin Li    }
*3e777be0SXin Li    else if (outputType == HalOperandType::TENSOR_FLOAT32)
*3e777be0SXin Li    {
*3e777be0SXin Li        if (!GetInputScalar<HalPolicy>(operation, 1, HalOperandType::FLOAT32, descriptor.m_Value, model, data))
*3e777be0SXin Li        {
*3e777be0SXin Li            return Fail("%s: Operation has invalid inputs %d", __func__, outputType);
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    else if (outputType == HalOperandType::TENSOR_INT32)
*3e777be0SXin Li    {
*3e777be0SXin Li        int32_t value;
*3e777be0SXin Li
*3e777be0SXin Li        if (!GetInputScalar<HalPolicy>(operation, 1, HalOperandType::INT32, value, model, data))
*3e777be0SXin Li        {
*3e777be0SXin Li            return Fail("%s: Operation has invalid inputs %d", __func__, outputType);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        descriptor.m_Value = static_cast<float>(value);
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Unsupported input tensor type: %d", __func__, outputType);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    bool isSupported = false;
*3e777be0SXin Li    armnn::BackendId setBackend;
*3e777be0SXin Li    FORWARD_LAYER_SUPPORT_FUNC(__func__,
*3e777be0SXin Li                               IsFillSupported,
*3e777be0SXin Li                               data.m_Backends,
*3e777be0SXin Li                               isSupported,
*3e777be0SXin Li                               setBackend,
*3e777be0SXin Li                               inputInfo,
*3e777be0SXin Li                               outputInfo,
*3e777be0SXin Li                               descriptor);
*3e777be0SXin Li    if (!isSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        return false;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    IConnectableLayer* const layer = data.m_Network->AddFillLayer(descriptor);
*3e777be0SXin Li    layer->SetBackendId(setBackend);
*3e777be0SXin Li    if (!layer)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not add the FillLayer", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li    input.Connect(layer->GetInputSlot(0));
*3e777be0SXin Li
*3e777be0SXin Li    return SetupAndTrackLayerOutputSlot<HalPolicy>(operation, 0, *layer, model, data);
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy,
*3e777be0SXin Li         typename HalOperation = typename HalPolicy::Operation,
*3e777be0SXin Li         typename HalModel     = typename HalPolicy::Model>
*3e777be0SXin Libool ConvertLogicalBinary(const HalOperation& operation,
*3e777be0SXin Li                          const HalModel& model,
*3e777be0SXin Li                          ConversionData& data,
*3e777be0SXin Li                          LogicalBinaryOperation logicalOperation)
*3e777be0SXin Li{
*3e777be0SXin Li    using HalOperand = typename HalPolicy::Operand;
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("HalPolicy::ConvertLogicalBinary()");
*3e777be0SXin Li    ALOGV("logicalOperation = %s", GetLogicalBinaryOperationAsCString(logicalOperation));
*3e777be0SXin Li
*3e777be0SXin Li    LayerInputHandle input0 = ConvertToLayerInputHandle<HalPolicy>(operation, 0, model, data);
*3e777be0SXin Li    LayerInputHandle input1 = ConvertToLayerInputHandle<HalPolicy>(operation, 1, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    if (!(input0.IsValid() && input1.IsValid()))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    const HalOperand* output = GetOutputOperand<HalPolicy>(operation, 0, model);
*3e777be0SXin Li    if (!output)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read output 0", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    const TensorInfo& inputInfo0 = input0.GetTensorInfo();
*3e777be0SXin Li    const TensorInfo& inputInfo1 = input1.GetTensorInfo();
*3e777be0SXin Li    const TensorInfo& outputInfo = GetTensorInfoForOperand(*output);
*3e777be0SXin Li
*3e777be0SXin Li    LogicalBinaryDescriptor descriptor(logicalOperation);
*3e777be0SXin Li
*3e777be0SXin Li    bool isSupported = false;
*3e777be0SXin Li    armnn::BackendId setBackend;
*3e777be0SXin Li    auto validateFunc = [&](const armnn::TensorInfo& outputInfo, bool& isSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        FORWARD_LAYER_SUPPORT_FUNC(__func__,
*3e777be0SXin Li                                   IsLogicalBinarySupported,
*3e777be0SXin Li                                   data.m_Backends,
*3e777be0SXin Li                                   isSupported,
*3e777be0SXin Li                                   setBackend,
*3e777be0SXin Li                                   inputInfo0,
*3e777be0SXin Li                                   inputInfo1,
*3e777be0SXin Li                                   outputInfo,
*3e777be0SXin Li                                   descriptor);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li    if(!IsDynamicTensor(outputInfo))
*3e777be0SXin Li    {
*3e777be0SXin Li        validateFunc(outputInfo, isSupported);
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        isSupported = AreDynamicTensorsSupported();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!isSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        return false;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    IConnectableLayer* layer = data.m_Network->AddLogicalBinaryLayer(descriptor);
*3e777be0SXin Li    layer->SetBackendId(setBackend);
*3e777be0SXin Li    if (!layer)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not add the LogicalBinaryLayer", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    bool isReshapeSupported = BroadcastTensor(input0, input1, layer, data);
*3e777be0SXin Li    if (!isReshapeSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        return false;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    return SetupAndTrackLayerOutputSlot<HalPolicy>(operation, 0, *layer, model, data, nullptr, validateFunc);
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy,
*3e777be0SXin Li         typename HalOperation = typename HalPolicy::Operation,
*3e777be0SXin Li         typename HalModel     = typename HalPolicy::Model>
*3e777be0SXin Libool ConvertQuantizedLstm(const HalOperation& operation, const HalModel& model, ConversionData& data)
*3e777be0SXin Li{
*3e777be0SXin Li    using HalOperand     = typename HalPolicy::Operand;
*3e777be0SXin Li    using HalOperandType = typename HalPolicy::OperandType;
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("HalPolicy::ConvertQuantizedLstm()");
*3e777be0SXin Li
*3e777be0SXin Li    //Inputs:
*3e777be0SXin Li    // 0: The input: A 2-D tensor of type ANEURALNETWORKS_TENSOR_QUANT8_ASYMM and shape [numBatches, inputSize]
*3e777be0SXin Li    //    specifying the input to the LSTM cell. Tensor is quantized with a fixed quantization range of -1, 127/128.
*3e777be0SXin Li    LayerInputHandle input = ConvertToLayerInputHandle<HalPolicy>(operation, 0, model, data);
*3e777be0SXin Li    if (!input.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read input 0: input", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // 18: The output state: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_ASYMM, of shape [batch_size, output_size].
*3e777be0SXin Li    LayerInputHandle outputStatePrevTimeStep = ConvertToLayerInputHandle<HalPolicy>(operation, 18, model, data);
*3e777be0SXin Li    if (!outputStatePrevTimeStep.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read input 18: outputStatePrevTimeStep", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // 19: The cell state: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT16_SYMM, of shape [batch_size, num_units].
*3e777be0SXin Li    LayerInputHandle cellStatePrevTimeStep = ConvertToLayerInputHandle<HalPolicy>(operation, 19, model, data);
*3e777be0SXin Li    if (!cellStatePrevTimeStep.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read input 19: cellStatePrevTimeStep", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Get the mandatory input tensors:
*3e777be0SXin Li
*3e777be0SXin Li    // 02: The input-to-forget weights: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, input_size].
*3e777be0SXin Li    const ConstTensorPin inputToForgetWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 2, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 03: The input-to-cell weights: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    // [num_units, input_size].
*3e777be0SXin Li    const ConstTensorPin inputToCellWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 3, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 04: The input-to-output weights: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, input_size].
*3e777be0SXin Li    const ConstTensorPin inputToOutputWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 4, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 06: The recurrent-to-forget weights: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, output_size].
*3e777be0SXin Li    const ConstTensorPin recurrentToForgetWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 6, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 07: The recurrent-to-cell weights: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, output_size].
*3e777be0SXin Li    const ConstTensorPin recurrentToCellWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 7, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 08: The recurrent-to-output weights: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, output_size].
*3e777be0SXin Li    const ConstTensorPin recurrentToOutputWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 8, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 13: The forget gate bias: A 1-D tensor of ANEURALNETWORKS_TENSOR_INT32, of shape [num_units].
*3e777be0SXin Li    const ConstTensorPin forgetGateBiasPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 13, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 14: The cell bias: A 1-D tensor of ANEURALNETWORKS_TENSOR_INT32, of shape [num_units].
*3e777be0SXin Li    const ConstTensorPin cellBiasPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 14, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    // 15: The output gate bias: A 1-D tensor of ANEURALNETWORKS_TENSOR_INT32, of shape [num_units].
*3e777be0SXin Li    const ConstTensorPin outputGateBiasPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation, 15, model, data);
*3e777be0SXin Li
*3e777be0SXin Li    if (!inputToForgetWeightsPin.IsValid() ||
*3e777be0SXin Li        !inputToCellWeightsPin.IsValid() ||
*3e777be0SXin Li        !inputToOutputWeightsPin.IsValid() ||
*3e777be0SXin Li        !recurrentToForgetWeightsPin.IsValid() ||
*3e777be0SXin Li        !recurrentToCellWeightsPin.IsValid() ||
*3e777be0SXin Li        !recurrentToOutputWeightsPin.IsValid() ||
*3e777be0SXin Li        !forgetGateBiasPin.IsValid() ||
*3e777be0SXin Li        !cellBiasPin.IsValid() ||
*3e777be0SXin Li        !outputGateBiasPin.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid tensor inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Get the optional input tensors:
*3e777be0SXin Li
*3e777be0SXin Li    // 01: The input-to-input weights: Optional. A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, input_size], where “num_units” corresponds to the number of cell units.
*3e777be0SXin Li    const ConstTensorPin inputToInputWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         1,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 05: The recurrent-to-input weights: Optional. A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [num_units, output_size], where “output_size” corresponds to either the number of cell units (i.e.,
*3e777be0SXin Li    //     “num_units”), or the second dimension of the “projection_weights”, if defined.
*3e777be0SXin Li    const ConstTensorPin recurrentToInputWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         5,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 09: The cell-to-input weights: Optional. A 1-D tensor of ANEURALNETWORKS_TENSOR_QUANT16_SYMM, of shape
*3e777be0SXin Li    // [num_units].
*3e777be0SXin Li    const ConstTensorPin cellToInputWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         9,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 10: The cell-to-forget weights: Optional. A 1-D tensor of ANEURALNETWORKS_TENSOR_QUANT16_SYMM, of shape
*3e777be0SXin Li    // [num_units].
*3e777be0SXin Li    const ConstTensorPin cellToForgetWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         10,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 11: The cell-to-output weights: Optional. A 1-D tensor of ANEURALNETWORKS_TENSOR_QUANT16_SYMM, of shape
*3e777be0SXin Li    // [num_units].
*3e777be0SXin Li    const ConstTensorPin cellToOutputWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         11,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 12: The input gate bias: Optional. A 1-D tensor of ANEURALNETWORKS_TENSOR_INT32, of shape [num_units].
*3e777be0SXin Li    const ConstTensorPin inputGateBiasPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         12,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 16: The projection weights: Optional. A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_SYMM, of shape
*3e777be0SXin Li    //     [output_size, num_units].
*3e777be0SXin Li    const ConstTensorPin projectionWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         16,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 17: The projection bias: Optional. A 1-D tensor of ANEURALNETWORKS_TENSOR_INT32, of shape [output_size].
*3e777be0SXin Li    const ConstTensorPin projectionBiasPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         17,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    if ((!inputToInputWeightsPin.IsValid() && !inputToInputWeightsPin.IsOptional())
*3e777be0SXin Li        || (!recurrentToInputWeightsPin.IsValid() && !recurrentToInputWeightsPin.IsOptional())
*3e777be0SXin Li        || (!cellToInputWeightsPin.IsValid() && !cellToInputWeightsPin.IsOptional())
*3e777be0SXin Li        || (!cellToForgetWeightsPin.IsValid() && !cellToForgetWeightsPin.IsOptional())
*3e777be0SXin Li        || (!cellToOutputWeightsPin.IsValid() && !cellToOutputWeightsPin.IsOptional())
*3e777be0SXin Li        || (!inputGateBiasPin.IsValid() && !inputGateBiasPin.IsOptional())
*3e777be0SXin Li        || (!projectionWeightsPin.IsValid() && !projectionWeightsPin.IsOptional())
*3e777be0SXin Li        || (!projectionBiasPin.IsValid() && !projectionBiasPin.IsOptional()))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid tensor inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    // Get the optional normalization tensors
*3e777be0SXin Li
*3e777be0SXin Li    // 20: The input layer normalization weights. A 1-D tensor of shape [num_units] ANEURALNETWORKS_TENSOR_QUANT16_SYMM.
*3e777be0SXin Li    //     Used to rescale normalized inputs to activation at input gate.
*3e777be0SXin Li    const ConstTensorPin inputLayerNormWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         20,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 21: The forget layer normalization weights. A 1-D tensor of shape [num_units] ANEURALNETWORKS_TENSOR_QUANT16_SYMM
*3e777be0SXin Li    //     Used to rescale normalized inputs to activation at forget gate.
*3e777be0SXin Li    const ConstTensorPin forgetLayerNormWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         21,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 22: The cell layer normalization weights. A 1-D tensor of shape [num_units] ANEURALNETWORKS_TENSOR_QUANT16_SYMM.
*3e777be0SXin Li    //     Used to rescale normalized inputs to activation at cell gate.
*3e777be0SXin Li    const ConstTensorPin cellLayerNormWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         22,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    // 23: The output layer normalization weights. A 1-D tensor of shape [num_units].
*3e777be0SXin Li    //     Used to rescale normalized inputs to activation at output gate.
*3e777be0SXin Li    const ConstTensorPin outputLayerNormWeightsPin =
*3e777be0SXin Li        ConvertOperationInputToConstTensorPin<HalPolicy>(operation,
*3e777be0SXin Li                                                         23,
*3e777be0SXin Li                                                         model,
*3e777be0SXin Li                                                         data,
*3e777be0SXin Li                                                         g_DontPermute,
*3e777be0SXin Li                                                         nullptr,
*3e777be0SXin Li                                                         true);
*3e777be0SXin Li
*3e777be0SXin Li    if ((!inputLayerNormWeightsPin.IsValid() && !inputLayerNormWeightsPin.IsOptional())
*3e777be0SXin Li        || (!forgetLayerNormWeightsPin.IsValid() && !forgetLayerNormWeightsPin.IsOptional())
*3e777be0SXin Li        || (!cellLayerNormWeightsPin.IsValid() && !cellLayerNormWeightsPin.IsOptional())
*3e777be0SXin Li        || (!outputLayerNormWeightsPin.IsValid() && !outputLayerNormWeightsPin.IsOptional()))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid tensor inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Get the optional input scalars:
*3e777be0SXin Li    // 24: The cell clip:  If provided the cell state is clipped by this value prior to the cell output activation.
*3e777be0SXin Li    // 25: The projection clip: If provided and projection is enabled, this is used for clipping the projected values.
*3e777be0SXin Li
*3e777be0SXin Li    // Get the mandatory input scalars:
*3e777be0SXin Li    // 26: The scale of the intermediate result of matmul, i.e. input to layer normalization, at input gate.
*3e777be0SXin Li    // 27: The scale of the intermediate result of matmul, i.e. input to layer normalization, at forget gate.
*3e777be0SXin Li    // 28: The scale of the intermediate result of matmul, i.e. input to layer normalization, at cell gate.
*3e777be0SXin Li    // 29: The scale of the intermediate result of matmul, i.e. input to layer normalization, at output gate.
*3e777be0SXin Li    // 30: The zero point of the hidden state, i.e. input to projection.
*3e777be0SXin Li    // 31: The scale of the hidden state, i.e. input to projection.
*3e777be0SXin Li    float cellClip, projClip, matMulInputGate, matMulForgetGate, matMulCellGate, matMulOutputGate, projInputScale;
*3e777be0SXin Li    int projInputZeroPoint;
*3e777be0SXin Li
*3e777be0SXin Li    if (!GetInputScalar<HalPolicy>(operation, 24, HalOperandType::FLOAT32, cellClip, model, data, true) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 25, HalOperandType::FLOAT32, projClip, model, data, true) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 26, HalOperandType::FLOAT32, matMulInputGate, model, data) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 27, HalOperandType::FLOAT32, matMulForgetGate, model, data) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 28, HalOperandType::FLOAT32, matMulCellGate, model, data) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 29, HalOperandType::FLOAT32, matMulOutputGate, model, data) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 30, HalOperandType::INT32, projInputZeroPoint, model, data) ||
*3e777be0SXin Li        !GetInputScalar<HalPolicy>(operation, 31, HalOperandType::FLOAT32, projInputScale, model, data))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid scalar inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Outputs:
*3e777be0SXin Li    // 0: The output state (out): A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_ASYMM_SIGNED, of shape [batch_size,
*3e777be0SXin Li    // output_size].
*3e777be0SXin Li    const HalOperand* outputStateOut = GetOutputOperand<HalPolicy>(operation, 0, model);
*3e777be0SXin Li    if (!outputStateOut)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read output 0: outputStateOut", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // 1: The cell state (out): A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT16_SYMM, of shape [batch_size, num_units].
*3e777be0SXin Li    const HalOperand* cellStateOut = GetOutputOperand<HalPolicy>(operation, 1, model);
*3e777be0SXin Li    if (!cellStateOut)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read output 1: cellStateOut", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // 2: The output: A 2-D tensor of ANEURALNETWORKS_TENSOR_QUANT8_ASYMM_SIGNED, of shape [batch_size, output_size].
*3e777be0SXin Li    // This is effectively the same as the current “output state (out)” value.
*3e777be0SXin Li    const HalOperand* output = GetOutputOperand<HalPolicy>(operation, 2, model);
*3e777be0SXin Li    if (!output)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read output 2: output", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // set the params structure for the AddLstmLayer call
*3e777be0SXin Li    LstmInputParams params;
*3e777be0SXin Li    params.m_InputToInputWeights = inputToInputWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_InputToForgetWeights = inputToForgetWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_InputToCellWeights = inputToCellWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_InputToOutputWeights = inputToOutputWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_RecurrentToInputWeights = recurrentToInputWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_RecurrentToForgetWeights = recurrentToForgetWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_RecurrentToCellWeights = recurrentToCellWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_RecurrentToOutputWeights = recurrentToOutputWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_CellToInputWeights = cellToInputWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_CellToForgetWeights = cellToForgetWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_CellToOutputWeights = cellToOutputWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_InputGateBias = inputGateBiasPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_ForgetGateBias = forgetGateBiasPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_CellBias = cellBiasPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_OutputGateBias = outputGateBiasPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_ProjectionWeights = projectionWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_ProjectionBias = projectionBiasPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_InputLayerNormWeights = inputLayerNormWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_ForgetLayerNormWeights = forgetLayerNormWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_CellLayerNormWeights = cellLayerNormWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li    params.m_OutputLayerNormWeights = outputLayerNormWeightsPin.GetConstTensorPtr();
*3e777be0SXin Li
*3e777be0SXin Li    // set the layer descriptor
*3e777be0SXin Li    QLstmDescriptor desc;
*3e777be0SXin Li    desc.m_CellClip = cellClip;
*3e777be0SXin Li    desc.m_ProjectionClip = projClip;
*3e777be0SXin Li    desc.m_CifgEnabled = (params.m_InputToInputWeights == nullptr ||
*3e777be0SXin Li                          params.m_RecurrentToInputWeights == nullptr ||
*3e777be0SXin Li                          params.m_InputGateBias == nullptr);
*3e777be0SXin Li    desc.m_PeepholeEnabled = (params.m_CellToForgetWeights != nullptr ||
*3e777be0SXin Li                              params.m_CellToOutputWeights != nullptr);
*3e777be0SXin Li    desc.m_ProjectionEnabled = (params.m_ProjectionWeights != nullptr);
*3e777be0SXin Li    desc.m_LayerNormEnabled = (params.m_InputLayerNormWeights != nullptr ||
*3e777be0SXin Li                               params.m_ForgetLayerNormWeights != nullptr ||
*3e777be0SXin Li                               params.m_CellLayerNormWeights != nullptr ||
*3e777be0SXin Li                               params.m_OutputLayerNormWeights != nullptr);
*3e777be0SXin Li    desc.m_InputIntermediateScale = matMulInputGate;
*3e777be0SXin Li    desc.m_ForgetIntermediateScale = matMulForgetGate;
*3e777be0SXin Li    desc.m_CellIntermediateScale = matMulCellGate;
*3e777be0SXin Li    desc.m_OutputIntermediateScale = matMulOutputGate;
*3e777be0SXin Li    desc.m_HiddenStateScale = projInputScale;
*3e777be0SXin Li    desc.m_HiddenStateZeroPoint = projInputZeroPoint;
*3e777be0SXin Li
*3e777be0SXin Li    // validate the optional input groups
*3e777be0SXin Li    if (desc.m_CifgEnabled &&
*3e777be0SXin Li        (params.m_InputToInputWeights != nullptr ||
*3e777be0SXin Li         params.m_RecurrentToInputWeights != nullptr ||
*3e777be0SXin Li         params.m_InputGateBias != nullptr))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: All, or none, of input-to-input weights, recurrent-to-input weights,"
*3e777be0SXin Li                    " and input gate bias must be provided", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!desc.m_ProjectionEnabled && params.m_ProjectionBias != nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: projection bias should not be provided without projection weights", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (desc.m_PeepholeEnabled &&
*3e777be0SXin Li        (params.m_CellToForgetWeights == nullptr ||
*3e777be0SXin Li         params.m_CellToOutputWeights == nullptr ||
*3e777be0SXin Li         (!desc.m_CifgEnabled && params.m_CellToInputWeights == nullptr)))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: All, or none, of cell-to-forget weights and cell-to-output weights must be provided"
*3e777be0SXin Li                    " and, if CIFG is not enabled, cell-to-input weights must also be provided", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (desc.m_LayerNormEnabled &&
*3e777be0SXin Li        (params.m_ForgetLayerNormWeights == nullptr ||
*3e777be0SXin Li         params.m_CellLayerNormWeights == nullptr ||
*3e777be0SXin Li         params.m_OutputLayerNormWeights == nullptr ||
*3e777be0SXin Li         (!desc.m_CifgEnabled && params.m_InputLayerNormWeights == nullptr)))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: All, or none, of forget-norm weights, cell-norm weights and output-norm weights must be"
*3e777be0SXin Li                    " provided and, if CIFG is not enabled, input-norm weights must also be provided", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    // Basic parameters
*3e777be0SXin Li    LstmInputParamsInfo paramsInfo;
*3e777be0SXin Li    paramsInfo.m_InputToForgetWeights     = &(params.m_InputToForgetWeights->GetInfo());
*3e777be0SXin Li    paramsInfo.m_InputToCellWeights       = &(params.m_InputToCellWeights->GetInfo());
*3e777be0SXin Li    paramsInfo.m_InputToOutputWeights     = &(params.m_InputToOutputWeights->GetInfo());
*3e777be0SXin Li    paramsInfo.m_RecurrentToForgetWeights = &(params.m_RecurrentToForgetWeights->GetInfo());
*3e777be0SXin Li    paramsInfo.m_RecurrentToCellWeights   = &(params.m_RecurrentToCellWeights->GetInfo());
*3e777be0SXin Li    paramsInfo.m_RecurrentToOutputWeights = &(params.m_RecurrentToOutputWeights->GetInfo());
*3e777be0SXin Li    paramsInfo.m_ForgetGateBias           = &(params.m_ForgetGateBias->GetInfo());
*3e777be0SXin Li    paramsInfo.m_CellBias                 = &(params.m_CellBias->GetInfo());
*3e777be0SXin Li    paramsInfo.m_OutputGateBias           = &(params.m_OutputGateBias->GetInfo());
*3e777be0SXin Li
*3e777be0SXin Li    // Inputs
*3e777be0SXin Li    const TensorInfo& inputInfo = input.GetTensorInfo();
*3e777be0SXin Li    const TensorInfo& outputStatePrevTimeStepInfo = outputStatePrevTimeStep.GetTensorInfo();
*3e777be0SXin Li    const TensorInfo& cellStatePrevTimeStepInfo = cellStatePrevTimeStep.GetTensorInfo();
*3e777be0SXin Li
*3e777be0SXin Li    // Outputs
*3e777be0SXin Li    TensorInfo outputStateOutInfo = GetTensorInfoForOperand(*outputStateOut);
*3e777be0SXin Li    TensorInfo outputInfo = GetTensorInfoForOperand(*output);
*3e777be0SXin Li    const TensorInfo& cellStateOutInfo = GetTensorInfoForOperand(*cellStateOut);
*3e777be0SXin Li
*3e777be0SXin Li    // Optional parameters
*3e777be0SXin Li    if (!desc.m_CifgEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        paramsInfo.m_InputToInputWeights = &(params.m_InputToInputWeights->GetInfo());
*3e777be0SXin Li        paramsInfo.m_RecurrentToInputWeights = &(params.m_RecurrentToInputWeights->GetInfo());
*3e777be0SXin Li        if (desc.m_PeepholeEnabled)
*3e777be0SXin Li        {
*3e777be0SXin Li            paramsInfo.m_CellToInputWeights = &(params.m_CellToInputWeights->GetInfo());
*3e777be0SXin Li        }
*3e777be0SXin Li        paramsInfo.m_InputGateBias = &(params.m_InputGateBias->GetInfo());
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li
*3e777be0SXin Li    if (desc.m_ProjectionEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        paramsInfo.m_ProjectionWeights = &(params.m_ProjectionWeights->GetInfo());
*3e777be0SXin Li        if (params.m_ProjectionBias != nullptr)
*3e777be0SXin Li        {
*3e777be0SXin Li            paramsInfo.m_ProjectionBias = &(params.m_ProjectionBias->GetInfo());
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        // If Projection is disabled, override non-const outputs to change the quant info with hidden params, then
*3e777be0SXin Li        // create a new const TensorInfo based on this
*3e777be0SXin Li        outputStateOutInfo.SetQuantizationScale(projInputScale);
*3e777be0SXin Li        outputStateOutInfo.SetQuantizationOffset(projInputZeroPoint);
*3e777be0SXin Li        outputInfo.SetQuantizationScale(projInputScale);
*3e777be0SXin Li        outputInfo.SetQuantizationOffset(projInputZeroPoint);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    const TensorInfo constOutputStateOutInfo(outputStateOutInfo);
*3e777be0SXin Li    const TensorInfo constOutputInfo(outputInfo);
*3e777be0SXin Li
*3e777be0SXin Li    if (desc.m_PeepholeEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        paramsInfo.m_CellToForgetWeights = &(params.m_CellToForgetWeights->GetInfo());
*3e777be0SXin Li        paramsInfo.m_CellToOutputWeights = &(params.m_CellToOutputWeights->GetInfo());
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (desc.m_LayerNormEnabled)
*3e777be0SXin Li    {
*3e777be0SXin Li        if(!desc.m_CifgEnabled)
*3e777be0SXin Li        {
*3e777be0SXin Li            paramsInfo.m_InputLayerNormWeights = &(params.m_InputLayerNormWeights->GetInfo());
*3e777be0SXin Li        }
*3e777be0SXin Li        paramsInfo.m_ForgetLayerNormWeights = &(params.m_ForgetLayerNormWeights->GetInfo());
*3e777be0SXin Li        paramsInfo.m_CellLayerNormWeights = &(params.m_CellLayerNormWeights->GetInfo());
*3e777be0SXin Li        paramsInfo.m_OutputLayerNormWeights = &(params.m_OutputLayerNormWeights->GetInfo());
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Check if the layer is supported
*3e777be0SXin Li    bool isSupported = false;
*3e777be0SXin Li    armnn::BackendId setBackend;
*3e777be0SXin Li    auto validateFunc = [&](const armnn::TensorInfo& cellStateOutInfo, bool& isSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        FORWARD_LAYER_SUPPORT_FUNC(__func__,
*3e777be0SXin Li                                   IsQLstmSupported,
*3e777be0SXin Li                                   data.m_Backends,
*3e777be0SXin Li                                   isSupported,
*3e777be0SXin Li                                   setBackend,
*3e777be0SXin Li                                   inputInfo,
*3e777be0SXin Li                                   outputStatePrevTimeStepInfo,
*3e777be0SXin Li                                   cellStatePrevTimeStepInfo,
*3e777be0SXin Li                                   constOutputStateOutInfo,
*3e777be0SXin Li                                   cellStateOutInfo,
*3e777be0SXin Li                                   constOutputInfo,
*3e777be0SXin Li                                   desc,
*3e777be0SXin Li                                   paramsInfo);
*3e777be0SXin Li    };
*3e777be0SXin Li
*3e777be0SXin Li    bool isDynamic = false;
*3e777be0SXin Li    if (!IsDynamicTensor(constOutputStateOutInfo) &&
*3e777be0SXin Li        !IsDynamicTensor(cellStateOutInfo)  &&
*3e777be0SXin Li        !IsDynamicTensor(constOutputInfo))
*3e777be0SXin Li    {
*3e777be0SXin Li        validateFunc(outputInfo, isSupported);
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        isDynamic = true;
*3e777be0SXin Li        isSupported = AreDynamicTensorsSupported();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!isSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        return false;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Add the layer
*3e777be0SXin Li    IConnectableLayer* layer = data.m_Network->AddQLstmLayer(desc, params, "QLstm");
*3e777be0SXin Li    layer->SetBackendId(setBackend);
*3e777be0SXin Li
*3e777be0SXin Li    input.Connect(layer->GetInputSlot(0));
*3e777be0SXin Li    outputStatePrevTimeStep.Connect(layer->GetInputSlot(1));
*3e777be0SXin Li    cellStatePrevTimeStep.Connect(layer->GetInputSlot(2));
*3e777be0SXin Li
*3e777be0SXin Li    if (!isDynamic)
*3e777be0SXin Li    {
*3e777be0SXin Li        return ( SetupAndTrackLayerOutputSlot<HalPolicy>(
*3e777be0SXin Li                       operation, 0, *layer, 0, model, data, &constOutputStateOutInfo) &&
*3e777be0SXin Li                 SetupAndTrackLayerOutputSlot<HalPolicy>(operation, 1, *layer, 1, model, data) &&
*3e777be0SXin Li                 SetupAndTrackLayerOutputSlot<HalPolicy>(operation, 2, *layer, 2, model, data, &constOutputInfo));
*3e777be0SXin Li    }
*3e777be0SXin Li    else
*3e777be0SXin Li    {
*3e777be0SXin Li        return ( SetupAndTrackLayerOutputSlot<HalPolicy>(
*3e777be0SXin Li                       operation, 0, *layer, 0, model, data, &constOutputStateOutInfo) &&
*3e777be0SXin Li                 SetupAndTrackLayerOutputSlot<HalPolicy>(
*3e777be0SXin Li                       operation, 1, *layer, 1, model, data, nullptr, validateFunc,
*3e777be0SXin Li                       ActivationFn::kActivationNone, true) &&
*3e777be0SXin Li                 SetupAndTrackLayerOutputSlot<HalPolicy>(operation, 2, *layer, 2, model, data, &constOutputInfo));
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy,
*3e777be0SXin Li         typename HalOperation = typename HalPolicy::Operation,
*3e777be0SXin Li         typename HalModel     = typename HalPolicy::Model>
*3e777be0SXin Libool ConvertRank(const HalOperation& operation, const HalModel& model, ConversionData& data)
*3e777be0SXin Li{
*3e777be0SXin Li    using HalOperand = typename HalPolicy::Operand;
*3e777be0SXin Li
*3e777be0SXin Li    const HalOperand* inputOperand = GetInputOperand<HalPolicy>(operation, 0, model);
*3e777be0SXin Li    const HalOperand* outputOperand = GetOutputOperand<HalPolicy>(operation, 0, model);
*3e777be0SXin Li
*3e777be0SXin Li    if (inputOperand == nullptr || outputOperand == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Operation has invalid inputs", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    const Shape inputOperandShape = GetOperandShape(*inputOperand);
*3e777be0SXin Li    const Shape outputOperandShape = GetOperandShape(*outputOperand);
*3e777be0SXin Li
*3e777be0SXin Li    LayerInputHandle input = ConvertToLayerInputHandle<HalPolicy>(operation, 0, model, data);
*3e777be0SXin Li    if (!input.IsValid())
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not read input 0", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    armnn::TensorInfo outInfo = GetTensorInfoForOperand(*outputOperand);
*3e777be0SXin Li    if (IsDynamicTensor(outInfo))
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Dynamic output tensors are not supported", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    bool isSupported = false;
*3e777be0SXin Li    armnn::BackendId setBackend;
*3e777be0SXin Li    FORWARD_LAYER_SUPPORT_FUNC(__func__,
*3e777be0SXin Li                               IsRankSupported,
*3e777be0SXin Li                               data.m_Backends,
*3e777be0SXin Li                               isSupported,
*3e777be0SXin Li                               setBackend,
*3e777be0SXin Li                               input.GetTensorInfo(),
*3e777be0SXin Li                               outInfo);
*3e777be0SXin Li    if (!isSupported)
*3e777be0SXin Li    {
*3e777be0SXin Li        return false;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    armnn::IConnectableLayer* layer = data.m_Network->AddRankLayer();
*3e777be0SXin Li    layer->SetBackendId(setBackend);
*3e777be0SXin Li    if (!layer)
*3e777be0SXin Li    {
*3e777be0SXin Li        return Fail("%s: Could not add the RankLayer", __func__);
*3e777be0SXin Li    }
*3e777be0SXin Li    input.Connect(layer->GetInputSlot(0));
*3e777be0SXin Li
*3e777be0SXin Li    return SetupAndTrackLayerOutputSlot<HalPolicy>(operation, 0, *layer, model, data, &outInfo);
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li} // armnn_driver namespace