external/android-nn-driver/ArmnnDriverImpl.cpp

*3e777be0SXin Li//
*3e777be0SXin Li// Copyright © 2017, 2023 Arm Ltd. All rights reserved.
*3e777be0SXin Li// SPDX-License-Identifier: MIT
*3e777be0SXin Li//
*3e777be0SXin Li
*3e777be0SXin Li#define LOG_TAG "ArmnnDriver"
*3e777be0SXin Li
*3e777be0SXin Li#include "ArmnnDriverImpl.hpp"
*3e777be0SXin Li#include "ArmnnPreparedModel.hpp"
*3e777be0SXin Li
*3e777be0SXin Li#if defined(ARMNN_ANDROID_NN_V1_2) || defined(ARMNN_ANDROID_NN_V1_3) // Using ::android::hardware::neuralnetworks::V1_2
*3e777be0SXin Li#include "ArmnnPreparedModel_1_2.hpp"
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Li#ifdef ARMNN_ANDROID_NN_V1_3 // Using ::android::hardware::neuralnetworks::V1_2
*3e777be0SXin Li#include "ArmnnPreparedModel_1_3.hpp"
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Li#include "Utils.hpp"
*3e777be0SXin Li
*3e777be0SXin Li#include "ModelToINetworkConverter.hpp"
*3e777be0SXin Li#include "SystemPropertiesUtils.hpp"
*3e777be0SXin Li
*3e777be0SXin Li#include <ValidateHal.h>
*3e777be0SXin Li#include <log/log.h>
*3e777be0SXin Li#include <chrono>
*3e777be0SXin Li
*3e777be0SXin Liusing namespace std;
*3e777be0SXin Liusing namespace android;
*3e777be0SXin Liusing namespace android::nn;
*3e777be0SXin Liusing namespace android::hardware;
*3e777be0SXin Li
*3e777be0SXin Linamespace
*3e777be0SXin Li{
*3e777be0SXin Li
*3e777be0SXin Livoid NotifyCallbackAndCheck(const sp<V1_0::IPreparedModelCallback>& callback,
*3e777be0SXin Li                            V1_0::ErrorStatus errorStatus,
*3e777be0SXin Li                            const sp<V1_0::IPreparedModel>& preparedModelPtr)
*3e777be0SXin Li{
*3e777be0SXin Li    Return<void> returned = callback->notify(errorStatus, preparedModelPtr);
*3e777be0SXin Li    // This check is required, if the callback fails and it isn't checked it will bring down the service
*3e777be0SXin Li    if (!returned.isOk())
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGE("ArmnnDriverImpl::prepareModel: hidl callback failed to return properly: %s ",
*3e777be0SXin Li              returned.description().c_str());
*3e777be0SXin Li    }
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin LiReturn<V1_0::ErrorStatus> FailPrepareModel(V1_0::ErrorStatus error,
*3e777be0SXin Li                                           const string& message,
*3e777be0SXin Li                                           const sp<V1_0::IPreparedModelCallback>& callback)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGW("ArmnnDriverImpl::prepareModel: %s", message.c_str());
*3e777be0SXin Li    NotifyCallbackAndCheck(callback, error, nullptr);
*3e777be0SXin Li    return error;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li} // namespace
*3e777be0SXin Li
*3e777be0SXin Linamespace armnn_driver
*3e777be0SXin Li{
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy>
*3e777be0SXin LiReturn<V1_0::ErrorStatus> ArmnnDriverImpl<HalPolicy>::prepareModel(
*3e777be0SXin Li        const armnn::IRuntimePtr& runtime,
*3e777be0SXin Li        const armnn::IGpuAccTunedParametersPtr& clTunedParameters,
*3e777be0SXin Li        const DriverOptions& options,
*3e777be0SXin Li        const HalModel& model,
*3e777be0SXin Li        const sp<V1_0::IPreparedModelCallback>& cb,
*3e777be0SXin Li        bool float32ToFloat16)
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnDriverImpl::prepareModel()");
*3e777be0SXin Li
*3e777be0SXin Li    std::chrono::time_point<std::chrono::system_clock> prepareModelTimepoint = std::chrono::system_clock::now();
*3e777be0SXin Li
*3e777be0SXin Li    if (cb.get() == nullptr)
*3e777be0SXin Li    {
*3e777be0SXin Li        ALOGW("ArmnnDriverImpl::prepareModel: Invalid callback passed to prepareModel");
*3e777be0SXin Li        return V1_0::ErrorStatus::INVALID_ARGUMENT;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!runtime)
*3e777be0SXin Li    {
*3e777be0SXin Li        return FailPrepareModel(V1_0::ErrorStatus::DEVICE_UNAVAILABLE, "Device unavailable", cb);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    if (!android::nn::validateModel(model))
*3e777be0SXin Li    {
*3e777be0SXin Li        return FailPrepareModel(V1_0::ErrorStatus::INVALID_ARGUMENT, "Invalid model passed as input", cb);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Deliberately ignore any unsupported operations requested by the options -
*3e777be0SXin Li    // at this point we're being asked to prepare a model that we've already declared support for
*3e777be0SXin Li    // and the operation indices may be different to those in getSupportedOperations anyway.
*3e777be0SXin Li    set<unsigned int> unsupportedOperations;
*3e777be0SXin Li    ModelToINetworkConverter<HalPolicy> modelConverter(options.GetBackends(),
*3e777be0SXin Li                                                       model,
*3e777be0SXin Li                                                       unsupportedOperations);
*3e777be0SXin Li
*3e777be0SXin Li    if (modelConverter.GetConversionResult() != ConversionResult::Success)
*3e777be0SXin Li    {
*3e777be0SXin Li        FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "ModelToINetworkConverter failed", cb);
*3e777be0SXin Li        return V1_0::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Serialize the network graph to a .armnn file if an output directory
*3e777be0SXin Li    // has been specified in the drivers' arguments.
*3e777be0SXin Li    std::vector<uint8_t> dataCacheData;
*3e777be0SXin Li    auto serializedNetworkFileName =
*3e777be0SXin Li        SerializeNetwork(*modelConverter.GetINetwork(),
*3e777be0SXin Li                         options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                         dataCacheData,
*3e777be0SXin Li                         false);
*3e777be0SXin Li
*3e777be0SXin Li    // Optimize the network
*3e777be0SXin Li    armnn::IOptimizedNetworkPtr optNet(nullptr, nullptr);
*3e777be0SXin Li    armnn::OptimizerOptionsOpaque OptOptions;
*3e777be0SXin Li    OptOptions.SetReduceFp32ToFp16(float32ToFloat16);
*3e777be0SXin Li
*3e777be0SXin Li    armnn::BackendOptions gpuAcc("GpuAcc",
*3e777be0SXin Li    {
*3e777be0SXin Li        { "FastMathEnabled", options.IsFastMathEnabled() },
*3e777be0SXin Li        { "SaveCachedNetwork", options.SaveCachedNetwork() },
*3e777be0SXin Li        { "CachedNetworkFilePath", options.GetCachedNetworkFilePath() },
*3e777be0SXin Li        { "MLGOTuningFilePath", options.GetClMLGOTunedParametersFile() }
*3e777be0SXin Li
*3e777be0SXin Li    });
*3e777be0SXin Li
*3e777be0SXin Li    armnn::BackendOptions cpuAcc("CpuAcc",
*3e777be0SXin Li    {
*3e777be0SXin Li        { "FastMathEnabled", options.IsFastMathEnabled() },
*3e777be0SXin Li        { "NumberOfThreads", options.GetNumberOfThreads() }
*3e777be0SXin Li    });
*3e777be0SXin Li    OptOptions.AddModelOption(gpuAcc);
*3e777be0SXin Li    OptOptions.AddModelOption(cpuAcc);
*3e777be0SXin Li
*3e777be0SXin Li    std::vector<std::string> errMessages;
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        optNet = armnn::Optimize(*modelConverter.GetINetwork(),
*3e777be0SXin Li                                 options.GetBackends(),
*3e777be0SXin Li                                 runtime->GetDeviceSpec(),
*3e777be0SXin Li                                 OptOptions,
*3e777be0SXin Li                                 errMessages);
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception &e)
*3e777be0SXin Li    {
*3e777be0SXin Li        stringstream message;
*3e777be0SXin Li        message << "Exception (" << e.what() << ") caught from optimize.";
*3e777be0SXin Li        FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_0::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Check that the optimized network is valid.
*3e777be0SXin Li    if (!optNet)
*3e777be0SXin Li    {
*3e777be0SXin Li        stringstream message;
*3e777be0SXin Li        message << "Invalid optimized network";
*3e777be0SXin Li        for (const string& msg : errMessages)
*3e777be0SXin Li        {
*3e777be0SXin Li            message << "\n" << msg;
*3e777be0SXin Li        }
*3e777be0SXin Li        FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_0::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Export the optimized network graph to a dot file if an output dump directory
*3e777be0SXin Li    // has been specified in the drivers' arguments.
*3e777be0SXin Li    std::string dotGraphFileName = ExportNetworkGraphToDotFile(*optNet, options.GetRequestInputsAndOutputsDumpDir());
*3e777be0SXin Li
*3e777be0SXin Li    // Load it into the runtime.
*3e777be0SXin Li    armnn::NetworkId netId = 0;
*3e777be0SXin Li    std::string msg;
*3e777be0SXin Li    armnn::INetworkProperties networkProperties(options.isAsyncModelExecutionEnabled(),
*3e777be0SXin Li                                                armnn::MemorySource::Undefined,
*3e777be0SXin Li                                                armnn::MemorySource::Undefined);
*3e777be0SXin Li
*3e777be0SXin Li    try
*3e777be0SXin Li    {
*3e777be0SXin Li        if (runtime->LoadNetwork(netId, move(optNet), msg, networkProperties) != armnn::Status::Success)
*3e777be0SXin Li        {
*3e777be0SXin Li            return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Network could not be loaded", cb);
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    catch (std::exception& e)
*3e777be0SXin Li    {
*3e777be0SXin Li        stringstream message;
*3e777be0SXin Li        message << "Exception (" << e.what()<< ") caught from LoadNetwork.";
*3e777be0SXin Li        FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, message.str(), cb);
*3e777be0SXin Li        return V1_0::ErrorStatus::NONE;
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Now that we have a networkId for the graph rename the exported files to use it
*3e777be0SXin Li    // so that we can associate the graph file and the input/output tensor exported files
*3e777be0SXin Li    RenameExportedFiles(serializedNetworkFileName,
*3e777be0SXin Li                        dotGraphFileName,
*3e777be0SXin Li                        options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                        netId);
*3e777be0SXin Li
*3e777be0SXin Li    sp<ArmnnPreparedModel<HalPolicy>> preparedModel(
*3e777be0SXin Li            new ArmnnPreparedModel<HalPolicy>(
*3e777be0SXin Li                    netId,
*3e777be0SXin Li                    runtime.get(),
*3e777be0SXin Li                    model,
*3e777be0SXin Li                    options.GetRequestInputsAndOutputsDumpDir(),
*3e777be0SXin Li                    options.IsGpuProfilingEnabled(),
*3e777be0SXin Li                    options.isAsyncModelExecutionEnabled(),
*3e777be0SXin Li                    options.getNoOfArmnnThreads(),
*3e777be0SXin Li                    options.isImportEnabled(),
*3e777be0SXin Li                    options.isExportEnabled()));
*3e777be0SXin Li
*3e777be0SXin Li    if (std::find(options.GetBackends().begin(),
*3e777be0SXin Li                  options.GetBackends().end(),
*3e777be0SXin Li                  armnn::Compute::GpuAcc) != options.GetBackends().end())
*3e777be0SXin Li    {
*3e777be0SXin Li        // Run a single 'dummy' inference of the model. This means that CL kernels will get compiled (and tuned if
*3e777be0SXin Li        // this is enabled) before the first 'real' inference which removes the overhead of the first inference.
*3e777be0SXin Li        if (!preparedModel->ExecuteWithDummyInputs())
*3e777be0SXin Li        {
*3e777be0SXin Li            return FailPrepareModel(V1_0::ErrorStatus::GENERAL_FAILURE, "Network could not be executed", cb);
*3e777be0SXin Li        }
*3e777be0SXin Li
*3e777be0SXin Li        if (clTunedParameters &&
*3e777be0SXin Li            options.GetClTunedParametersMode() == armnn::IGpuAccTunedParameters::Mode::UpdateTunedParameters)
*3e777be0SXin Li        {
*3e777be0SXin Li            // Now that we've done one inference the CL kernel parameters will have been tuned, so save the updated file
*3e777be0SXin Li            try
*3e777be0SXin Li            {
*3e777be0SXin Li                clTunedParameters->Save(options.GetClTunedParametersFile().c_str());
*3e777be0SXin Li            }
*3e777be0SXin Li            catch (std::exception& error)
*3e777be0SXin Li            {
*3e777be0SXin Li                ALOGE("ArmnnDriverImpl::prepareModel: Failed to save CL tuned parameters file '%s': %s",
*3e777be0SXin Li                      options.GetClTunedParametersFile().c_str(), error.what());
*3e777be0SXin Li            }
*3e777be0SXin Li        }
*3e777be0SXin Li    }
*3e777be0SXin Li    NotifyCallbackAndCheck(cb, V1_0::ErrorStatus::NONE, preparedModel);
*3e777be0SXin Li
*3e777be0SXin Li    ALOGV("ArmnnDriverImpl::prepareModel cache timing = %lld µs", std::chrono::duration_cast<std::chrono::microseconds>
*3e777be0SXin Li         (std::chrono::system_clock::now() - prepareModelTimepoint).count());
*3e777be0SXin Li
*3e777be0SXin Li    return V1_0::ErrorStatus::NONE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy>
*3e777be0SXin LiReturn<void> ArmnnDriverImpl<HalPolicy>::getSupportedOperations(const armnn::IRuntimePtr& runtime,
*3e777be0SXin Li                                                                const DriverOptions& options,
*3e777be0SXin Li                                                                const HalModel& model,
*3e777be0SXin Li                                                                HalGetSupportedOperations_cb cb)
*3e777be0SXin Li{
*3e777be0SXin Li    std::stringstream ss;
*3e777be0SXin Li    ss << "ArmnnDriverImpl::getSupportedOperations()";
*3e777be0SXin Li    std::string fileName;
*3e777be0SXin Li    std::string timestamp;
*3e777be0SXin Li    if (!options.GetRequestInputsAndOutputsDumpDir().empty())
*3e777be0SXin Li    {
*3e777be0SXin Li        ss << " : "
*3e777be0SXin Li           << options.GetRequestInputsAndOutputsDumpDir()
*3e777be0SXin Li           << "/"
*3e777be0SXin Li           << GetFileTimestamp()
*3e777be0SXin Li           << "_getSupportedOperations.txt";
*3e777be0SXin Li    }
*3e777be0SXin Li    ALOGV(ss.str().c_str());
*3e777be0SXin Li
*3e777be0SXin Li    if (!options.GetRequestInputsAndOutputsDumpDir().empty())
*3e777be0SXin Li    {
*3e777be0SXin Li        //dump the marker file
*3e777be0SXin Li        std::ofstream fileStream;
*3e777be0SXin Li        fileStream.open(fileName, std::ofstream::out | std::ofstream::trunc);
*3e777be0SXin Li        if (fileStream.good())
*3e777be0SXin Li        {
*3e777be0SXin Li            fileStream << timestamp << std::endl;
*3e777be0SXin Li        }
*3e777be0SXin Li        fileStream.close();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    vector<bool> result;
*3e777be0SXin Li
*3e777be0SXin Li    if (!runtime)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(HalErrorStatus::DEVICE_UNAVAILABLE, result);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Run general model validation, if this doesn't pass we shouldn't analyse the model anyway.
*3e777be0SXin Li    if (!android::nn::validateModel(model))
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(HalErrorStatus::INVALID_ARGUMENT, result);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Attempt to convert the model to an ArmNN input network (INetwork).
*3e777be0SXin Li    ModelToINetworkConverter<HalPolicy> modelConverter(options.GetBackends(),
*3e777be0SXin Li                                                       model,
*3e777be0SXin Li                                                       options.GetForcedUnsupportedOperations());
*3e777be0SXin Li
*3e777be0SXin Li    if (modelConverter.GetConversionResult() != ConversionResult::Success
*3e777be0SXin Li            && modelConverter.GetConversionResult() != ConversionResult::UnsupportedFeature)
*3e777be0SXin Li    {
*3e777be0SXin Li        cb(HalErrorStatus::GENERAL_FAILURE, result);
*3e777be0SXin Li        return Void();
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    // Check each operation if it was converted successfully and copy the flags
*3e777be0SXin Li    // into the result (vector<bool>) that we need to return to Android.
*3e777be0SXin Li    result.reserve(getMainModel(model).operations.size());
*3e777be0SXin Li    for (uint32_t operationIdx = 0;
*3e777be0SXin Li         operationIdx < getMainModel(model).operations.size();
*3e777be0SXin Li         ++operationIdx)
*3e777be0SXin Li    {
*3e777be0SXin Li        bool operationSupported = modelConverter.IsOperationSupported(operationIdx);
*3e777be0SXin Li        result.push_back(operationSupported);
*3e777be0SXin Li    }
*3e777be0SXin Li
*3e777be0SXin Li    cb(HalErrorStatus::NONE, result);
*3e777be0SXin Li    return Void();
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Litemplate<typename HalPolicy>
*3e777be0SXin LiReturn<V1_0::DeviceStatus> ArmnnDriverImpl<HalPolicy>::getStatus()
*3e777be0SXin Li{
*3e777be0SXin Li    ALOGV("ArmnnDriver::getStatus()");
*3e777be0SXin Li
*3e777be0SXin Li    return V1_0::DeviceStatus::AVAILABLE;
*3e777be0SXin Li}
*3e777be0SXin Li
*3e777be0SXin Li///
*3e777be0SXin Li/// Class template specializations
*3e777be0SXin Li///
*3e777be0SXin Li
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_0::HalPolicy>;
*3e777be0SXin Li
*3e777be0SXin Li#ifdef ARMNN_ANDROID_NN_V1_1
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_1::HalPolicy>;
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Li#ifdef ARMNN_ANDROID_NN_V1_2
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_1::HalPolicy>;
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_2::HalPolicy>;
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Li#ifdef ARMNN_ANDROID_NN_V1_3
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_1::HalPolicy>;
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_2::HalPolicy>;
*3e777be0SXin Litemplate class ArmnnDriverImpl<hal_1_3::HalPolicy>;
*3e777be0SXin Li#endif
*3e777be0SXin Li
*3e777be0SXin Li} // namespace armnn_driver