armnn常用接口

作者: 今宵花吹雪 | 来源:发表于2019-04-11 20:37 被阅读0次

参考链接:
https://www.arm.com/solutions/artificial-intelligence
https://developer.arm.com/ip-products/processors/machine-learning/arm-nn
https://github.com/Arm-software/armnn
http://www.elecfans.com/d/643409.html

armnn是arm公司推出的一项开源软件,可在基于arm的高性能平台上完成机器学习应用程序的构建和运行

armnn桥接了底层硬件和深度学习框架(tf, tf_lite, caffe, 等),可以在编程过程中选择用到的后台计算硬件(包括CPU,mali GPU或者arm的专用NPU)这样我们能够很方便地在嵌入式平台上搭建训练好的深度学习模型,并配合opencv或者其他开源框架构建完整的人工智能应用。

本文将大致总结一下用armnn来运行一个神经网络需要的步骤
需要包含的头文件

#include "armnn/ArmNN.hpp"
#include "armnn/Exceptions.hpp"
#include "armnn/Tensor.hpp"
#include "armnn/INetwork.hpp"
#include "armnnTfParser/ITfParser.hpp"

armnn运行一个神经网络的过程主要包括如下步骤:

  1. 读取模型,创建网络
armnnTfParser::ITfParserPtr parser = armnnTfParser::ITfParser::Create();
armnn::INetworkPtr network = parser->CreateNetworkFromBinaryFile(输入数据(指针),{{input_tensor_name, 输入tensor的size}},{output_tensor_name});

armnnTfParser::BindingPointInfo inputBindingInfo = parser->GetNetworkInputBindingInfo(input_tensor_name);
armnnTfParser::BindingPointInfo outputBindingInfo = parser->GetNetworkOutputBindingInfo(output_tensor_name);
  1. 配置运行参数,其中可以指定用到的后台,包括CPU,GPU。其中使用GPU能够明显提升神经网络运行速度,在RK3399平台上,对于一个基于resnet-18的语义分割网络(两个resnet-18正向反向相接,pb格式的模型大小约为90MB),使用GpuAcc选项运行时间大概在1.2s左右,使用CpuRef选项用时接近200s,而直接使用tensorflow for aarch64的python接口,运行时间在4s左右(可能是编译好的tensorflow for aarch64中使用了一些加速方法)。不过使用GPU存在的一个问题就是IO时间要比使用CPU长很多,如果跑一些小网络(比如lenet-5,使用CPU循环执行500000次用时16s,用GPU循环执行5000次同样用时16s)使用CPU来完成会更好。
armnn::IRuntime::CreationOptions options;
armnn::IRuntimePtr runtime = armnn::IRuntime::Create(options);
options.m_EnableGpuProfiling = false;
options.m_GpuAccTunedParameters = armnn::IGpuAccTunedParameters::Create(armnn::IGpuAccTunedParameters::Mode::UseTunedParameters);
armnn::IOptimizedNetworkPtr optNet = armnn::Optimize(*network, {armnn::Compute::GpuAcc}, runtime->GetDeviceSpec());

armnn::NetworkId networkIdentifier;
runtime->LoadNetwork(networkIdentifier, std::move(optNet));
  1. 读入数据并运行模型
armnn::Status ret = runtime->EnqueueWorkload(networkIdentifier,MakeInputTensors(inputBindingInfo, &arr_256[0]),MakeOutputTensors(outputBindingInfo, &output[0]));

其中函数 makeInputTensor 和 makeOutputTensor定义如下:

armnn::InputTensors MakeInputTensors(const std::pair<armnn::LayerBindingId,armnn::TensorInfo> &input, const void *inputTensorData)
{
    return {{input.first, armnn::ConstTensor(input.second, inputTensorData)}};
}

// Helper function to make output tensors
armnn::OutputTensors MakeOutputTensors(const std::pair<armnn::LayerBindingId, armnn::TensorInfo> &output, void *outputTensorData)
{
    return {{output.first, armnn::Tensor(output.second, outputTensorData)}};
}

相关文章

  • armnn常用接口

    参考链接:https://www.arm.com/solutions/artificial-intelligenc...

  • Java之Collection

    Collection接口介绍常用Set原理分析常用Queue原理分析常用List原理分析 Collection接口...

  • Set接口的常用方法

    Set接口的常用方法和List接口一样, Set接口也是Collection的子接口,因此,常用方法和Collec...

  • 接口

    Collection接口的常用方法 Set集合 TreeSet增加的方法 Map接口 常用方法

  • 大数据基础知识学习-----Storm学习笔记(四)Storm常

    常用API API简介 Component组件 基本接口 IComponent接口 ISpout接口 IRichS...

  • List接口

    介绍&常用方法 java.util.List接口 extends Collection接口 List接口的特点: ...

  • Java 接口知识点

    接口的特性 函数式接口 抽象类和接口区别 Lambda表达式 java常用接口

  • [iOS] 协议 protocol 使用的两个主要场景

    约定接口 协议最常用的场景是,约定接口,作为接口的抽象而存在,不提供实现,在 iOS 中最常用的场景就是委托模式下...

  • java集合学习总结

    集合的根接口:Collection和 Map Collection接口的常用子接口:List, Set List接...

  • Set接口

    介绍&常用方法 java.util.Set接口 extends Collection接口 Set接口的特点: 1....

网友评论

    本文标题:armnn常用接口

    本文链接:https://www.haomeiwen.com/subject/ctwxwqtx.html