一款全平台轻量级pytorch推理框架Msnhnet

穆士凝魂

分类：机器学习

发布时间 2022.04.20阅读数 2932 评论数 0

一款轻量的用于推理pytorch模型的框架,该框架受darknet启发.

https://github.com/msnh2012/Msnhnetgithub.com/msnh2012/Msnhnet

Ps: 目前本框架在持续开发中，由于是业余时间开发，更新速度不会很快。也欢迎有志之士一块维护本框架. 欢迎三连.

目前测试过的操作系统 (你可以自己测试下mac os)

目前测试过的CPU (其它U出现BUG可以在issue提出)

特点

由纯c++编写完成, 不依赖其它第三方计算库, 同时也支持OpenBlas库.
支持目前主流的操作系统,Windows, linux(Ubuntu测试), mac os(未测试).
支持目前主流的cpu芯片, Intel X86,AMD(未测试) 和ARM.
支持x86结构avx2加速(持续优化中)。
支持arm结构neon加速(持续优化中)。
conv2d 3x3s1 3x3s2 winograd3x3s1支持(Arm)
GPU cuda支持. (测试过的显卡 GTX1080Ti, Jetson NX)
GPU cudnn支持. (测试过的显卡 GTX1080Ti, Jetson NX)
GPU fp16支持.(测试过的显卡 GTX1080Ti, Jetson NX)
ps. 请检查你的显卡是否支持fp16双倍加速.
该框架自带一套类似netron的可视化工具, 可在编写Msnhnet文件时清晰掌握网络结构.
支持keras转Msnhnet. (Keras 2 and tensorflow 1.x, 部分op)
支持pytorch一键转msnhnet(目前只支持部分Op, 持续更新中)。
支持c_api。
支持C#语言，MsnhnetSharp。

支持msnhnet可视化，类似netron。

持续开发中...(也就晚上有时间... (╮（╯＿╰）╭))

已测试的网络

lenet5
lenet5_bn
alexnet(torchvision)
vgg16(torchvision)
vgg16_bn(torchvision)
resnet18(torchvision)
resnet34(torchvision)
resnet50(torchvision)
resnet101(torchvision)
resnet152(torchvision)
darknet53(Pytorch_Darknet53)
googLenet(torchvision)
mobilenetv2(torchvision)
yolov3(u版yolov3)
yolov3_spp(u版yolov3)
yolov3_tiny(u版yolov3)
yolov4(u版yolov3)
fcns(pytorch-FCN-easiest-demo)
unet(bbuf keras)
deeplabv3(torchvision)
yolov5s(U版yolov5,用于导出参数)
yolov5m(U版yolov5,用于导出参数)

==============================================================
mobilenetv2_yolov3_lite (cudnn分组卷积对Gtx10系列的Pascal显卡支持不好，请使用GPU模式)
mobilenetv2_yolov3_nano (cudnn分组卷积对Gtx10系列的Pascal显卡支持不好，请使用GPU模式)
yoloface100k (cudnn分组卷积对Gtx10系列的Pascal显卡支持不好，请使用GPU模式)
yoloface500k (cudnn分组卷积对Gtx10系列的Pascal显卡支持不好，请使用GPU模式)
感谢qiuqiu的mobilenet yolo系列: https://github.com/dog-qiuqiu/MobileNetv2-YOLOV3
==============================================================
pretrained models 链接：https://pan.baidu.com/s/1mBaJvGx7tp2ZsLKzT5ifOg
提取码：x53z
pretrained models 连接：Google Drive
效果

Yolo测试

Win10 MSVC 2017 I7-10700F (Linux平台大约比Win快10~20%,当然不是所有网络)

ARM(Yolov3Tiny cpu)

Yolo GPU 测试

Ubuntu16.04 GCC Cuda10.1 GTX1080Ti

net	yolov3	yolov3_tiny	yolov4

Jetson NX

net	yolov3	yolov3_tiny	yolov4

Yolo GPU cuDnn FP16 测试

Jetson NX

net	yolov3	yolov4

Yolov5s GPU 测试

Ubuntu18.04 GCC Cuda10.1 GTX2080Ti

net	yolov5s	yolov5s_fp16

Mobilenet Yolo GPU cuDnn 测试

Jetson NX

net	yoloface100k	yoloface500k	mobilenetv2_yolov3_nano	mobilenetv2_yolov3_lite

DeepLabv3 GPU 测试

Ubuntu18.04 GCC Cuda10.1 GTX2080Ti

net	deeplabv3_resnet101	deeplabv3_resnet50

依赖

OpenCV4 (可选.) https://github.com/opencv/opencv
Qt5 (可选. 编译Msnhnet viewer时使用) http://download.qt.io/archive/qt/
Cuda10+, Cudnn7.0+. (可选)

视频教程(B站)

如何编译

CMake要求: CMake 3.15+
注意Viewer不能在GPU模式下编译

ps. 你可以在CMakeLists.txt:52设置最大OMP占用线程, 默认是OMP使用所有CPU线程.(需取消勾选OMP_MAX_THREAD)

Windows平台编译(MSVC)

1.使用CMake编译安装OpenCV4 (可选).
2.在环境变量中添加"OpenCV_DIR", 并设置变量内容为每个库的CMake目录 (可选).
3.下载安装Qt5 (可选).
4.把Qt5的bin目录添加环境变量Path (可选).
5.最后使用CMake GUI工具配置Msnhnet然后使用Visual Studio编译安装.

Linux(Ubuntu )
注意: 构建NX的GPU版本取消勾选NNPACK NEON OPENBLAS.

sudo apt-get install qt5-default #optional

sudo apt-get install libqt5svg5-dev #optional

sudo apt-get install libopencv-dev #optional

#config

sudo echo /usr/local/lib > /etc/ld.so.conf.d/usrlib.conf

sudo ldconfig

# build Msnhnet

git clone https://github.com/msnh2012/Msnhnet.git

mkdir build

cd Msnhnet/build

cmake -DCMAKE_BUILD_TYPE=Release ..

make -j4

sudo make install

vim ~/.bashrc # Last line add: export PATH=/usr/local/bin:$PATH

sudo ldconfig

测试

1.首先下载预训练模型并解压. eg.D:/models.
2.打开终端或CMD, cd到安装目录. eg. D:/Msnhnet/bin
3.测试 yolov3 yolov3 D:/models
4.测试 yolov3tiny_video yolov3tiny_video D:/models
5.测试 classify classify D:/models

使用MsnhnetViewer查看网络结构

1.打开终端或CMD, cd到安装目录 eg. D:/Msnhnet/bin
2.运行 "MsnhnetViewer"

Ps. "ResBlock Res2Block AddBlock ConcatBlock"为网络层的封装, 你可以双击该块查看详细内容.

各个封装的结构
ResBlock

Res2Block

AddBlock

ConcatBlock

如何转换模型

pytorch2msnhnet
ps.
在转换之前，请务必检查下你的模型所用的算子被pytorch2Msnhnet支持。
可能有些模型转换不成功。
如果你的模型包含非常复杂的前处理和后处理，请先转backbone，再手动添加OP.
对于u版yolov3和yolov4.参考这个视频。视频中的工具迁移至此.

关于训练

使用pytorch版本的各个模型训练即可,训练完成后,按照上一步,构建Msnhnet即可.
如yolov3/4. 使用U版: https://github.com/ultralytics/yolov3

Enjoy it!

感谢

Msnhnet参考了以下框架:

第三放库

加群交流

机器学习深度学习 Python Pytorch darknet

打赏 0

上一篇：Pytorch直转Msnhnet思路分享

下一篇：一款国产目标检测标注软件CasiaLabeler

一款全平台轻量级pytorch推理框架Msnhnet

穆士凝魂

一款轻量的用于推理pytorch模型的框架,该框架受darknet启发.

为你推荐

精选知识图谱基本工具Neo4j使用笔记四：使用csv文件批量导入图谱数据

accelerate 分布式技巧实战--部署ChatGLM-6B（三）

机器学习之超参数优化 - 网格优化方法（网格搜索）

机器学习笔记（五）：支持向量机（SVM）

精选基于SVM-支持向量机对鸢尾花数据进行分类

Rdkit|分子性质描述符（Descriptors）

关于作者

穆士凝魂

13

0

0

2

记录本人参与的机器人项目和机器人实验

复现trac_ik: 使用Msnhnet实现串联机器人运动数值逆解_2.5倍于trac_ik(二）

Tensor中数据摆放顺序NC4HW4是什么意思，只知道NCHW格式，能解释以下NC4HW4格式吗？

相关推荐

精选Machine Learning-L5-回归分析

精选深入理解深度学习——Item Embedding

机器学习笔记 - 使用ARIMA模型时间序列预测

自然语言处理从入门到应用——预训练模型总览：预训练模型存在的问题

精选浅析扩散模型与图像生成【应用篇】(四)——Palette

CV中的无监督学习方法：MoCo

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

一款全平台轻量级pytorch推理框架Msnhnet

穆士凝魂

一款轻量的用于推理pytorch模型的框架,该框架受darknet启发.

为你推荐

精选知识图谱基本工具Neo4j使用笔记 四 ：使用csv文件批量导入图谱数据

accelerate 分布式技巧实战--部署ChatGLM-6B（三）

机器学习之超参数优化 - 网格优化方法（网格搜索）

机器学习笔记（五）：支持向量机（SVM）

精选基于SVM-支持向量机对鸢尾花数据进行分类

Rdkit|分子性质描述符（Descriptors）

评论（0）

关于作者

穆士凝魂

13

0

0

2

记录本人参与的机器人项目和机器人实验

复现trac_ik: 使用Msnhnet实现串联机器人运动数值逆解_2.5倍于trac_ik(二）

Tensor中数据摆放顺序NC4HW4是什么意思，只知道NCHW格式，能解释以下NC4HW4格式吗？

相关推荐

精选Machine Learning-L5-回归分析

精选深入理解深度学习——Item Embedding

机器学习笔记 - 使用ARIMA模型时间序列预测

自然语言处理从入门到应用——预训练模型总览：预训练模型存在的问题

精选浅析扩散模型与图像生成【应用篇】(四)——Palette

CV中的无监督学习方法：MoCo

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

精选知识图谱基本工具Neo4j使用笔记四：使用csv文件批量导入图谱数据

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板