Free and open source mobile deep learning work, deploying by Baidu.
This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.
Size: 340k+ (on arm v7)
Speed: 40ms (for iOS l GPU Mobilenet) or 30 ms (for Squeezenet)
百度研发的移动端深度学习框架,致力于让卷积神经网络极度简单的部署在手机端。目前正在手机百度内运行。支持iOS gpu计算。体积小,速度快。
体积 armv7 340k+
速度 iOS GPU mobilenet 可以达到 40ms、squeezenet 可以达到 30ms
项目地址:https://github.com/baidu/mobile-deep-learning
更多机器学习教程:http://www.tensorflownews.com
特征
一键部署,脚本参数就可以切换ios或者android
支持iOS gpu运行MobileNet、squeezenet模型
已经测试过可以稳定运行MobileNet、GoogLeNet v1、squeezenet模型
体积极小,无任何第三方依赖。纯手工打造。
提供量化脚本,对32位float转8位uint直接支持,模型体积量化后4M上下
与ARM相关算法团队线上线下多次沟通,针对ARM平台会持续优化
NEON使用涵盖了卷积、归一化、池化所有方面的操作
汇编优化,针对寄存器汇编操作具体优化
loop unrolling 循环展开,为提升性能减少不必要的CPU消耗,全部展开判断操作
将大量繁重的计算任务前置到overhead过程
继续阅读与本文标签相同的文章
-
使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践
2026-05-26栏目: 教程
-
特征工程
2026-05-26栏目: 教程
-
使用Keras进行深度学习:(五)RNN和双向RNN讲解及实践
2026-05-26栏目: 教程
-
TensorFlow + Keras 实战 YOLO v3 目标检测图文并茂教程
2026-05-26栏目: 教程
-
深度学习中正则化技术概述(附Python代码)
2026-05-26栏目: 教程
