前言:在移植OpenCV 3.3.0的過程中發現還有DNN(深層神經網絡)子產品,順便就在PC上測試了其性能,沒有GPU,是以隻有用E3-1230v2 将就試了,從目前的接口上看貌似也不支援GPU加速。
1、使用cmake-gui設定編譯選項時,記得把build_example和dnn相關的都勾選上
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiIyVGduV2QvwVe0lmdhJ3ZvwFM38CXlZHbvN3cpR2Lc1TPB10QGtWUCpEMJ9CXsxWam9CXwADNvwVZ6l2c052bm9CXUJDT1wkNhVzLcRnbvZ2Lc1TPB1UMVpWTsZFShZXUYpVd1kmYr50MZV3YyI2cKJDT29GRjBjUIF2LcRHelR3LcJzLctmch1mclRXY39jM2kjN0kjM1ETOwkDM3EDMy8CX0Vmbu4GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.jpg)
2、編譯好之後,在build/bin/路徑下就有存放的dnn的測試用例,目前隻有以下幾個
3、條件有限,隻會Caffe的使用,是以就測試了基于caffe模型的GoogleNet與VGG-SSD
4、下一步計劃在嵌入式平台中測試運作速度,雖然肯定知道沒Hi3559A的NPU快,但是還是值得比較。目前在桌面領域的DNN網絡部署已經沒有任何性能瓶頸了,主要是看每個公司的後期軟體處理如何以及如何依靠DNN幫助客戶解決困難。而在嵌入式平台,由于功耗性能的限制,CPU的計算能力還不足以運作規模較大的DNN,再加上每個嵌入式平台的硬體廠商都用自己的小算盤,是以路還能長,但畢竟是大勢所趨,隻有“端AI“和”雲AI”的緊密協作,才能做出跨時代的産品!
5、嵌入式平台測試記錄(9.11更新)
Cortex A73*2+Cortex A53*2,分類網絡450ms,标準的VGG-SSD檢測網絡記憶體要求較高(大于300MB),直接被oom kill掉了
,壓縮後的檢測網絡可以運作,classsize=2,550ms,效果還不錯,用來騙騙小菇涼還是夠了
。
寫部落格的時間有限,主要目的是為了記錄學習的過程,若有疑問,請留言!