Tensorfow_yolov3 Intel Realsense D435 图像整合(合并)输入GPU计算耗时测试
生活随笔
收集整理的這篇文章主要介紹了
Tensorfow_yolov3 Intel Realsense D435 图像整合(合并)输入GPU计算耗时测试
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
以前我們六個攝像頭輪詢依次輸入視頻幀給識別函數,識別函數放到GPU計算,640×360下每幀識別耗時為60-80ms,輪一圈下來識別就很慢了,約360-480ms
后來我們討論這個問題時,我說之前我測試時,使用輸入不同分辨率的圖片,識別耗時是差不多的,hui工說,既然如此,為何我們不把圖片整合在一起再直接輸入給GPU計算呢?
我想想,有道理,據說GPU比較喜歡大批量數據計算,這個方法值得一試,于是便有了以下的嘗試
顯示
耗時測試
0.1120765209197998 0.11573362350463867 0.13027596473693848 0.14565277099609375 0.14306235313415527 0.11908912658691406 0.12984681129455566 0.12005901336669922 0.12308144569396973 0.1360917091369629 0.13965153694152832 0.1135566234588623 0.11085724830627441可粗略看出,平均耗時在120ms左右
如果使用以前的不整合的來測試:
耗時約400ms左右
如果將顯示界面取消掉,再測試:
識別耗時約400ms左右,可看出,是否顯示界面對識別耗時影響不大
運行時,計算機GPU占用率也不高
存在問題
用640×360合成1280×1080,不卡
用1280×720合成2560×2160,卡,總耗時約300ms
看來不同分辨率的圖片識別耗時不一樣的,
另外,這樣做還會存在“跨越識別”的風險,這種風險對識別結果的影響還得進一步評估
20200120
by hui工備注
參考文章:Tensorflow yolov3 Intel Realsense D435 識別時間測試
總結
以上是生活随笔為你收集整理的Tensorfow_yolov3 Intel Realsense D435 图像整合(合并)输入GPU计算耗时测试的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pycharm提示 Method 'xx
- 下一篇: pycharm git 超详细教程