深刻揭露步态识别的“谎言”(篇一)
歡迎轉載,轉載時必須保證全文完整性并保留署名。
步態識別是什么?是根據人走路的方式來識別人的身份,也就是根據走路方式來識別出張三李四。你想想,是不是每個人走路時?????♀?????,擺腿風格皆不同啊?再加上擺臂、晃肩等特點,你是不是可以遠遠地認出你的朋友。
本人一直做步態識別研究,茶余飯后,有時候跟非同行解釋自己的科研工作。對方一般立刻會點頭,“懂了,根據擺腿風格識別人”。這讓我想起十幾年前跟人科普人臉識別,也是類似的感覺,“懂了,根據瞳距、嘴形等特征識別人”。這樣的理解,也不能說是錯誤的,但離真正的事實還有很遠的距離。
專門研究步態識別的專家眼中的技術原理,如下圖,一團亂麻,真的說不清楚!所以這幾年興起了一個新的研究方向“可解釋人工智能”,對此我持保留態度。
讓我們從跑題中回來,嘗試解釋一下“步態識別”原理。步態識別研究起源于2000年前后,是一個非常新的生物特征識別技術。我是在2003年開始研究步態識別。在那個步態識別的起步階段,很多算法都依照人的直覺去設計。也就是對人體進行建模,如下圖對四肢和軀干的運動進行建模,然后根據這些部位的角度變化識別人的身份[1]。
這類方法很符合人的直覺,但有一個很大的缺陷:人體精確建模太難了!特別是十幾年前,視頻中人體本來就較小且模糊,人體建模也只能建一個大概,用于區分不同的人十分困難。
后來的一系列算法都放棄了人體建模方案,直接采用二值人體輪廓(silhouette)。但視頻里有很多幀,每幀一個輪廓圖,一個序列至少幾十個圖像。數據維度太高了,傳統的特征提取方法很難對之進行特征提取。2004年有個方法[2]直接將所有輪廓圖求了個平均,美其名曰“步態能量圖”(Gait Energy Image, GEI,如下圖),然后采用一個L1或L2距離評價相似度,這樣就暴虐了幾乎所有其他算法。我依然記得當年我的心情“我靠,這樣也可以?”這讓推導了好幾頁數學公式,各種矩陣輪番變換的方法情何以堪?
簡單的方法中必有天地!我用了幾年的時間才慢慢理解了這里面的“簡單之美”。GEI方法解決了兩個問題:人體輪廓質量劣和時序對齊的問題。因為各種因素,人體輪廓中很多圖像都是“缺胳膊少腿”。但GEI把很多幀一平均,缺陷被稀釋。再者,兩個序列,如果一個是以并腿狀態為第一幀,一個以叉開腿狀態為第一幀,即使這兩個序列來自同一個人,在計算機看來,這兩個數據差異很大。這就是模式識別中典型的類內差異大過類間差異的問題。GEI一平均,不用考慮時序對齊問題了,完美避開了難點。再者,GEI中的像素的數值是0-1之間,可以用于表示這個像素點被人體遮擋的概率,這樣也能夠部分地刻畫人體運動模式。鑒于這些優勢,這種簡單的GEI特征,統治了步態識別近10年時間。
作者注:本來想一篇文章寫完,寫起來發現篇幅會有點長,今天沒空繼續寫了,過幾天有空再寫后續。欲知后事如何,可關注我的公眾號。
參考文獻
[1]?Liang Wang, Huazhong Ning, Tieniu Tan, and Weiming Hu. Fusion of static and dynamic body biometrics for gait recognition. IEEE Transactions on Circuits and Systems for Video Technology, 14(2):149–158, Feb. 2004.
[2]?Ju Han and Bir Bhanu. Statistical feature fusion for gait-based human recognition. In Proc. of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pages II842–II847. Washington DC, USA, June 2004.
總結
以上是生活随笔為你收集整理的深刻揭露步态识别的“谎言”(篇一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: React开发(176):导出所有接口供
- 下一篇: React开发(168):...dva调