【杂谈】一本书同时学分类,检测,分割,三维重建,GAN,难道它不香吗?文末送两本
如果你想快速系統(tǒng)地串聯(lián)計(jì)算機(jī)視覺領(lǐng)域的知識,人臉圖像應(yīng)該是最佳選擇,其相關(guān)研究覆蓋底層圖像特征,目標(biāo)檢測與跟蹤,圖像分類和檢索,圖像濾波,圖像分割,三維重建,風(fēng)格遷移等方向,并且能夠做到相互融合從而進(jìn)行工業(yè)界落地。如果你還不知道人臉圖像能做什么,不如看一看上面的1分鐘視頻,然后我們接下來細(xì)看到底都有些什么。
底層圖像特征
或許很多經(jīng)典的底層圖像特征已經(jīng)PK不過現(xiàn)在的深度學(xué)習(xí)模型學(xué)習(xí)到的特征,但是思想是永恒的,在人臉這個(gè)領(lǐng)域,有一些特征理解起來非常直觀。
特征通常可以分為顏色特征、紋理特征、形狀特征,下面我們看看在人臉方向有哪些很經(jīng)典的東西。
第一個(gè)是膚色高斯模型,它是顏色特征。盡管人有白、黃、黑三種膚色,但研究證明,膚色在某些顏色空間上的差異性主要體現(xiàn)在亮度上,在色度上具有較好的聚類表現(xiàn)。因此根據(jù)膚色屬性所具有的規(guī)律和分布情況對膚色建模,便可以將膚色與非膚色區(qū)域區(qū)分開。膚色高斯模型在早期可以常用人臉檢測,現(xiàn)在也常用于輔助一些模型進(jìn)行人臉區(qū)域的快速定位。
第二個(gè)是haar特征,它是紋理特征。臉部有一些固有的屬性,比如眼睛要比臉頰顏色要深,鼻梁兩側(cè)比鼻梁顏色要深,嘴巴比周圍顏色要深等。Haar特征通過對相鄰圖像塊進(jìn)行灰度比較,并使用積分圖像進(jìn)行快速計(jì)算,在大名鼎鼎的V-J算法中被使用。如果研究過OpenCV人臉檢測算法的,不可能不知道。
第三個(gè)是形狀特征,基于人臉特征關(guān)鍵點(diǎn)就可以計(jì)算出一系列的形狀特征,因?yàn)槿四橁P(guān)鍵點(diǎn)是眉毛、眼睛、鼻子、嘴巴、臉部等有語義的特征點(diǎn),每個(gè)人臉都通用卻有獨(dú)特性,對于光照姿態(tài)等有很強(qiáng)的不變性。
目標(biāo)檢測與跟蹤
目標(biāo)檢測可以說是計(jì)算機(jī)視覺方向中從業(yè)者最多的了,不然也不會(huì)出現(xiàn)千篇一律的簡歷中寫著跑過Yolo算法,人臉檢測就是目標(biāo)檢測的一個(gè)子領(lǐng)域。
盡管通用的目標(biāo)檢測算法可以用于人臉檢測,但是人臉檢測依然有它的特點(diǎn),比如早期的時(shí)候一些方法會(huì)挨個(gè)檢測人臉的各個(gè)部位,然后組合成最終人臉。以MTCNN為代表的框架會(huì)把人臉檢測和關(guān)鍵點(diǎn)檢測問題進(jìn)行聯(lián)合處理。
而如今,在目標(biāo)檢測領(lǐng)域中的一些難題在人臉檢測領(lǐng)域同樣廣泛存在,比如大姿態(tài)人臉、遮擋人臉、模糊小臉,甚至是偽造人臉,搞明白了人臉檢測,目標(biāo)檢測還會(huì)是問題嗎?
另一方面,工業(yè)界應(yīng)用的時(shí)候不僅要做檢測,還需要做跟蹤平滑,此時(shí)常常需要應(yīng)用卡爾曼濾波等傳統(tǒng)算法,而不僅僅是一個(gè)模型就能搞定,更復(fù)雜完整的項(xiàng)目,才能更好地鍛煉能力。
圖像分類和檢索
沒有人不知道圖像分類問題,而為我們所熟悉的人臉識別系統(tǒng),其中一條典型的技術(shù)路線就是圖像分類+驗(yàn)證+檢索模型的組合。
以上圖DeepFace為例,它首先對輸入人臉經(jīng)過3D對齊,然后使用數(shù)據(jù)集訓(xùn)練一個(gè)人臉分類器得到人臉特征提取網(wǎng)絡(luò),最后使用Siamese網(wǎng)絡(luò)訓(xùn)練人臉驗(yàn)證網(wǎng)絡(luò)。這樣一來,就解決了人臉特征的問題,即將高維的人臉表達(dá)成了一個(gè)低維的特征,接下來就是進(jìn)行人臉的聚類與檢索。
如今人臉識別系統(tǒng)雖然已經(jīng)大規(guī)模商業(yè)化,但并不意味著這里面就沒有事情可以做了。遮擋人臉識別,跨姿態(tài)人臉識別,跨年齡人臉識別,妝造不變?nèi)四樧R別,光照不變?nèi)四樧R別,少樣本人臉識別,3D人臉識別,視頻人臉識別等都是現(xiàn)實(shí)存在的難題。
解決上面這些問題,不僅需要新的技術(shù),也需要對分類檢索等老技術(shù)的改進(jìn)。
圖像濾波
圖像濾波是一類很底層的圖像處理方法,在圖像降噪,圖像去模糊,圖像修復(fù)等底層圖像處理領(lǐng)域中是核心技術(shù)。那么在人臉圖像中,又用在了哪里呢?大家或許不知道技術(shù),但是不可能沒有接觸過,那就是人像美顏,熟的不能在熟的磨皮美白大法。
其中常見的方法包括均值濾波,雙邊濾波,引導(dǎo)濾波,以及針對這些方法的改進(jìn)。掌握了核心技術(shù),從人臉美顏遷移到其他的圖像增強(qiáng)領(lǐng)域,就很自然了。
三維重建
三維重建即3D Reconstruction,在計(jì)算機(jī)視覺中,三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過程,通常需要從二維的圖像投影恢復(fù)出物體的三維形狀和紋理信息,這是接下來計(jì)算機(jī)視覺會(huì)取得突破的重點(diǎn)領(lǐng)域,而人臉的三維重建問題,實(shí)在是太典型了。
從基于單張圖的3DMM等人臉通用模型與Shape from Shading(SfS)等優(yōu)化方法,到基于多張圖的立體視覺,基于視頻的Structure from Motion(SfM),端到端的與端到端的模型,傳統(tǒng)的與深度學(xué)習(xí)方法,這個(gè)領(lǐng)域涉及的算法非常多,而且難度較高。
另外,如何逼真地重建出人臉的細(xì)節(jié)信息,如何在二維的人臉被遮擋后還能進(jìn)行重建,都是當(dāng)前人臉重建領(lǐng)域要解決的難題,研究起來有足夠的技術(shù)深度,一旦攻克也有大量商用場景。
另外3D與圖形學(xué)有非常緊密的聯(lián)系,使得這些技術(shù)在內(nèi)容創(chuàng)作上有非常大的商業(yè)價(jià)值,難道你不想加入其中嗎?
圖像編輯與風(fēng)格化
隨著生成對抗網(wǎng)絡(luò)等技術(shù)的發(fā)展,當(dāng)前圖像編輯與風(fēng)格化正在成為計(jì)算機(jī)視覺領(lǐng)域的新熱點(diǎn),其中尤其是人臉圖像落地能力最強(qiáng),在人機(jī)交互,娛樂社交,內(nèi)容創(chuàng)作等領(lǐng)域應(yīng)用非常廣泛。
從人臉年齡編輯、人臉卡通頭像生成、換臉等全局性質(zhì)的編輯,到人臉表情編輯,人臉發(fā)型,人臉化妝去妝等局部性質(zhì)等編輯,幾乎覆蓋了圖像編輯與風(fēng)格化的所有關(guān)鍵技術(shù)。當(dāng)前交互式,可控的編輯模型也是研究重點(diǎn)。
怎么規(guī)劃學(xué)習(xí)路線
上面說了這么多,無非就是想告訴大家,作為打算長期在計(jì)算機(jī)視覺有所建樹的同學(xué),人臉圖像是非常值得研究的,也是不可能繞過的,那么如何長期學(xué)習(xí)相關(guān)知識呢?下面介紹我們的兩個(gè)內(nèi)容。
(1) 2020年7月,有三的新書《深度學(xué)習(xí)之人臉圖像處理:核心算法與案例實(shí)踐》在機(jī)械工業(yè)出版社出版,這是一本講述在人臉各個(gè)方向中的深度學(xué)習(xí)算法的書籍,同時(shí)配套有大量實(shí)戰(zhàn)案例。
言有三新書來襲,業(yè)界首次深入全面講解深度學(xué)習(xí)人臉圖像算法
書中各章節(jié)內(nèi)容如下:
第1章 人臉圖像和特征基礎(chǔ)
第2章 深度學(xué)習(xí)基礎(chǔ)?
第3章 人臉數(shù)據(jù)集
第4章 人臉檢測
第5章 人臉關(guān)鍵點(diǎn)檢測
第6章 人臉識別
第7章 人臉屬性識別
第8章 人臉屬性分割
第9章 人臉美顏和美妝
第10章 人臉三維重建
第11章 人臉屬性編輯
這是市面上唯一一本將人臉各領(lǐng)域這幾年的核心算法講清楚的書,而且在可預(yù)見的幾年內(nèi)都可能如此。
(2) 有三AI秋季劃人臉?biāo)惴ńM和GAN組,這是集教材,圖文代碼實(shí)踐,視頻課程和直播,知識星球社區(qū),線上微信群,線下活動(dòng)為一體的終身有效學(xué)習(xí)小組,詳細(xì)可以閱讀以下文章。
【通知】如何讓你的2020年秋招CV項(xiàng)目經(jīng)歷更加硬核,可深入學(xué)習(xí)有三秋季劃4大領(lǐng)域32個(gè)方向
福利
國慶長假剛剛結(jié)束,是時(shí)候收收心學(xué)習(xí)了,給大家贈(zèng)送本書兩本,留言點(diǎn)贊高者可得,2020年10月9日(今晚)22:00揭曉。
另外如果你想購買簽名版留作紀(jì)念,可以到有三的小店,簽名版示意圖和小店二維碼如下:
最后總結(jié)一句,人臉圖像算法領(lǐng)域,技術(shù)成熟,又有許多需要長期研究的內(nèi)容,學(xué)習(xí)它,難道不香嗎?
往期相關(guān)
【技術(shù)綜述】基于3DMM的三維人臉重建技術(shù)總結(jié)
【技術(shù)綜述】人臉妝造遷移核心技術(shù)總結(jié)
【技術(shù)綜述】人臉風(fēng)格化核心技術(shù)與數(shù)據(jù)集總結(jié)
【總結(jié)】最全1.5萬字長文解讀7大方向人臉數(shù)據(jù)集v2.0版,搞計(jì)算機(jī)視覺怎能不懂人臉
【技術(shù)綜述】人臉年齡估計(jì)研究現(xiàn)狀
【技術(shù)綜述】人臉表情識別研究
【技術(shù)綜述】人臉顏值研究綜述
【技術(shù)綜述】人臉臉型分類研究現(xiàn)狀
總結(jié)
以上是生活随笔為你收集整理的【杂谈】一本书同时学分类,检测,分割,三维重建,GAN,难道它不香吗?文末送两本的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: 【杂谈】新手如何掌握深度学习模型?赠书2
 - 下一篇: 【直播回放】新手如何入门并学习计算机视觉