【知识星球】这几年人脸都有哪些有意思的数据集?
歡迎大家來到《知識星球》專欄,人臉一直是整個圖像領域里最大的方向,最近幾個月咱們在知識星球里分享了非常多的這幾年新出的人臉數據集,簡單介紹其中幾個如下。
作者&編輯 | 言有三
有三AI知識星球-數據集
MeGlass
MeGlass是一個仿真的帶眼鏡的人臉識別數據集,包括1710個人的14 832張有眼鏡圖和33087張無眼鏡圖,各自至少有兩張。
作者/編輯 言有三
眼鏡對人臉識別問題會造成一定的困擾,MeGlass是一個仿真的戴眼鏡人臉識別數據集,包括1710個人的14 832張有眼鏡圖和33087張無眼鏡圖,所有的圖片來自于MegaFace。
統計信息如下:
一些圖片案例如下:
參考文獻
[1] Guo J, Zhu X, Lei Z, et al. Face synthesis for eyeglass-robust face recognition[C]//Chinese Conference on Biometric Recognition. Springer, Cham, 2018: 275-284.
有三AI知識星球-數據集
Makeup Transfer
Makeup Transfer是一個妝造遷移人臉數據集,有3384張女性人臉圖。
作者/編輯 言有三
Makeup Transfer包括3834張女性人臉圖,其中1115張無妝造人臉,2719張有妝造人臉。妝造類型包括不同程度的煙熏妝(smoky-eyes makeup style), 華麗妝(flashy makeup style),復古妝(Retro makeup style),韓式妝(Korean makeup style)以及日式妝(Japanese makeup style)。
參考文獻
[1] Li T, Qian R, Dong C, et al. Beautygan: Instance-level facial makeup transfer with deep generative adversarial network[C]//Proceedings of the 26th ACM international conference on Multimedia. 2018: 645-653.
有三AI知識星球-數據集
DFW?
DFW(Disguised Faces in the Wild)是一個妝造和偽造人臉數據集,有1000個人的11157張圖。
作者/編輯 言有三
DFW是IBM發布的一個妝造人臉數據集,有1000人的11157 張圖片,主要包括遮擋和偽造人臉。每一個人都有一張正臉圖,其中903張人有一個驗證圖,兩者構成正常的人臉驗證對。所有1000個人都有一些包括妝造圖,874個人有一些被識別成該人(故意的或者非故意的)的偽造圖,最終總共1000張整成圖, 903張驗證圖,4814張妝造圖, 4440張偽造(另一個人)圖。
上圖是一些樣本,第一張是正常圖,黃色底色是驗證圖,綠色底色是妝造圖,藍色底色是偽造(另一個人)圖。
參考文獻
[1]?Kushwaha V, Singh M, Singh R, et al. Disguised faces in the wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. 2018: 1-9.
有三AI知識星球-數據集
Cartoonset10k/100k
Cartoonset10k/100k是一個漫畫人臉數據集,包括100000張具有不同藝術風格的人臉頭像,可以用于人臉風格化等應用。
作者/編輯 言有三
CartoonSet10k和CartoonSet100k,分別包含10000和100000張卡通人臉圖。每一張卡通人臉圖都有16個組件,其中12個面部屬性和4個顏色屬性。
下面是它的樣本和屬性標注,其中csv內容每一行是名字,屬性index,以及該屬性的種類。
參考文獻
[1]?Royer A, Bousmalis K, Gouws S, et al. Xgan: Unsupervised image-to-image translation for many-to-many mappings[M]//Domain Adaptation for Visual Understanding. Springer, Cham, 2020: 33-49.
有三AI知識星球-數據集
FairFace
由于當前很多的人臉數據集中存在人種的不均衡,比如白人居多黑人居少,fairface建立了一個更加均衡的數據集。
作者/編輯 言有三
目前很多開源數據集中人種比例非常不平衡,下面是一個統計。
針對這個現象,FairFace數據集被整理出來,它是一個人臉屬性數據集,共包括white,black,Indian,East Asian,Southeast Asian,Middle East以及Latino7類人種,圖片來源于YFCC-100M Flickr數據集,標注屬性包括人種(race),性別(gender),年齡組(age group)。
數據集共有108501張圖,和其他數據集對比一覽如下:
參考文獻
[1]?K?rkk?inen K, Joo J. FairFace: Face Attribute Dataset for Balanced Race, Gender, and Age[J]. arXiv preprint arXiv:1908.04913, 2019.
除了上面這些,我們還分享了數十個各種各樣的大型小型人臉數據集,下面是其中一些預覽案例,供感興趣的你獲取,所有數據集在星球中提供下載,經常會更新!
6 關于數據集
有三AI知識星球是我們繼公眾號之后重點打造的原創知識學習社區,其中數據集板塊專注于給大家介紹重要數據集和新奇好玩的數據集,包括
(1) 經典大型數據集,ImageNet,CityScape,AffectNet,AVA等。
(2) 各類新奇好玩的數據集,等你來發掘啦。
超過1T的資源,還可以進行數據集求助!希望你喜歡。
知識星球其他內容板塊如下,強烈建議不熟悉的同學讀一下以下的生態介紹(最近快一周年,加入半價噢,年費低至138!)
【雜談】為什么邀請大家加入硬核知識星球有三AI
【年終總結】2019年有三AI知識星球做了什么,明年又會做什么
以上所有內容
加入有三AI知識星球即可獲取
來日方長
點擊加入
不見不散
更多精彩
每日更新
轉載文章請后臺聯系
侵權必究
往期精選
- 【雜談】有三AI知識星球最近都GAN了哪些內容? 
- 【雜談】GAN對人臉圖像算法產生了哪些影響? 
- 【雜談】那些底層的圖像處理問題中,GAN能有什么作為? 
- 【雜談】為了讓大家學好深度學習模型設計和優化,有三AI都做了什么 
- 【完結】12篇GAN的優化文章大盤點,濃濃的數學味兒 
總結
以上是生活随笔為你收集整理的【知识星球】这几年人脸都有哪些有意思的数据集?的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 【总结】只需5步,给所有想入行人工智能/
- 下一篇: 【GAN】如何生动有趣地对GAN进行可视
