DeepFashion2: A Versatile Benchmark for Detection, Pose Estimation Segmentation and Re-Identification of Clothing Images
DeepFashion2数据集 包含 49.1 万张图像,包含 13 种流行的服饰类别。
数据集划分:391K 张 training 图片;34K 张 validation 图片;67K 张 test 图片。
Deep Fashion2数据集特点:
1.大规模:它包括 49.1 万张图像,总共是 4.38 万个服饰标识(购物店展示的独特服饰)。
2.多功能:DeepFashion2 面向多种时尚理解任务。它丰富的标注支持服饰检测和分类、密集标注和姿态检测、实例分割以及跨域实例级别的服饰检索。
3.表达能力:单张图像中存在多个服饰,有 13 种不同类别的标识和姿态。
4.多样性:研究者通过控制它们的 4 个属性变量来收集数据,包括尺寸、遮挡、缩放和视角。
Deep Fashion 数据集与Deep Fashion2 数据集区别:
a)Deep Fashion 数据集:
1.每张图像只有一件衣服的bounding box,用 4~8 个稀疏标志标注。
2. bounding box基于标签标记估计,定位不准确。
b)Deep Fashion2 数据集:
1.每张图像最少有一件服饰,最多有七件服饰。
2.每件服饰都被手动标记了边界框、掩膜和密集的标注(平均每件服饰 20 个标记),还有卖家秀-买家秀图像对。
数据集百度网盘下载地址:deepfashion2数据集
密码:td88
论文笔记ppt:论文笔记ppt
论文创新点:
(1)提出新的时尚数据集DeepFashion2 拥有最丰富的任务定义和最大数量的标签。它的标注至少是 DeepFashion[14] 的 3.5 倍,是 ModaNet 的 6.7 倍,是 FashionAI 的 8 倍。
(2)在本文提出的数据集上仔细定义了全部任务。例如,据本文研究者所知,服饰姿态估计是首次在文献中通过对 13 个类别的姿态和标记进行定义来提出,这些姿态要比人类的姿态更多样化,更加丰富。
(3)用 DeepFashion2数据集评测了 Mask R-CNN。并且提出了新的 Match R-CNN 网络模型所有从服饰类别、姿态以及掩膜中学习到的特征,用一种端到端的方式解决服饰图像检索的问题。
总结:
相关参考文章:
DeepFashion2数据集:87.3万对买家秀-卖家秀图像+海量标注
DeepFashion2 - Match R-CNN Banchmarks
网络结构: