Relation Network for Person Re-identification

Paper：https://arxiv.org/abs/1911.09318v2

Code：https://github.com/cvlab-yonsei/projects/tree/master/RRID/code

摘要：Re-ID旨在从一组相机网阵中捕获的图像中检索相关人员图像的任务。最近的Re-ID方法表明，利用描述身体部位的局部特征，加上行人图像本身的全局特征，即使在缺少身体部位的情况下，也能提供健壮的特征表示。然而，直接使用个体的局部特征，而不考虑身体各部分之间的关系，混淆了在相应部分具有相似属性的不同ID。为了解决此问题，我们为行人Re-ID提出了新的关系网略，它考虑了身体各个部分与其他部分之间的关系。我们的模型可使一个单独的部件级特征也包含身体其他部分的信息，从而使它更具有识别力。我们还介绍了一种全局对比池化方法（GCP）来获得行人图像的全局特征。我们提出通过GCP使用对比特征补充传统最大和平均池化方法。在三个公开数据集上展示了我们模型的有效性。

知识点解析：

a）：概述：得到一张行人图像的特征图（C*H*W）。将得到的特征图水平分割成6网格。然后对每个特征图应用GMP，得到size为1*1*C的局部层次的特征图。我们将特征图送进两个模块中，以提取新的局部和全局行人表示：One vs rest模块和GCP。第一个模块通过考虑身体各部分与其余部分之间的关系，使得每个局部层次的特征更具有辨别力，并输出1*1*c的局部关系特征。第二个模块提供一个1*1*c的全局对比特征，表示行人图像本身。我们沿着通道维将全局对比和局部关系特征连接起来，并使用1*1*7c的特征作为Re-ID的行人表示。我们使用交叉熵和三元损失来训练我们的模型，其中三元组为anchor、positive和negative的行人图像。在测试时，我们提取行人图像的特征，并计算他们之间的欧式距离来确定行人的ID。

b）：Relation networks for part-based reID：1）：局部层次特征：我们利用在ImageNet预训练的ResNet-50作为主干网络，从输入的图像中提取初始特征图。具体来说，根据PCB的工作，我们将ResNet-50的GAP和全连接去掉，并将最后一个卷积层的stride设置为1。类似于其他基于局部特征的Re-ID方法，我们将初始特征图分成C*H/6*W的水平网格，对每个网格应用GMP，得到1*1*C的局部水平特征。2）：One VS rest关系模块：从水平网格中提取局部层次的特征，可以隐式地利用身体的各个部分来表示不同的人。现有的Re-ID方法将这些局部特征独立地用于行人检索。考虑到行人图像之间的粗糙的几何对应，他们以特定的顺序将所有局部特征链接起来。虽然此结构化的行人特征可以对几何变化和遮挡，但是他们没有考虑身体部分之间的关系。也就是说，各个部分是孤立的，不与其他部分通信，这就分散了计算不同ID之间在相应部分中具有相似属性的相似度。为了缓解这个问题，我们提出利用身体各部分之间的关系来表示行人。具体来说，我们引入一个新的关系网络（图2），它利用身体部分的one VS rest关系，使得每个局部层次的特征都可以包含相应部分本身和其他身体部分的信息。具体来说，我们用