TDAE论文阅读笔记

2023-04-24 09:47:12

题目：Hallucinating Very Low-Resolution Unaligned and Noisy Face Images byTransformative Discriminative Autoencoders∗

中文：变形性判别式自动编码器幻觉极低分辨率未对准且嘈杂的人脸图像

TDAE论文阅读笔记

摘要

大多数常规的面部幻觉方法都假定输入图像足够大且对齐，并且都要求输入图像无噪声。【缺点】 如果输入图像很小，未对齐并被噪声污染，它们的性能将大大降低 。在本文中，我们介绍了一种新颖的变换式判别式自动编码器，可对8倍超分辨未对齐的噪点和微小（16X16）的低分辨率人脸图像进行编码。与基于编码器-解码器的自动编码器相比，我们的方法使用解码器-编码器-解码器网络。我们 首先采用变换判别解码器网络来同时进行升采样和降噪 。然后，我们 使用变换编码器网络将中间的HR人脸投影到对齐且无噪声的LR人脸 。最后，我们 使用第二个解码器生成幻觉的HR图像 。我们对非常大的面部数据集进行了广泛的评估，结果表明我们的方法获得了出色的幻觉效果，并以1.82dB PSNR的较大幅度优于最新技术。

背景：如果输入图像很小，未对齐并被噪声污染，常规方法性能将大大降低

目的：对未对齐的带噪点的低分辨率人脸图像进行超分辨

方法：解码器-编码器-解码器。

结论：我们的方法获得了出色的幻觉效果，并以1.82dB PSNR的较大幅度优于最新技术。

TDAE论文阅读笔记
图1.我们的方法与基于CNN的面部幻觉URDGN的比较[25]。（a）16×16LR输入图像。（b）128×128HR原始图像。（c）去噪并对齐的LR图像。我们首先应用BM3D [4]，然后应用STN [10]。（d）训练数据集中对应最相似的面孔。（e）（c）的三次插值。（f）URDGN生成的图像。请注意，URDGN超级解析去噪和对齐的LR图像，而不是原始的LR输入（支持URDGN）。（g）由我们的解码器-编码器将经过去噪和对齐的LR图像作为中间输出。（h）我们的TDAE方法的最终幻觉的脸

TDAE论文阅读笔记
图 2.我们的变换判别解码器由两部分组成：一个变换上采样网络（在红色框中）和一个区别网络（在蓝色框中）

TDAE论文阅读笔记
图4.我们的变革性歧视性自动编码器的工作流程。方框的颜色表示图2和图3中的网络。

TDAE论文阅读笔记
图3.转换编码的架构

TDAE论文阅读笔记
图5.我们的方法与基于CNN的幻觉方法的比较。（a）输入的16×16LR图像。（b）原始的128×128HR图像（用于比较）。（c）（a）的去噪和对齐版本。（d）URDGN的结果[25]。（e）CBN的结果[29]。（f）DEC1的结果。（g）我们的ENC投影的对齐且无噪音的LR面。（h）我们的最终结果

TDAE论文阅读笔记
图6.在噪声水平为10％时与最新技术的比较。（a）未对准且有噪声的LR输入。（b）原始HRimage。（c）双三次插值。（d）[6]的结果。（e）[22]的结果。（f）[29]的结果。（g）[25]的结果。（h）我们的方法

TDAE论文阅读笔记
图8.不同噪声水平下我们的结果的可视化。实地HR图像请参见图5（b）。

结论

我们提出了一种变革性的自动编码器网络，可以以极富挑战性的8倍采样因子对超低分辨率（16×16像素）的未对准且嘈杂的人脸图像进行超分辨。我们利用了新的解码器-编码器-解码器体系结构。我们的网络共同对齐，消除噪声，并区分幻觉输入图像。由于我们的方法与图像噪声，面部姿势和空间变形无关，因此非常实用。同时，它可以产生丰富而真实的面部细节。

TDAE论文阅读笔记

题目：Hallucinating Very Low-Resolution Unaligned and Noisy Face Images byTransformative Discriminative Autoencoders∗

中文：变形性判别式自动编码器幻觉极低分辨率未对准且嘈杂的人脸图像

摘要

结论

继续阅读

【配准】弱监督(Weakly-Supervised)系列配准论文阅读

论文阅读：Fast R-CNN1、论文总述2、RCNN和SPPnet的缺点3、SPPnet不能更新SPP层之前的参数的原因4、Multi-task loss5、Truncated SVD for faster detection6、Which layers to fine-tune?（检测时从哪个层开始finetune）7、 Does multi-task training help?参考文献

强化学习论文笔记：Real-Time Reinforcement Learning简介问题方法SAC作为Baseline，Metrics是平均累计回报。总结

[论文阅读：姿态识别&Transformer] TransPose: Keypoint Localization via Transformer 2021 ICCV1. 摘要2.主要工作3. Contributions4. 框架总览 4.1. Architecture 5. Experiments

论文分享（三）——加权采样音频对抗样本攻击一.介绍二.相关工作三.背景四.方法五.实验结果六.总结

Few-Shot Object Detection via Sample Processing

Lattice-BERT 论文阅读Motivation 创新点

CVPR2020场景文字数据增强（python实现）

文献阅读--Certified Adversarial Robustness via Randomized Smoothing1 概述2 问题的引出3 Randomized smoothing

新手如何快速入门车辆控制领域？（附带读论文的工具）

Fast Spatio-Temporal Residual Network for Video Super-Resolution阅读理解

论文阅读——Parallel Multi-Resolution Fusion Network for Image Inpainting网络结构损失函数

Glove公式推导

《论文阅读》SAPBERT: Speaker-Aware Pretrained BERT for Emotion Recognition in Conversation

目标检测系相关论文阅读基础网络检测算法框架优化方向

论文阅读笔记（三）：Research on Network Attack Effect Evaluation Based on Confrontational Perspective一. 论文简介二. 创新点和贡献：三. 相关领域的概述(related work)四. 作者的方案五. 主要的信息流（approach）六. 总结