Towards Automated Testing and Robustification by Semantic Adversarial Data Generation论文阅读笔记Towards Automated Testing and Robustification by Semantic Adversarial Data Generation

218 阅读 0 评论 144 点赞

Towards Automated Testing and Robustification by Semantic Adversarial Data Generation

作者提出了一种语意对抗训练编辑器，该方法可以合理的合成一种困难样本，用来使目标模型失效，反过来说，如果在训练时使用该方法也可以让模型更加鲁棒。

合成的样本在数据集分布之外，但人眼任然可以识别。作者通过真实数据点入手，通过一个可微分合成器模型进行约束语义编辑。该编辑器将物体的形状与外观颜色分离，并保证数据的姿势不变，从而保证了变化的最小化与真实性。

该方法的关键技术就是将合成图像的外观颜色变化限制在真实数据的形状之内：

主要贡献：

在这里插入图片描述

该工作可以实现：

两个贡献：

该网络有一个Unet结构构成：

输入：RGB图像
输出： $R^{Ktimes Mtimes N}$ ;其中 $K$ 是将图片分割的份数， $M, N$ 是尺寸， $Z_{kij}$ 是指在每一个通道的 ${i,j}$ 位置上被定义为 $K$ 区域的概率

为了将物体的形状与外观颜色分割，我们需要让 $Z$ 只利用空间布局上的信息

获取part—probability： $P_{kij}=softmax_{k}[Z_{ij}]$

通过采样变为二值mask： $Omega_{kij}=gumbel_softmax_k[P_{ij}]$

由CNN编码

输入：RGB图像

输出： $R^{Dtimes Mtimes N}$

这个外观颜色输出 $A$ 对应着分割的区域数量被减少为 $K$ 个部分，表达为： $V=[v_1,v_2,...,v_k]$ ，其中每一个 $v$ 都是由 $A$ 与 $P$ 相乘得来；
$v_k = sum_{ij}P_{kij}A_{ij}$

输入RGB图像 $y$ ，得到appearance vector ： $V^y$

输入RGB图像 $x$ ，得到binary part segmentation ： $Omega^x$

外观颜色向量首先映射到相对应的二值部分分割图中来重建空间表现图： $tilde{A}^y=V^yOmega^x$

解码器结构采用空间自适应归一化层，以不同的分辨率输入appearance code，生成四通道输出（图像+mask）

Adversarial discriminator： $D$

Autoencode：由重建模型的损失 $l 1$ 和分割mask的交叉熵损失进行优化

步骤：

由 $x$ 做简单的仿射变换得到 $T (x)$ ，此为成对数据，由此可以利用由 $Omega^{T(x)}$ 提取的形状与由 $V^x$ 提取的外观颜色重建 $x$
通过the discriminator real/fake loss和cyclic reconstruction loss训练模型将外观颜色迁移到任意随机图片 $y$ ： $xy=V^xOmega^y$
获取 $x y$ 的外观颜色 $V^{xy}$ ，重建原始输入 $tilde{x}=G(Omega^x,V^{xy})$