Towards Automated Testing and Robustification by Semantic Adversarial Data Generation
Abstract
作者提出了一种语意对抗训练编辑器,该方法可以合理的合成一种困难样本,用来使目标模型失效,反过来说,如果在训练时使用该方法也可以让模型更加鲁棒。
1. Introduction
合成的样本在数据集分布之外,但人眼任然可以识别。作者通过真实数据点入手,通过一个可微分合成器模型进行约束语义编辑。该编辑器将物体的形状与外观颜色分离,并保证数据的姿势不变,从而保证了变化的最小化与真实性。
该方法的关键技术就是将合成图像的外观颜色变化限制在真实数据的形状之内:
- 从真实数据中抽取某一类的数据作为一组指导数据
- 利用指导数据对目标对象优化,得到一个新的数据,该数据有着目标对象的形状与指导数据的颜色
主要贡献:
- 提出一种自动测试计算机视觉模型缺点的方法
- 设计了一个能够解耦合物体形状与外观颜色的合成器网络
- 合成的图片任然在真实图片的分类边界内,但具有其他图像的外观颜色,由此可以欺瞒目标网络
- 提高网络泛化能力
2. Related works
该工作可以实现:
- 已有网络的鲁棒性测试
- 语义对抗攻击
- 数据扩充
- 网络泛化
3. Synthesizing Sementic Adversarial Object
两个贡献:
- 保持目标形状不变,改变其外观颜色,该过程由一个二值部分分割网络构成
- 提出了一种新的优化公式
3.1 Synthesizer design
(1) shape coder
该网络有一个Unet结构构成:
- 输入:RGB图像
- 输出: Z ∈ R K × M × N Zin R^{Ktimes Mtimes N} Z∈RK×M×N;其中 K K K是将图片分割的份数, M , N M,N M,N是尺寸, Z k i j Z_{kij} Zkij是指在每一个通道的 { i , j } {i,j} {i,j}位置上被定义为 K K K区域的概率
为了将物体的形状与外观颜色分割,我们需要让 Z Z Z只利用空间布局上的信息
获取part—probability: P k i j = s o f t m a x k [ Z i j ] P_{kij}=softmax_{k}[Z_{ij}] Pkij=softmaxk[Zij]
通过采样变为二值mask: Ω k i j = g u m b e l _ s o f t m a x k [ P i j ] Omega_{kij}=gumbel_softmax_k[P_{ij}] Ωkij=gumbel_softmaxk[Pij]
(2)Appearance encoder
由CNN编码
输入:RGB图像
输出: A ∈ R D × M × N Ain R^{Dtimes Mtimes N} A∈RD×M×N
这个外观颜色输出
A
A
A对应着分割的区域数量被减少为
K
K
K个部分,表达为:
V
=
[
v
1
,
v
2
,
.
.
.
,
v
k
]
V=[v_1,v_2,...,v_k]
V=[v1,v2,...,vk],其中每一个
v
v
v都是由
A
A
A与
P
P
P相乘得来;
v
k
=
∑
i
j
P
k
i
j
A
i
j
v_k = sum_{ij}P_{kij}A_{ij}
vk=ij∑PkijAij
(3) Decoder Network
输入RGB图像 y y y,得到appearance vector : V y V^y Vy
输入RGB图像 x x x,得到binary part segmentation : Ω x Omega^x Ωx
外观颜色向量首先映射到相对应的二值部分分割图中来重建空间表现图 : A ~ y = V y Ω x tilde{A}^y=V^yOmega^x A~y=VyΩx
解码器结构采用空间自适应归一化层,以不同的分辨率输入appearance code,生成四通道输出(图像+mask)
(4) Training the Synthesizer
Adversarial discriminator: D D D
Autoencode:由重建模型的损失 l 1 l1 l1和分割mask的交叉熵损失进行优化
步骤:
- 由 x x x做简单的仿射变换得到 T ( x ) T(x) T(x),此为成对数据,由此可以利用由 Ω T ( x ) Omega^{T(x)} ΩT(x)提取的形状与由 V x V^x Vx提取的外观颜色重建 x x x
- 通过the discriminator real/fake loss和cyclic reconstruction loss训练模型将外观颜色迁移到任意随机图片 y y y: x y = V x Ω y xy=V^xOmega^y xy=VxΩy
- 获取 x y xy xy的外观颜色 V x y V^{xy} Vxy,重建原始输入 x ~ = G ( Ω x , V x y ) tilde{x}=G(Omega^x,V^{xy}) x~=G(Ωx,Vxy)
此外 Ω T ( x ) = T ( Ω x ) Omega^{T(x)}=T(Omega^x) ΩT(x)=T(Ωx)
整理损失函数如下:
L
r
=
∣
x
−
G
(
Ω
x
,
V
x
)
∣
+
∣
T
(
x
)
−
G
(
Ω
T
(
x
)
,
V
x
)
∣
+
∣
x
−
G
(
Ω
x
,
V
x
y
)
∣
(1)
L_r=|x-G(Omega^x,V^x)|+|T(x)-G(Omega^{T(x)},V^x)|+|x-G(Omega^x,V^{xy})|tag{1}
Lr=∣x−G(Ωx,Vx)∣+∣T(x)−G(ΩT(x),Vx)∣+∣x−G(Ωx,Vxy)∣(1)
L D = D ( G ( Ω x , V x ) ) + D ( G ( Ω T ( x ) , V x ) ) + D ( G ( Ω x , V x ) ) (2) L_D=D(G(Omega^x,V^x))+D(G(Omega^{T(x)},V^x))+D(G(Omega^x,V^{x}))tag{2} LD=D(G(Ωx,Vx))+D(G(ΩT(x),Vx))+D(G(Ωx,Vx))(2)
L a = ∣ ∣ V x − V T ( x ) ∣ ∣ + ∣ ∣ V x − V x y ∣ ∣ (3) L_a=||V^x-V^{T(x)}||+||V^x-V^{xy}||tag{3} La=∣∣Vx−VT(x)∣∣+∣∣Vx−Vxy∣∣(3)
L p = − P T ( x ) log ( T ( P x ) ) (4) L_p=-P^{T(x)}log(T(P^x))tag{4} Lp=−PT(x)log(T(Px))(4)
3.2 Synthesizing Semantic Adversaries
- input: x ∈ C xin C x∈C
- shape : Ω x Omega^x Ωx
- appearance: V x V^x Vx
- detector:O
- canva image: C − x C^{-x} C−x
- synthesize: C − x + G ( Ω x , V x ) C^{-x}+G(Omega^x,V^x) C−x+G(Ωx,Vx)
最后
以上就是等待棒球最近收集整理的关于Towards Automated Testing and Robustification by Semantic Adversarial Data Generation论文阅读笔记Towards Automated Testing and Robustification by Semantic Adversarial Data Generation的全部内容,更多相关Towards内容请搜索靠谱客的其他文章。
发表评论 取消回复