【深度学习】半监督模型（Π-Model、Temporal Ensembling、Mean Teacher）

两种误差：一致性误差（consistency cost）和分类误差

一致性误差： $J(\theta)=\mathbb{E}_{x,\eta',\eta}[||f(x,\theta',\eta')-f(x,\theta,\eta)||^2]$

三种半监督模型的区别（这些都用的噪声扰动）：
Π-Model： $\theta'=\theta$
Temporal Ensembling： $f(x,\theta',\eta')$ 用连续预测的加权平均值逼近
Mean Teacher： $\theta'_t=\alpha\theta_{t-1}'+(1-\alpha)\theta_t$