新闻中心

EEPW首页 > 智能计算 > 设计应用 > DeepMind的TF Hub demo诠释「史上最强 GAN 图像生成器」

DeepMind的TF Hub demo诠释「史上最强 GAN 图像生成器」

作者:时间:2018-11-21来源:网络收藏

  上图是样本生成单元格的控制界面,可以控制:生成样本数量、截断值、噪声种子、和类别的参数。我们可以看看下图的例子来说明各自的作用。

本文引用地址:http://www.eepw.com.cn/article/201811/394648.htm

  如上图所示,很容易看出,生成样本数量(10)和类别(芝士汉堡)就是字面的意思,那么截断值、噪声种子分别有什么作用呢?仅用一张图看不出来,我们修改一下参数看看区别就行了。

  这时,我们只需要拖动滑块来修改参数,然后 Colab 会立刻执行新参数设置下的任务,但这也意味着我们一次只能修改一个参数。

  经过多次实验,我们发现,截断值越大,生成样本的多样性越大;实际上,截断值控制的是隐变量分布(一般呈高斯型)的截断距离,也就是采样范围,因此不难理解其对多样性的作用。




  从上到下:截断值为 0.02、0.26、0.58、1.0 的芝士汉堡生成结果。

  而噪声种子的值对生成结果的影响主要是每次生成样本的初始条件,从而最终生成结果也会不同,可以用它来改善生成多样性。

  最后是类别参数的控制,该 Colab 中提供了 1000 个类别选项,可玩性很足,但要找到自己想要的类别实在有点困难。可以这样操作,双击这个单元格,代码会显示在左侧,右侧会出现铅笔图标,点击该图标后就能查看完整列表,在这个列表下用 Ctrl+F 搜索类别的编号,再返回修改,这样就简单多了。


  我们尝试生成了埃及猫(285)和大熊猫(388)的样本:

  可以发现,埃及猫的眼神不太对,大熊猫有点营养不良。论文给出的结果很真实自然,但在这个 Colab 实验中我们也能发现存在很多「不自然」的生成样本。

  接下来,我们来尝试图像插值任务。

  如上图所示,这个任务的可控参数有:样本数量、插值数量、截断值、噪声种子、以及用于插值的图像类别 A 和 B。样本数量是指每次插值时类别 A 和类别 B 的的初始样本数量,如下图所示样本数量为 2。下图展示了一些示例,供大家参考。注意该图像插值是生成样本之间的插值,所以左右两侧的原图也会有些不自然。

  图像插值结果示例,其中样本数量为 2、插值数量为 5、截断值为 0.2、噪声种子为 0、类别 A 为金毛、类别 B 为鸡。

  其它参数不变,插值数量为 10 的插值结果示例。

  金毛和埃及猫的图像插值结果。

  知道怎么用了吧?自己去耍吧~


上一页 1 2 下一页

评论


技术专区

关闭