GANã®å¦ç¿’å®Ÿè£… - ãŸã‚Œã±ã‚“ã®ã³ã¼ãƒ¼ã‚ã

å®Ÿã¯ãƒãƒžã‚Šã©ã“ã‚ã ã‚‰ã‘ã ã£ãŸã‚Šã™ã‚‹ã€‚

Gã‚’å…ˆã«Backwardã™ã‚‹ã¨Dã®.gradãŒè²¯ã¾ã‚‹
- => "Då…ˆã«å¦ç¿’" or "Gã®å¦ç¿’æ™‚ã¯D.requires_grad = false" or "Då¦ç¿’å‰ã«NetD.zero_grad()"
Då¦ç¿’æ™‚ã«G(z)ã‚’æ¸¡ã™ã¨Gã«ã¾ã§Backpropã—ã¦ç„¡é§„ & Gã®.gradãŒè²¯ã¾ã‚‹
- => "D(G(z).detach())" or "Dã®å¦ç¿’æ™‚ã¯G.requires_grad = false" or "Gå¦ç¿’å‰ã«NetG.zero_grad()"
G/Då¦ç¿’ã®2å›žã§ä¸¡æ–¹G(z) forwardã—ã¦ç„¡é§„ (2 forward pass)
- => "fake = G(z)ã§ä¿æŒã€Dã®å¦ç¿’ã«D(fake.detach())ã€Gã®å¦ç¿’ã¯D(fake)"
  - G forwardæ™‚ã®requires_gradãŒå¿…è¦ãªã®ã§requires_gradã„ã˜ã‚‹ä»–ã¨ã®è¡çªã«æ³¨æ„
  - Gå…ˆã«å¦ç¿’ã™ã‚‹ã¨ fake = G_old(z)ã‚’ä½¿ã£ã¦DãŒå¦ç¿’ã™ã‚‹ => fakeå†åˆ©ç”¨ãªã‚‰å¦ç¿’ã¯Då…ˆGå¾Œ

æ¨™æº–å®Ÿè£…#1: DCGAN - PyTorch official (tutorial, repository)

æ¨™æº–å®Ÿè£…#1pl: Vanilla GAN - PyTorch Lightning

fakeä¿æŒ

ç´ ç›´ã¨ã„ãˆã°ç´ ç›´ã ã‘ã©ã€æŠ½è±¡åŒ–ã¯ã—ã¥ã‚‰ã„å‡¦ç†.
PyTorch-Lightningã¨ã‹ã ã¨ç´ ç›´ã«ã¯ä½¿ãˆãªã„ï¼ˆbackwardå‘¨ã‚Šã™ã¹ã¦è‡ªå‰å‡¦ç†ãŒå¿…è¦ï¼‰.

å‰Šæ¸›é‡

10%ãã‚‰ã„è¨ˆç®—é‡ãŒæ¸›ã‚‹ (9 step => 8 step).
GãŒé‡ã„ã¨åŠ¹æžœãŒå¤§ãããªã‚Šãã†

# D training
## forward
G(z) => fake
D(fake)
D(real)
## backward
D(fake)
D(real)
# G training
## forward
G(z) => fake (ã“ã“ã ã‘çœç•¥ã§ãã‚‹ï¼‰
D(fake)
## backward
D(fake)
G(z)

ã–ã£ãã‚Šã¨ã ã‘ç†è§£ã—ã¦ã„ã‚‹ã‚‚ã®

separate mini-batch: ãƒãƒƒãƒå˜ä½ã®å‡¦ç†ã¯Realå†…ã€Fakeå†…ã§ãŠã“ãªã†ã‚ˆã†ã«ã™ã‚‹
ä¾‹: (loss(D(real)) + loss(D(fake))).backward()ã™ã‚‹ã¨ä¸¡æ–¹ã®batchã®lossãŒBatchNormã«æµã‚Œè¾¼ã¿ã€ãƒãƒƒãƒå†…çµ±è¨ˆãŒreal/fakeã”ã¡ã‚ƒæ··ãœã«ãªã‚‹.

Now, with the gradients accumulated from both the all-real and all-fake batches, we call a step of the Discriminatorâ€™s optimizer.

fakeä¿æŒ

å‰Šæ¸›é‡

ã–ã£ãã‚Šã¨ã ã‘ç†è§£ã—ã¦ã„ã‚‹ã‚‚ã®

fakeä¿æŒ

å‰Šæ¸›é‡

ã–ã£ãã‚Šã¨ã ã‘ç†è§£ã—ã¦ã„ã‚‹ã‚‚ã®