ã‚¯ãƒªã‚¹ãƒžã‚¹ã«Chainerã‚’ä½¿ã£ã¦å¦„æƒ³åŠ›ã‚’å¯è¦–åŒ–ã—ãŸã€‚

çš†ã•ã‚“ã“ã‚“ã«ã¡ã¯
ãŠå…ƒæ°—ã§ã™ã‹ã€‚ã‚„ã£ã¨æ›¸ãåˆ‡ã‚Šã¾ã—ãŸã€‚

å®Ÿã¯ä»Šå¹´ã‚‚ã‚‚ã†å°‘ã—ã§ã™ã€‚
æ˜¨å¹´åº¦ã¯カノジョを作成ã—ã€ãã®å‰ã¯友利奈緒を真面目に解析ã—ã¦ã„ã¾ã™ã€‚

ã„ã‚„ãæ™‚ã®æµã‚Œã¯æ—©ã„ã‚‚ã®ã§ã™ã€‚
ã“ã‚Œã‚’è¸ã¾ãˆã€ä»Šå¹´ã¯ä½•ã‚’ã—ã‚ˆã†ã‹è€ƒãˆã¾ã—ãŸã€‚

Chainer Advent Calendar 25æ—¥ç›®ã§ã€çš†æ§˜ã®å¦„æƒ³åŠ›ã‚’å…·ç¾åŒ–ã—ãŸã„ã¨æ€ã„ã¾ã™ã€‚

å¦„æƒ³ã«ã¤ã„ã¦

ã•ã¦ã€è€ƒãˆã¦ã¿ã¦æ¬²ã—ã„ã€‚å¦„æƒ³ã¨ã„ã†ã‚‚ã®ã‚’
ç”»åƒã«ä¸è‡ªç„¶ã«æš—ã„ç®‡æ‰€ã€ä½•ã‹è¦‹ã«ãã„ãªãã¨æ€ã†ç®‡æ‰€ã€‚
ã“ã“ã¯ã“ã‚“ãªæ„Ÿã˜ã«ãªã£ã¦ã„ã‚‹ã¨æŽ¨æ¸¬ã—ã¦ã„ã‚‹ã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹ã€‚

ãã†ã€æŽ¨æ¸¬ã€ã„ã‚„ã€è£œå®Œã§ã™ã€‚
ã•ã¦ã€æœ¬é¡Œã§ã™ãŒã€éƒ¨åˆ†çš„ã«ãƒ¢ã‚¶ã‚¤ã‚¯ãŒã‹ã‹ã£ãŸç”»åƒã‚’è¦‹ã‚‹ã¨ã“ã“ã«ã¯ã“ã‚ŒãŒã‚ã‚‹ã¨å¦„æƒ³ã™ã‚‹ã§ã—ã‚‡ã†ã€‚
ãã‚“ãªã‚ã‘ã§ã€æœ¬æ—¥ã€çš†æ§˜ã®å¦„æƒ³ã‚’å…·ç¾åŒ–ã™ã‚‹ã€ã¤ã¾ã‚Šã€ãƒ¢ã‚¶ã‚¤ã‚¯ã‚’å¤–ã™ã“ã¨ã‚’è©¦ã¿ã¾ã™ã€‚

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã¨ã¯

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã¯æ¬¡ã®ã‚ˆã†ã«å®šç¾©ã•ã‚Œã¦ã„ã‚‹ã‚ˆã†ã§ã™ã€‚ï¼ˆWikipediaï¼‰

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ï¼ˆãƒ¢ã‚¶ã‚¤ã‚¯ã—ã‚‡ã‚Šï¼‰(è‹±èªž: mosaic processing)ãƒ»ãƒ”ã‚¯ã‚»ãƒ«åŒ– (è‹±èªž: pixelization)ã¨ã¯å†™çœŸãƒ»ç”»åƒãƒ»é™æ¢ç”»ãƒ»æ˜ åƒãƒ»å‹•ç”»ã«ãŠã„ã¦è¡¨ç¤ºã—ãŸããªã„éƒ¨åˆ†ã‚’ãƒ”ã‚¯ã‚»ãƒ«å˜ä½ã§è¦‹ãˆã«ããã™ã‚‹æ˜ åƒå‡¦ç†ã€‚ï¼ˆby Wikipediaï¼‰

è¦ã¯è¦‹ãˆã«ãã„éƒ¨åˆ†ã‚’åŠ å·¥ã™ã‚‹å‡¦ç†ã§ã™ã€‚ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†è‡ªä½“ã¯å¾Œã§è©³ç´°ã‚’è¿°ã¹ã¾ã™ã€‚

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã®ç¨®é¡ž

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã¯å¤§åˆ¥ã—ã¦2ç¨®é¡žã®æ–¹å¼ãŒã‚ã‚Šã¾ã™ã€‚
ãƒ¢ã‚¶ã‚¤ã‚¯ã¯ã€éžå¯é€†åœ§ç¸®ã€å¯é€†åœ§ç¸®ã®æ‰‹æ³•ã§ã™ã€‚

éžå¯é€†åœ§ç¸®ã¯å…ƒã«æˆ»ã™ã“ã¨ãŒã§ããªã„åœ§ç¸®æ–¹å¼ã§ã‚ã‚Šã€ãƒ¢ã‚¶ã‚¤ã‚¯ç”»åƒã‹ã‚‰å…ƒç”»åƒã‚’å®Œå…¨ã«å¾©å…ƒã™ã‚‹ã“ã¨ãŒã§ãã¾ã›ã‚“ã€‚
ãã‚Œã«å¯¾ã—ã€å¯é€†åœ§ç¸®ã¯å…ƒã«æˆ»ã™ã“ã¨ãŒå¯èƒ½ãªæ–¹å¼ã§ã‚ã‚Šã€ç¾åœ¨ã¯éžå¯é€†åœ§ç¸®ãŒä¸»æµã¨ãªã£ã¦ã„ã‚‹ãã†ã§ã™ã€‚
ï¼ˆå¯é€†åœ§ç¸®ã®ä»£è¡¨ä¾‹ã¨ã—ã¦FLMASKã¨å‘¼ã°ã‚Œã‚‹ãƒ„ãƒ¼ãƒ«ãŒæ˜”ã‚ã£ãŸã‚‰ã—ã„ã€åŒã˜ä¼šç¤¾ã®äººã«æ•™ãˆã¦ã‚‚ã‚‰ã£ãŸã€‚ï¼‰

ç¾åœ¨ã¯ã€éžå¯é€†åœ§ç¸®ã®æ–¹å¼ãŒä¸»æµã®ãŸã‚ã€æœ¬å®Ÿé¨“ã§ã‚‚åŒæ§˜ã®åœ§ç¸®æ–¹å¼ã‚’ãƒ™ãƒ¼ã‚¹ã«å®Ÿç¾ã—ã¾ã™ã€‚
æœ¬æ‰‹æ³•ã§é¸æŠžã—ãŸãƒ¢ã‚¶ã‚¤ã‚¯ã®æ‰‹æ³•ã¯æ¬¡ã®ã¨ãŠã‚Šã§ã™ã€‚

é»’ã„ãƒ¢ã‚¶ã‚¤ã‚¯ãƒ»ãƒ»ãƒ»ç”»é¢ã®ä¸€éƒ¨ãŒé»’ã„ãƒ¢ã‚¶ã‚¤ã‚¯ã¨ãªã‚‹ã€‚
ä¸å¤®å€¤ã‚’ç”¨ã„ãŸãƒ¢ã‚¶ã‚¤ã‚¯ãƒ»ãƒ»ãƒ»ã¼ã‹ã—ãŸã„ç®‡æ‰€ã‚’median filterã«ã™ã‚‹ã€‚
Gaussian Filterã‚’ä½¿ã£ãŸãƒ¢ã‚¶ã‚¤ã‚¯ãƒ»ãƒ»ãƒ»ã¼ã‹ã—ãŸã„ç®‡æ‰€ã«Gaussian Filterã‚’ä½¿ã†ã€‚

ä»Šå›žã¯å®Ÿç”¨æ€§ã‚’é‡è¦–ã™ã‚‹ãŸã‚ã€éƒ¨åˆ†ç”»åƒã¸ã®é©ç”¨ã‚‚è©¦ã¿ã¾ã™ã€‚
ã“ã‚Œã¯ã€å…¨ä½“ã‚’éš ã•ãªã‘ã‚Œã°ãªã‚‰ãªã„ã‚±ãƒ¼ã‚¹ã¯å°‘ãªã
éƒ¨åˆ†çš„ã«è¦‹ã¦ã¯ã„ã‘ãªã„ã‚‚ã®ã¨ã—ã¦éš ã—ã¦ã„ã‚‹ã“ã¨ã‚‚ã‚ã‚‹ã‹ã‚‰ã§ã™ã€‚

ä¹±æ•°ã«ã‚ˆã‚‹åŸ‹è¾¼ã‚‚ç”»åƒã«å¯¾ã—ã€å®Œæˆå“ãŒã‚ã¾ã‚Šã«ä¸è‡ªç„¶ãªã®ã§åˆ©ç”¨ã—ã¾ã›ã‚“ã€‚

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®å®Ÿè£…

æœ¬å‡¦ç†ã¯Pythonã§å®Ÿè£…ã—ã¾ã™ã€‚

ãƒ©ãƒ³ãƒ€ãƒ ã§64æžšå‡ºåŠ›ã—ãŸç”»åƒã¯æ¬¡ã®é€šã‚Šã§ã™ã€‚
f:id:tereka:20171108212215p:plain

ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®åŽé›†

æœ¬ç”»åƒå‡¦ç†ã§ç”¨ã„ã‚‹ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’åŽé›†ã—ã¾ã™ã€‚
ä»Šå›žã¯ãƒ©ãƒ–ãƒ©ã‚¤ãƒ–ã®ãƒ‡ãƒ¼ã‚¿ã‚’åˆ©ç”¨ã—ã¦ãƒ¢ã‚¶ã‚¤ã‚¯é™¤åŽ»ã®å®Ÿé¨“ã‚’è¡Œã„ã¾ã™ã€‚

Googliser

Googliserã¯Googleç”»åƒæ¤œç´¢ã‚’ç”¨ã„ã¦ã€ç”»åƒã‚’å–å¾—ã™ã‚‹ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã§ã™ã€‚
ã“ã®ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã‚’åˆ©ç”¨ã—ã¦ãƒ©ãƒ–ãƒ©ã‚¤ãƒ–ã®ãƒ‡ãƒ¼ã‚¿ã‚’é›†ã‚ã¾ã™ã€‚

github.com

googliserã¯cloneã—ã¦å†…éƒ¨ã«ã‚ã‚‹googliser.shã‚’å‹•ä½œã•ã›ã‚Œã°å®Ÿè¡Œå¯èƒ½ã§ã™ã€‚

./googliser.sh -p "çŸ¢æ¾¤ã«ã“" --number 1000

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

ã¯ã˜ã‚ã®æ–¹ã§ä¸€èˆ¬çš„ãªãƒ¢ã‚¶ã‚¤ã‚¯ãŒéžå¯é€†åœ§ç¸®ã§ã‚ã‚‹ã¨èª¬æ˜Žã—ã¾ã—ãŸã€‚
ãã®ãŸã‚ã€åŽ³å¯†ã«ã¯ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã‚’å¤–ã™ã®ã§ã¯ãªãã€ãƒ¢ã‚¶ã‚¤ã‚¯ãŒã‹ã‹ã£ãŸç®‡æ‰€ã‚’è£œå®Œã™ã‚‹å‡¦ç†ã‚’è¡Œã„ã¾ã™ã€‚

ã“ã®è£œå®Œå‡¦ç†ã§ã™ãŒã€ç”Ÿæˆãƒ¢ãƒ‡ãƒ«ã§åˆ©ç”¨ã•ã‚Œã‚‹GANã¨Semantic Segmentationã®æŠ€è¡“ã‚’å¿œç”¨ã—ã¦å®Ÿç¾ã—ã¾ã™ã€‚
SIGGRAPH 2017ã§ç™ºè¡¨ã®ã‚ã£ãŸã€ŒGlobally and Locally Consistent Image Completionã€ã‚’å‚è€ƒã«å®Ÿè£…ã—ã¾ã™ã€‚

Globally and Locally Consistent Image Completion

Globally and Locally Consistent Image Completionã¯
Deep Learningã‚’åˆ©ç”¨ã—ãŸç”»åƒè£œå®Œã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã§ã™ã€‚

f:id:tereka:20171216155459p:plain

æœ€åˆã«Generatorã‚’å¦ç¿’ã—ã€æ¬¡ã«Discriminatorã‚’å¦ç¿’ã—ã€
æœ€å¾Œã«GANã®æ–¹å¼ã§Generator, Discriminatorã®ä¸¡æ–¹ã‚’å¦ç¿’ã—ã€
é«˜é€Ÿãƒžãƒ¼ãƒãƒ³ã‚°æ³•ã¨å‘¼ã°ã‚Œã‚‹ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã§å‘¨å›²ã‚’è£œå®Œã—ã¾ã™ã€‚

å†…éƒ¨ã§ã„ãã¤ã‹ç´°ã‹ã„æ‰‹æ³•ã¯ã‚ã‚‹ã®ã§ã™ãŒã€ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ã®æ§‹é€ ã‚’ãã®ã¾ã¾åˆ©ç”¨ã—ã€
è«¸ã€…ã®å‡¦ç†ã®å®Ÿè£…ã‚’ã—ã¦ã„ã¾ã›ã‚“ã€‚ï¼ˆé«˜é€Ÿãƒžãƒ¼ãƒãƒ³ã‚°æ³•ï¼‰

Generatorã‚’å¦ç¿’ã™ã‚‹éš›ã«ã¯å¾©å…ƒç”»åƒã‚’ç”Ÿæˆã—ã€Maskéƒ¨ã®èª¤å·®ã«ã‚ˆã‚Šæ›´æ–°ã—ã¾ã™ã€‚
è§£åƒåº¦ã‚’è½ã¨ã•ãšã€DilatedConvolutionã§å¤§åŸŸçš„ãªç‰¹å¾´ã‚’åˆ©ç”¨ã™ã‚‹ç®‡æ‰€ã¨å¾Œæ®µã®Discriminatorã§ã¯ã€
å…¨ä½“ã®ç”»åƒã¨éƒ¨åˆ†ç”»åƒï¼ˆãƒžã‚¹ã‚¯ï¼‰ã‚’å…¥åŠ›ã¨ã—ã€åˆ¤å®šã—ã¦ã„ã¾ã™ã€‚

Chainerã§æ§‹ç¯‰ã—ãŸãƒ¢ã‚¶ã‚¤ã‚¯å¤–ã—ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

ã•ã¦ã€ä½œã£ã¦ã¿ã¾ã—ãŸã€‚çµæ§‹é•·ããªã£ãŸã®ã§å…¨ä½“ã¯å¾Œã»ã©githubã¸ç½®ã„ã¦ãŠãã¾ã™ã€‚
ãƒ¢ãƒ‡ãƒ«ã¨ã‚¢ãƒƒãƒ—ãƒãƒ¼ãƒ‰éƒ¨ã«ã¤ã„ã¦ã¯æ¬¡ã§è¨˜è¿°ã—ã¾ã™ã€‚
ã‚³ãƒ¼ãƒ‰ã¯ã‚ã¾ã‚Šãã£ã¡ã‚Šè¨˜è¼‰ã—ã¦ã„ãªã„ã®ã§ã€ç¶ºéº—ã«ã™ã‚‹ãŸã‚ã«ã¯ã‚‚ã†å°‘ã—æ”¹è‰¯ãŒå¿…è¦ã§ã™ã€‚

ç”»åƒã¯128x128ã§å…¥åŠ›ã—ã¦ã„ã¾ã™ã€‚ï¼ˆå‡¦ç†ã®éƒ½åˆï¼‰

Generator

ã¾ãšã¯ã€Generatorã®ã‚³ãƒ¼ãƒ‰ã§ã™ã€‚
ã“ã“ã§è‚ã¨ãªã‚‹ã®ã¯ã€Dilated Convolutionã‚’ä½¿ã„ã€å¤§åŸŸçš„ãªç‰¹å¾´ã‚’è¦‹ã¦ã„ã‚‹ã“ã¨
ãã—ã¦ã€èª¤å·®è¨ˆç®—éƒ¨ï¼ˆ__call__ï¼‰ã®å¼•æ•°ã«mskã‚’å…¥ã‚Œã¦ã„ã¾ã™ã€‚
ãƒžã‚¹ã‚¯ã‚’å…±ã«å…¥åŠ›ã¨ã—ãŸå ´åˆã«ãƒ¢ã‚¶ã‚¤ã‚¯é ˜åŸŸä»¥å¤–ã®èª¤å·®ã‚’0ã«ã—ã¦ã„ã¾ã™ã€‚

class GLCICGenerator(chainer.Chain):
    def __init__(self):
        super(GLCICGenerator, self).__init__()
        with self.init_scope():
            self.conv0 = L.Convolution2D(4, 64, ksize=3, stride=1, pad=1)
            self.bn0 = L.BatchNormalization(64)

            self.conv1_1 = L.Convolution2D(64, 128, ksize=3, stride=2, pad=1)
            self.bn1_1 = L.BatchNormalization(128)
            self.conv1_2 = L.Convolution2D(128, 128, ksize=3, stride=1, pad=1)
            self.bn1_2 = L.BatchNormalization(128)

            self.conv2_1 = L.Convolution2D(128, 256, ksize=3, stride=2, pad=1)
            self.bn2_1 = L.BatchNormalization(256)
            self.conv2_2 = L.Convolution2D(256, 256, ksize=3, stride=1, pad=1)
            self.bn2_2 = L.BatchNormalization(256)
            self.conv2_3 = L.Convolution2D(256, 256, ksize=3, stride=1, pad=1)
            self.bn2_3 = L.BatchNormalization(256)
            self.conv2_4 = L.DilatedConvolution2D(256, 256, ksize=3, stride=1, pad=2, dilate=2)
            self.bn2_4 = L.BatchNormalization(256)
            self.conv2_5 = L.DilatedConvolution2D(256, 256, ksize=3, stride=1, pad=4, dilate=4)
            self.bn2_5 = L.BatchNormalization(256)
            self.conv2_6 = L.DilatedConvolution2D(256, 256, ksize=3, stride=1, pad=8, dilate=8)
            self.bn2_6 = L.BatchNormalization(256)
            self.conv2_7 = L.Convolution2D(256, 256, ksize=3, stride=1, pad=1)
            self.bn2_7 = L.BatchNormalization(256)
            self.conv2_8 = L.Convolution2D(256, 256, ksize=3, stride=1, pad=1)
            self.bn2_8 = L.BatchNormalization(256)

            self.deconv2_1 = L.Deconvolution2D(256, 128, ksize=4, stride=2, pad=1)
            self.debn2_1 = L.BatchNormalization(128)
            self.deconv2_2 = L.Convolution2D(128, 128, ksize=3, stride=1, pad=1)
            self.debn2_2 = L.BatchNormalization(128)

            self.deconv1_1 = L.Deconvolution2D(128, 128, ksize=4, stride=2, pad=1)
            self.debn1_1 = L.BatchNormalization(128)
            self.deconv1_2 = L.Convolution2D(128, 64, ksize=3, stride=1, pad=1)
            self.debn1_2 = L.BatchNormalization(64)

            self.deconv0 = L.Convolution2D(64, 3, ksize=3, stride=1, pad=1)

    def predict(self, x):
        h = F.relu(self.bn0(self.conv0(x)))
        h = F.relu(self.bn1_1(self.conv1_1(h)))
        h = F.relu(self.bn1_2(self.conv1_2(h)))

        h = F.relu(self.bn2_1(self.conv2_1(h)))
        h = F.relu(self.bn2_2(self.conv2_2(h)))
        h = F.relu(self.bn2_3(self.conv2_3(h)))
        h = F.relu(self.bn2_4(self.conv2_4(h)))
        h = F.relu(self.bn2_5(self.conv2_5(h)))
        h = F.relu(self.bn2_6(self.conv2_6(h)))
        h = F.relu(self.bn2_7(self.conv2_7(h)))
        h = F.relu(self.bn2_8(self.conv2_8(h)))

        h = F.relu(self.debn2_1(self.deconv2_1(h)))
        h = F.relu(self.debn2_2(self.deconv2_2(h)))
        
        h = F.relu(self.debn1_1(self.deconv1_1(h)))
        h = F.relu(self.debn1_2(self.deconv1_2(h)))

        return F.sigmoid(self.deconv0(h))

    def __call__(self, x, msk=None, t=None):
        h = self.predict(x)
        if msk is not None:
            h = msk * h
            t = msk * t
            loss = F.mean_squared_error(h, t)
            chainer.report({'loss': loss}, self)
            return loss
        else:
            return h

Discriminator

æ¬¡ã«Discriminatorã§ã™ã€‚ç‰¹å¾´ã¯å…¥åŠ›ãŒå…¨ä½“ã®ç”»åƒã¨ãƒ¢ã‚¶ã‚¤ã‚¯ç”»åƒã‚’ä¸å¿ƒã¨ã™ã‚‹
64x64ã®ç”»åƒã‚’å…¥åŠ›ã¨ã—ã¦ã„ã¾ã™ã€‚æœ€å¾Œã«çµåˆã—ã€å‡ºåŠ›ã‚’ç®—å‡ºã—ã¦ã„ã¾ã™ã€‚

class GLCICDiscriminator(chainer.Chain):
    def __init__(self):
        super(GLCICDiscriminator, self).__init__()
        with self.init_scope():
            self.c0_l = L.Convolution2D(3, 32, 3, 2, 1)
            self.bn0_l = L.BatchNormalization(32)
            self.c1_l = L.Convolution2D(32, 64, 3, 2, 1)
            self.bn1_l = L.BatchNormalization(64)
            self.c2_l = L.Convolution2D(64, 128, 3, 2, 1)
            self.bn2_l = L.BatchNormalization(128)
            self.c3_l = L.Convolution2D(128, 256, 3, 2, 1)
            self.bn3_l = L.BatchNormalization(256)
            self.c4_l = L.Convolution2D(256, 512, 3, 2, 1)
            self.bn4_l = L.BatchNormalization(512)

            self.c0_g = L.Convolution2D(3, 16, 3, 2, 1)
            self.bn0_g = L.BatchNormalization(16)
            self.c1_g = L.Convolution2D(16, 32, 3, 2, 1)
            self.bn1_g = L.BatchNormalization(32)
            self.c2_g = L.Convolution2D(32, 64, 3, 2, 1)
            self.bn2_g = L.BatchNormalization(64)
            self.c3_g = L.Convolution2D(64, 128, 3, 2, 1)
            self.bn3_g = L.BatchNormalization(128)
            self.c4_g = L.Convolution2D(128, 256, 3, 2, 1)
            self.bn4_g = L.BatchNormalization(256)
            self.c5_g = L.Convolution2D(256, 512, 3, 2, 1)
            self.bn5_g = L.BatchNormalization(512)

            self.fc = L.Linear(None, 1)

    def __call__(self, x1, x2):
        h1 = F.leaky_relu(self.bn0_l(self.c0_l(x1)))
        h1 = F.leaky_relu(self.bn1_l(self.c1_l(h1)))
        h1 = F.leaky_relu(self.bn2_l(self.c2_l(h1)))
        h1 = F.leaky_relu(self.bn3_l(self.c3_l(h1)))
        h1 = F.leaky_relu(self.bn4_l(self.c4_l(h1)))

        h2 = F.leaky_relu(self.bn0_g(self.c0_g(x2)))
        h2 = F.leaky_relu(self.bn1_g(self.c1_g(h2)))
        h2 = F.leaky_relu(self.bn2_g(self.c2_g(h2)))
        h2 = F.leaky_relu(self.bn3_g(self.c3_g(h2)))
        h2 = F.leaky_relu(self.bn4_g(self.c4_g(h2)))
        h2 = F.leaky_relu(self.bn5_g(self.c5_g(h2)))

        concat_h = F.concat([h1, h2])
        return self.fc(concat_h)

Updater

æœ€å¾Œã«æ›´æ–°ç”¨ã®Updaterã§ã™ã€‚
ã“ã®Updaterã¯Discriminatoræ›´æ–°ã¨GANæ›´æ–°ç”¨ã§ã™ã€‚
æœ¬ä½“ã¯update_coreé–¢æ•°ã«ãªã‚Šã¾ã™ã€‚update_coreéƒ¨ã§ã¯æ¬¡ã®ã“ã¨ã‚’ã—ã¦ã„ã¾ã™ã€‚

Discriminatorã®èª¤å·®ã«å¿…è¦ãªæƒ…å ±ã‚’è¨ˆç®—ï¼ˆã‚ªãƒªã‚¸ãƒŠãƒ«ç”»åƒï¼‰
Generatorã§ç”»åƒã‚’ç”Ÿæˆ
Discriminatorã®èª¤å·®ã«å¿…è¦ãªæƒ…å ±ã‚’è¨ˆç®—ï¼ˆç”Ÿæˆç”»åƒï¼‰
updateã§æ›´æ–°

ãƒ¡ã‚½ãƒƒãƒ‰åã¨ãã®èª¬æ˜Žã‚’æ¬¡ã«æŽ²è¼‰ã—ã¾ã™ã€‚

ãƒ¡ã‚½ãƒƒãƒ‰å	èª¬æ˜Ž
loss_dis	è˜åˆ¥å™¨ï¼ˆDiscriminatorï¼‰ã‚’æ›´æ–°
loss_gen	ç”Ÿæˆå™¨ï¼ˆGeneratorï¼‰ã‚’æ›´æ–°
extract_img	ãƒ¢ã‚¶ã‚¤ã‚¯éƒ¨è¿‘è¾ºã®ç”»åƒã‚’åˆ‡ã‚Šå–ã‚‹ãƒ¡ã‚½ãƒƒãƒ‰
extract_mosaic_area	ãƒ¢ã‚¶ã‚¤ã‚¯éƒ¨è¿‘è¾ºã®ç”»åƒã‚’åˆ‡ã‚Šå–ã‚‹ãƒ¡ã‚½ãƒƒãƒ‰ï¼ˆãƒãƒƒãƒçš„ã«å‡¦ç†ã™ã‚‹éƒ¨åˆ†ï¼‰
update_core	æ›´æ–°ç”¨ã®é–¢æ•°ã‚’å‘¼ã³å‡ºã™ã‚³ã‚¢éƒ¨åˆ†

class GLCICUpdater(chainer.training.StandardUpdater):
    def __init__(self, is_gen_training=True, alpha=4e-4, *args, **kwargs):
        self.gen, self.dis = kwargs.pop('models')
        self.is_gen_training = is_gen_training
        self.alpha = alpha
        super(GLCCICUpdater, self).__init__(*args, **kwargs)

    def loss_dis(self, dis, y_fake, y_real):
        batchsize = len(y_fake)
        L1 = F.sum(F.softplus(-y_real)) / batchsize
        L2 = F.sum(F.softplus(y_fake)) / batchsize

        loss = (L1 + L2) * self.alpha
        chainer.report({'loss': loss}, dis)
        return loss

    def loss_gen(self, gen, y_fake, x_fake, img_batch_variable, masks):
        batchsize = len(y_fake)
        h = masks * x_fake
        t = masks * img_batch_variable
        abs_pixel_loss = F.mean_squared_error(h, t)
        loss = (F.sum(F.softplus(-y_fake)) * self.alpha) / batchsize + abs_pixel_loss
        chainer.report({'loss': loss, 'pixel_loss': abs_pixel_loss}, gen)
        return loss

    def extract_img(self, img, bbox):
        while True:
            min_h = max(min(bbox[3], 127) - 64, 0)
            max_h = min(bbox[2], 63)

            min_w = max(min(bbox[1], 127) - 64, 0)
            max_w = min(bbox[0], 63)

            start_h = random.randint(min_h, max_h)
            end_h = start_h + 64
            start_w = random.randint(min_w, max_w)
            end_w = start_w + 64

            if start_h >= 0 and start_w >= 0 and end_w < img.shape[1] and end_h < img.shape[2]:
                return img[:, start_h: end_h, start_w: end_w]

    def extract_mosaic_area(self, images, bboxs):
        mosaic_region_imgs = []
        for fake_variable, bbox_variable in zip(images.data, bboxs):
            fake = chainer.cuda.to_cpu(fake_variable)
            bbox = chainer.cuda.to_cpu(bbox_variable)
            mosaic_region_img = self.extract_img(fake, bbox).transpose((1, 2, 0))
            mosaic_region_imgs.append(cv2.resize(mosaic_region_img, (64, 64)).transpose((2, 0, 1)))
        return mosaic_region_imgs

    def update_core(self):
        if self.is_gen_training:
            gen_optimizer = self.get_optimizer('gen')
        dis_optimizer = self.get_optimizer('dis')

        batch = self.get_iterator('main').next()
        img_batch, mosaic_batch_imgs, img_with_mask_batch, bbox_batch, masks = self.converter(batch, self.device)
        img_batch_variable = Variable(img_batch)
        x_real = Variable(img_with_mask_batch)
        xp = chainer.cuda.get_array_module(x_real.data)

        gen, dis = self.gen, self.dis

        region_real_images = self.extract_mosaic_area(img_batch_variable, bbox_batch)
        region_real_images_variable = Variable(xp.asarray(region_real_images))
        y_real = dis(region_real_images_variable, img_batch_variable)  # cut off image
        x_fake = gen(x_real)

        region_fake_images = self.extract_mosaic_area(x_fake, bbox_batch)
        region_fake_images_variable = Variable(xp.asarray(region_fake_images))
        y_fake = dis(region_fake_images_variable, x_fake)

        dis_optimizer.update(self.loss_dis, dis, y_fake, y_real)
        if self.is_gen_training is True:
            gen_optimizer.update(self.loss_gen, gen, y_fake, x_fake, img_batch_variable, masks)

çµæžœ

Generator

ã¾ãšã¯ã€Generatoréƒ¨ã‚’åˆ©ç”¨ã—ã¾ã—ãŸã€‚
Googliserã§ç”»åƒã¯åŽé›†ã—ã€ãã®ä¸ã‹ã‚‰ä¸€éƒ¨ã‚’ãƒ†ã‚¹ãƒˆç”¨ã¨ã—ãŸã®ã§ã€æ¤œç´¢ãŒè¢«ã£ã¦ã„ã‚Œã°é‡è¤‡ã®å¯èƒ½æ€§ãŒã‚ã‚Šã¾ã™ã€‚ã”äº†æ‰¿ãã ã•ã„ã€‚

1epochã®ç”»åƒã€€ä½•ã‚‚è¡¨ç¾ã§ãã¦ã„ã¾ã›ã‚“ã€‚
f:id:tereka:20171225212515j:plain:w640,h640

150epochã€€å°‘ã—ãšã¤è¡¨ç¾ãŒã§ãã¦ããŸï¼Ÿ
f:id:tereka:20171225212923j:plain:w640,h640

400epochã€€ã‚ã‚“ã¾ã‚Šå¤‰ã‚ã‚‰ãªã„ã€‚
f:id:tereka:20171225212953j:plain:w640,h640

GAN

ãã—ã¦ã€GANã‚’åˆ©ç”¨ã—ãŸç”Ÿæˆå‡¦ç†ã‚’å®Ÿæ–½ã—ã¾ã™ã€‚
1 epochã€€è¡¨ç¾ãŒæ®‹å¿µãªã¨ã“ã‚ã‹ã‚‰ã‚¹ã‚¿ãƒ¼ãƒˆ
f:id:tereka:20171225213334j:plain:w640,h640

150epoch
f:id:tereka:20171225213434j:plain:w640,h640

ãŠã¾ã‘

å°‘ã—ãŠã‚‚ã—ã‚ã„ã®ãŒãƒ‡ãƒãƒƒã‚°ç”¨ç”»åƒã§ã™ã€‚
ã“ã®ãƒ‡ãƒãƒƒã‚°ç”¨ç”»åƒã¯Generatorã®å‡ºåŠ›ã‚’ãã®ã¾ã¾è¡¨ç¤ºã—ã¦ã„ã‚‹ç”»åƒã§ã€
å…ƒç”»åƒã§ã®ä¸Šæ›¸ãã‚‚ä½•ã‚‚ã—ã¦ã„ã¾ã›ã‚“ã€‚

Generatorã®ã¿å¦ç¿’ã—ãŸå ´åˆ
f:id:tereka:20171225213716j:plain:w640,h640

GANã®å ´åˆ
f:id:tereka:20171225220845j:plain:w640,h640

å…ƒç”»åƒï¼‘
f:id:tereka:20171225233213j:plain:w256,h256
å¤§é‡ã«ç”Ÿæˆã—ãŸãƒ¢ã‚¶ã‚¤ã‚¯ï¼‹å¾©å…ƒç”»åƒï¼‘
f:id:tereka:20171225233204j:plain:w640,h640

å…ƒç”»åƒï¼’
f:id:tereka:20171225233532j:plain:w256,h256

æ€ã£ãŸã‚ˆã‚Šã‚‚ç¶ºéº—ã«ç”Ÿæˆã•ã‚Œã¦ã„ã¾ã™ãã€‚

æœ€å¾Œã«

å¦„æƒ³åŠ›ã‚’å®Œå…¨ã«å¯è¦–åŒ–ã™ã‚‹ã«ã¯ã¾ã ã¾ã ã‹ã‹ã‚‹ã‚ˆã†ã§ã™ã€‚
çµæ§‹ãƒã‚¿ã¨ã—ã¦é¢ç™½ã‹ã£ãŸã®ã§ã¡ã‚‡ã£ã¨ç”»åƒå¤§ããã—ã¦ã‚„ã£ã¦ã¿ã‚‹ã®ã‚‚é¢ç™½ã„ã‹ãªãã¨æ€ã„ã¾ã—ãŸã€‚
â€»ä½•ã‹ãƒã‚°ã‚„é•ã„ã€ã“ã†ã™ã‚Œã°è‰¯ã„ç‰ã‚ã‚Œã°æ•™ãˆã¦ãã ã•ã„ã€‚

ã®ã‚“ã³ã‚Šã—ã¦ã„ã‚‹ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã®æ—¥è¨˜

ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ãªã©ã®ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢çš„ãªä½•ã‹ã‚’æ›¸ãã¾ã™ã€‚

å¦„æƒ³ã«ã¤ã„ã¦

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã¨ã¯

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã®ç¨®é¡ž

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®å®Ÿè£…

ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®åŽé›†

Googliser

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

Globally and Locally Consistent Image Completion

Chainerã§æ§‹ç¯‰ã—ãŸãƒ¢ã‚¶ã‚¤ã‚¯å¤–ã—ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

Generator

Discriminator

Updater

çµæžœ

Generator

GAN

ãŠã¾ã‘

å…¥åŠ›ã•ã‚Œã¦ã„ãªã„ã¨æ€ã‚ã‚Œã‚‹ãƒ©ãƒ–ãƒ©ã‚¤ãƒ–ç”»åƒï¼ˆã‚µãƒ³ã‚·ãƒ£ã‚¤ãƒ³ã‹ã‚‰å–ã£ã¦ããŸï¼‰

æœ€å¾Œã«

å¦„æƒ³ã«ã¤ã„ã¦

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã¨ã¯

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã®ç¨®é¡ž

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®å®Ÿè£…

ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®åŽé›†

Googliser

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

Globally and Locally Consistent Image Completion

Chainerã§æ§‹ç¯‰ã—ãŸãƒ¢ã‚¶ã‚¤ã‚¯å¤–ã—ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

Generator

Discriminator

Updater

çµæžœ

Generator

GAN

ãŠã¾ã‘

å…¥åŠ›ã•ã‚Œã¦ã„ãªã„ã¨æ€ã‚ã‚Œã‚‹ãƒ©ãƒ–ãƒ©ã‚¤ãƒ–ç”»åƒï¼ˆã‚µãƒ³ã‚·ãƒ£ã‚¤ãƒ³ã‹ã‚‰å–ã£ã¦ããŸï¼‰

æœ€å¾Œã«

å¦„æƒ³ã«ã¤ã„ã¦

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã¨ã¯

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã®ç¨®é¡ž

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®å®Ÿè£…

ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®åŽé›†

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

ãƒ¢ã‚¶ã‚¤ã‚¯å‡¦ç†å¤–ã—

Chainerã§æ§‹ç¯‰ã—ãŸãƒ¢ã‚¶ã‚¤ã‚¯å¤–ã—ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

çµæžœ

ãŠã¾ã‘

å…¥åŠ›ã•ã‚Œã¦ã„ãªã„ã¨æ€ã‚ã‚Œã‚‹ãƒ©ãƒ–ãƒ©ã‚¤ãƒ–ç”»åƒï¼ˆã‚µãƒ³ã‚·ãƒ£ã‚¤ãƒ³ã‹ã‚‰å–ã£ã¦ããŸï¼‰

æœ€å¾Œã«