TensorFlowã§é¡”æ¤œå‡ºå™¨ã‚’è‡ªä½œã™ã‚‹

f:id:sugyan:20170820172842j:plain

19æ—¥ã«è¡Œã‚ã‚ŒãŸ Kyoto.ãªã‚“ã‹ #3 ã§ç™ºè¡¨ãƒ»ãƒ‡ãƒ¢ã‚’ã•ã›ã¦ã„ãŸã ã„ãŸå†…å®¹ã¾ã¨ã‚ã§ã™ã€‚

ã¯ã˜ã‚ã«: æ¤œå‡ºå™¨ã®é‡è¦æ€§

ã‚¢ã‚¤ãƒ‰ãƒ«é¡”è˜åˆ¥ ã‚’ãšã£ã¨ã‚„ã£ã¦ã„ã‚‹ä¸ã§ã€é¡”ã®è˜åˆ¥ãƒ»åˆ†é¡ž(Classification)ã¯CNNã‚’ä½¿ã£ã¦å‡ºæ¥ã¦ã„ã‚‹ã‘ã‚Œã© ã¾ã ä¸Šæ‰‹ãå‡ºæ¥ã¦ã„ãªã„åˆ¥ã®ã‚¿ã‚¹ã‚¯ãŒã‚ã£ã¦ã€‚

ãã‚ŒãŒç”»åƒå†…ã‹ã‚‰ã®é¡”é ˜åŸŸã®æ¤œå‡º (Detection, Localization)ã€‚

ã€Œç”»åƒå†…ã«å†™ã£ã¦ã„ã‚‹äººç‰©ãŒèª°ã§ã‚ã‚‹ã‹ã€ã‚’è˜åˆ¥ã™ã‚‹ãŸã‚ã«ã¯ã€ã¾ãšã¯ãã®ç”»åƒã«å†™ã£ã¦ã„ã‚‹ã€Œé¡”ã€ã‚’æ¤œå‡ºã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã€‚ ãã®æ¤œå‡ºã•ã‚ŒãŸé¡”ãã‚Œãžã‚Œã«ã¤ã„ã¦åˆ†é¡žå™¨ã«ã‹ã‘ã¦ã€Œã“ã®é¡”ã¯â—‹â—‹ã•ã‚“ã€ã€Œã“ã®é¡”ã¯Ã—Ã—ã•ã‚“ã€ã¨åˆ†é¡žã—ã¦ã„ãã“ã¨ã«ãªã‚‹ã‚ã‘ã§ã€‚

åˆ†é¡žå™¨ã«ä¸Žãˆã‚‹å…¥åŠ›ç”»åƒã‚’åˆ‡ã‚ŠæŠœã„ã¦æŠ½å‡ºã™ã‚‹ã®ã«ã‚‚ã¾ãšé¡”é ˜åŸŸã‚’æ¤œå‡ºã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã—ã€ãã®åˆ†é¡žå™¨ã‚’å¦ç¿’ã•ã›ã‚‹ãŸã‚ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚‚ã€æ§˜ã€…ãªç”»åƒã‹ã‚‰é¡”é ˜åŸŸã‚’æ¤œå‡ºã—ã¦åˆ‡ã‚ŠæŠœã„ã¦ãã‚Œãžã‚Œã«å¯¾ã—ã¦ãƒ©ãƒ™ãƒ«ä»˜ã‘ã™ã‚‹ã“ã¨ã§ä½œã£ã¦ã„ã‚‹ã€‚ ãªã®ã§ã€é¡”è˜åˆ¥ã‚¿ã‚¹ã‚¯ã«ã¯ã€Œé¡”é ˜åŸŸã®æ¤œå‡ºã€ãŒä¸å¯æ¬ ã¨ãªã£ã¦ã„ã‚‹ã€‚

å¾“æ¥ã®æ–¹æ³•

ä»Šã¾ã§ã¯ã€ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆä½œæˆã®ãŸã‚ã®é¡”ç”»åƒåŽé›†ã«ã¯OpenCVã‚’ä½¿ã£ãŸå›žè»¢è£œæ£æ©Ÿèƒ½ã¤ãã®æ¤œå‡ºå™¨ã‚’è‡ªä½œã—ã¦ä½¿ã£ã¦ã„ãŸã€‚

OpenCVã®Haarç‰¹å¾´ã«ã‚ˆã‚‹ã‚«ã‚¹ã‚±ãƒ¼ãƒ‰åž‹åˆ†é¡žå™¨ã‚’ä½¿ã£ãŸé ˜åŸŸæ¤œå‡ºã¯ã€æ£é¢å‘ãé¡”ãƒ»ç›®ãªã©ã‚’æ¤œå‡ºã™ã‚‹ãŸã‚å¦ç¿’æ¸ˆã¿ãƒ‡ãƒ¼ã‚¿ãŒæ¨™æº–ã§åŒæ¢±ã•ã‚Œã¦ãŠã‚Šã€æœ€ã‚‚æ‰‹è»½ã«ä½¿ãˆã‚‹æ¤œå‡ºå™¨ã¨è¨€ãˆã‚‹ã€‚ ã—ã‹ã—ã€ã“ã®æ¤œå‡ºå™¨ã¯æ–œã‚ã«å‚¾ã„ãŸé¡”ã«å¯¾ã—ã¦ã¯ä¸€æ°—ã«ç²¾åº¦ãŒä¸‹ãŒã‚‹ã¨ã„ã†å¼±ç‚¹ãŒã‚ã‚Šã€æ–œã‚ã«å†™ã£ã¦ã„ã‚‹ã“ã¨ãŒå¤šã„ã‚¢ã‚¤ãƒ‰ãƒ«ã®è‡ªæ’®ã‚Šã§ã¯ä¸Šæ‰‹ãæ¤œå‡ºã§ããªã„å ´åˆãŒå¤šã„ã€‚ ãã‚Œã‚’å…‹æœã™ã‚‹ãŸã‚ã«ã€å…ƒç”»åƒã‚’å°‘ã—ãšã¤å›žè»¢ã•ã›ãŸã‚‚ã®ã‚’ç”Ÿæˆã— ãã‚Œãžã‚Œã«å¯¾ã—ã¦æ¤œå‡ºå™¨ã«ã‹ã‘ ãã‚Œã‚‰ã®çµæžœã‚’ãƒžãƒ¼ã‚¸ã™ã‚‹ã€ã¨ã„ã†æ–¹æ³•ã‚’ä½¿ã£ã¦æ–œã‚ã®ã‚‚ã®ã‚‚ãã‚Œãªã‚Šã®ç²¾åº¦ã§é¡”æ¤œå‡ºã§ãã‚‹ã‚‚ã®ã‚’ä½œã£ãŸã€‚

è©³ã—ãã¯éŽåŽ»ã®ã“ã®è¨˜äº‹ã€‚

memo.sugyan.com

ã“ã‚Œã«ã‚ˆã£ã¦ã‚ã‚‹ç¨‹åº¦ã®ç²¾åº¦ã§é¡”é ˜åŸŸã‚’æ¤œå‡ºã™ã‚‹ã“ã¨ãŒã§ãã€ã¾ãŸ é¡”ã¨åŒæ™‚ã«ä¸¡ç›®ã®ä½ç½®ã‚‚æ¤œå‡ºã™ã‚‹ã‚ˆã†ã«ã—ãŸã®ã§ ãã®æ¤œå‡ºã•ã‚ŒãŸç›®ã®åº§æ¨™ã®xå·®åˆ†, yå·®åˆ†ã‚’ä½¿ã£ãŸé€†æ£æŽ¥ atan2 ã§å‚¾ãè§’åº¦ã‚‚æ±‚ã‚ã‚‹ã“ã¨ãŒã§ãã‚‹ã€‚

ã“ã‚Œã§å¤§ä½“ã‚„ã‚ŠãŸã„ã“ã¨ã¯å®Ÿç¾ã§ããã†ã ã£ãŸã®ã§ã€è‡ªåˆ†ã®å–ã‚Šçµ„ã‚“ã§ã„ã‚‹ã‚¢ã‚¤ãƒ‰ãƒ«é¡”è˜åˆ¥ã«ãŠã„ã¦ã¯ã“ã®æ¤œå‡ºå™¨ã‚’ä½¿ã£ã¦ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆç”¨ã®é¡”ç”»åƒæŠ½å‡ºã‚’è¡Œã£ã¦ããŸã€‚

ã—ã‹ã— ã“ã®æ¤œå‡ºå™¨ã§ã‚‚ã¾ã å•é¡Œã¯æ®‹ã£ã¦ã„ã¦ã€‚

ã¨ã«ã‹ãå‡¦ç†ãŒé‡ãæ™‚é–“ãŒã‹ã‹ã‚‹
- å›žè»¢ã—ãŸè¤‡æ•°ã®ç”»åƒã‚’ä½œã‚‹ã€ãã‚Œãžã‚Œã‹ã‚‰æ¤œå‡ºã™ã‚‹ã€ã®ã§å½“ç„¶
ã¾ã èª¤æ¤œå‡ºãŒå¤šã„
- é¡”ã§ã¯ãªã„å£ã‚„æœã®æ¨¡æ§˜ã‚’é¡”ã¨ã—ã¦æ¤œå‡ºã—ã¦ã—ã¾ã†ã“ã¨ãŒå¤šã„
å¦ç¿’ã•ã›ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºã€ãªã©ã—ã¥ã‚‰ã„
- ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ç”¨æ„ã—ã¦å¦ç¿’ã•ã›ã‚‹ã“ã¨ã¯å‡ºæ¥ã‚‹ã‚‰ã—ã„ãŒâ€¦

é…ã„ã®ã¯ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆç”¨ã®åŽé›†ã«ã¯ãã‚Œã»ã©å•é¡Œã§ã¯ãªã„ã‘ã‚Œã©ã€ä¾‹ãˆã°é¡”è˜åˆ¥BOTã®ã‚ˆã†ã«ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ã«ãƒ¬ã‚¹ãƒãƒ³ã‚¹ã‚’è¿”ã—ãŸã„å ´é¢ã«ãŠã„ã¦ã¯è‡´å‘½çš„ã§ã€ä»•æ–¹ãªã„ã®ã§Botç”¨ã®æ¤œå‡ºã«ã¯ Cloud Vision API ã‚’ä½¿ã†ã‚ˆã†ã«ã—ã¦ã„ã‚‹ã®ãŒç¾çŠ¶ã€‚

ã¾ãŸç²¾åº¦çš„ã«ã‚‚å°‘ã—å•é¡ŒãŒã‚ã£ã¦ã€ç‰¹ã«é‡‘é«ªã®äººç‰©ã®å ´åˆã« å®Ÿéš›ã®é¡”é ˜åŸŸã‚ˆã‚Šå¤§ããæ¤œå‡ºã•ã‚Œã‚‹ã“ã¨ãŒå¤šã„ã‚ˆã†ã ã£ãŸã€‚é¡”ã¨é«ªã®åŒºåˆ¥ãŒã¤ãã¥ã‚‰ã„ã€ã‹ã‚‰â€¦ï¼Ÿ

ä¾‹:

LBPãªã©ä»–ã®ç‰¹å¾´ã‚’ä½¿ã£ãŸæ¤œå‡ºå™¨ã«åˆ‡ã‚Šæ›¿ãˆã‚‹ã€ã¾ãŸdlibãªã©ä»–ã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’ä½¿ç”¨ã™ã‚‹ã“ã¨ã§æ”¹å–„ã‚‚å‡ºæ¥ãŸã‹ã‚‚ã—ã‚Œãªã„ã‘ã©ã€æŠ˜è§’ãªã®ã§ã“ã“ã¯ Deep Learning ã‚’ä½¿ã£ãŸæ¤œå‡ºå™¨ã‚’ä½œã£ã¦è‡ªå‰ã®å¦ç¿’ãƒ‡ãƒ¼ã‚¿ã‚’é£Ÿã‚ã›ã¦å¦ç¿’ã•ã›ãŸã„ã€ã¨ã„ã†æ€ã„ãŒã‚ã‚Š ä»Šå›žã¯ãã‚Œã«æŒ‘æˆ¦ã—ã¦ã¿ã‚‹ã“ã¨ã«ã—ãŸã€‚

Deep Learning ã«ã‚ˆã‚‹ç‰©ä½“æ¤œå‡º

Deep Learning ã‚’ä½¿ã£ãŸç‰©ä½“æ¤œå‡ºã®æ‰‹æ³•ã‚‚ãŸãã•ã‚“ç ”ç©¶ã•ã‚Œã¦ã„ã¦è¿‘å¹´ã‚ã–ã¾ã—ã„ç™ºå±•ã‚’é‚ã’ã¦ã„ã‚‹ã‚ˆã†ã§ã€ä»£è¡¨çš„ãªæ‰‹æ³•ã¨ã—ã¦ã“ã‚“ãªã‚‚ã®ãŒææ¡ˆã•ã‚Œã¦ããŸã€ã¨ä¸‹è¨˜è¨˜äº‹ã§ç´¹ä»‹ã•ã‚Œã¦ã„ã‚‹ã€‚

tech-blog.abeja.asia

ä¸€ç•ªæœ€è¿‘ã®ã‚‚ã®ã¨ã—ã¦ç´¹ä»‹ã•ã‚Œã¦ã„ã‚‹ SSD (Single Shot MultiBox Detector) ãŒã¨ã¦ã‚‚é«˜é€Ÿã«é«˜ç²¾åº¦ã§æ¤œå‡ºã‚’ã§ããã†ã§è‰¯ã•ãã†ã ãª ã¨æ€ã£ã¦ã€ã„ã¡ãŠã†è«–æ–‡ã‚‚å°‘ã—ç›®ã‚’é€šã—ã¦ã¿ãŸã€‚ å…ƒã®å®Ÿè£…ã¯caffeã«ã‚ˆã‚‹ã‚‚ã®ã§ã€TensorFlowç‰ˆã‚‚æ›¸ã„ã¦ã„ã‚‹äººãŒæ•°äººã„ãŸã‘ã© ä½•ã¨ãªãã®åŽŸç†ã¯åˆ†ã‹ã£ãŸã‚ˆã†ãªæ°—ãŒã™ã‚‹ã—è‡ªåˆ†ã§ã‚‚å‹‰å¼·ãŒã¦ã‚‰TensorFlowã§æ›¸ã„ã¦ã¿ã‚ˆã†â€¦ã¨ã—ã¦ã€é›£ã—ã™ãŽã¦é€”ä¸ã§æŒ«æŠ˜ã—ãŸã€‚ ã®ãŒä»Šå¹´ã®1æœˆé ƒã®è©±ã€‚

Object Detection API

æ™‚ã¯éŽãŽã€ä»Šå¹´ã®6æœˆä¸æ—¬ã€‚ TensorFlowå…¬å¼ã®ãƒ¢ãƒ‡ãƒ«ç¾¤ TensorFlow Models ãƒªãƒã‚¸ãƒˆãƒªã§ã€ “Object Detection API” ãŒå…¬é–‹ã•ã‚ŒãŸã€‚ ã“ã“ã§ã¯ã€MS COCO dataset ã‚’ä½¿ã£ã¦å¦ç¿’æ¸ˆã¿ã®5ç¨®é¡žã®ä¸€èˆ¬ç‰©ä½“æ¤œå‡ºãƒ¢ãƒ‡ãƒ«ãŒå…¬é–‹ã•ã‚Œã¦ã„ã‚‹ã€‚

github.com

Model name Speed COCO mAP

ssd_mobilenet_v1_coco fast 21

ssd_inception_v2_coco fast 24

rfcn_resnet101_coco medium 30

faster_rcnn_resnet101_coco medium 32

faster_rcnn_inception_resnet_v2_atrous_coco slow 37

Model name	Speed	COCO mAP
ssd_mobilenet_v1_coco	fast	21
ssd_inception_v2_coco	fast	24
rfcn_resnet101_coco	medium	30
faster_rcnn_resnet101_coco	medium	32
faster_rcnn_inception_resnet_v2_atrous_coco	slow	37

ä¸‹ã®æ–¹ãŒã‚ˆã‚Šç²¾åº¦ãŒé«˜ãã€ãã®åˆ†ãƒ¢ãƒ‡ãƒ«ã¯å¤§ãããªã‚‹ã—å‡¦ç†ã‚‚é‡ããªã‚‹ã‚ˆã†ã ã€‚ ä¸Š2ã¤ã¯ã¾ã•ã« SSD ã‚’ä½¿ã£ãŸã‚‚ã®ã§ã‚ã‚Šã€ãƒ™ãƒ¼ã‚¹ã¨ãªã‚‹ CNN ã‚’å…ƒè«–æ–‡ã§ã¯ VGG16 ã‚’ä½¿ã£ã¦ã„ãŸã®ã«å¯¾ã—è»½é‡ãª MobileNet ã‚’ä½¿ã£ãŸã‚‚ã®ã€ Inception V2 ã‚’ä½¿ã£ãŸã‚‚ã® ã¨2ç¨®é¡žãã‚Œãžã‚Œã§å®Ÿç¾ã—ã¦ã„ã‚‹ã‚ˆã†ã ã€‚ Faster RCNN ãªã©ã‚’ä½¿ã£ãŸã‚‚ã®ã‚ˆã‚Šæ¤œå‡ºç²¾åº¦ã¯åŠ£ã‚‹ã‚‚ã®ã®ã€ã‚„ã¯ã‚Šå‡¦ç†é€Ÿåº¦ã¯åœ§å€’çš„ã« SSD ã®æ–¹ãŒæ—©ãã†ã€‚

ã•ã‚‰ã«ã“ã®ãƒªãƒã‚¸ãƒˆãƒªã§ã¯ã€å¦ç¿’æ¸ˆã¿ãƒ¢ãƒ‡ãƒ«ã‚’åˆ©ç”¨ã—ãŸè»¢ç§»å¦ç¿’ã§ åˆ¥ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’åˆ©ç”¨ã—ã¦å¦ç¿’ã—ãªãŠã™æ–¹æ³•ã«ã¤ã„ã¦ã‚‚ä»•çµ„ã¿ãŒç”¨æ„ã•ã‚Œ ä¸å¯§ã«èª¬æ˜Žã•ã‚Œã¦ã„ã‚‹ã€‚ ã¤ã¾ã‚Šã€ã“ã®ãƒªãƒã‚¸ãƒˆãƒªã®ãƒ¢ãƒ‡ãƒ«ã§æ‰±ã†å½¢ã«é©åˆã—ãŸ tfrecord ãƒ•ã‚¡ã‚¤ãƒ«ã‚’è‡ªåˆ†ã§ç”¨æ„ã§ãã‚Œã°ã€ç°¡å˜ã«ãã‚Œã‚’ä½¿ã£ãŸæ¤œå‡ºå™¨ã‚’å¦ç¿’ã•ã›ä½¿ã†ã“ã¨ãŒã§ãã‚‹ã€ã¨ã„ã†ã“ã¨ã®ã‚ˆã†ã ã€‚

ã“ã‚Œã‚’ä½¿ã‚ãªã„æ‰‹ã¯ç„¡ã„ã€ã¨ã„ã†ã“ã¨ã§è©¦ã—ã¦ã¿ãŸã€‚

FDDB dataset ã‹ã‚‰å¦ç¿’ç”¨ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ä½œã‚‹

è‡ªåˆ†ãŒé›†ã‚ã¦ããŸã‚¢ã‚¤ãƒ‰ãƒ«é¡”ç”»åƒã‹ã‚‰ç”¨æ„ã—ã¦ã‚‚è‰¯ã‹ã£ãŸã‘ã©ã€ã¾ãšã¯ä¸€èˆ¬ã«å…¬é–‹ã•ã‚Œã¦ã„ã‚‹ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã§è©¦ã—ã¦ã¿ã‚ˆã†ã€ã¨æ€ã£ã¦æŽ¢ã—ã¦ã¿ãŸã¨ã“ã‚ã€FDDB ã¨ã„ã†ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆãŒãƒ’ãƒƒãƒˆã—ãŸã€‚

FDDB : Main

2,845ç‚¹ã®ç”»åƒãã‚Œãžã‚Œã«ã¤ã„ã¦ã€å†™ã£ã¦ã„ã‚‹é¡”é ˜åŸŸã‚’æ¥•å††ã§è¡¨ç¾ã— ãã®ä¸å¿ƒåº§æ¨™ã€é•·å¾„ãƒ»çŸå¾„ã€å‚¾ãè§’åº¦ ã®ã‚»ãƒƒãƒˆãŒã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã¨ã—ã¦è¨ˆ5,171ä»¶ ä¸Žãˆã‚‰ã‚Œã¦ã„ã‚‹ã€‚

ã“ã‚Œã§é¡”é ˜åŸŸã®æ¤œå‡ºã ã‘ãªã‚‰å¦ç¿’ã•ã›ã‚‰ã‚Œãã†ã ã‘ã©ã€ã“ã‚Œã ã‘ã§ã¯é¡”ã®å‚¾ãã¯å–å¾—ã§ããªã„ã€‚ OpenCVã‚’ä½¿ã£ãŸã‚‚ã®ã¨åŒæ§˜ã€ä¸¡ç›®ã®ä½ç½®ã•ãˆå–ã‚Œã‚Œã°ãã“ã‹ã‚‰è§’åº¦ã¯ç®—å‡ºã§ããã†ã ã‘ã©ã€ä¸¡ç›®ã®ä½ç½®ã®æƒ…å ±ã¯æ®‹å¿µãªãŒã‚‰ä»˜å±žã®ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã«ã¯å«ã¾ã‚Œã¦ã„ãªã„ã€‚

ã—ã‹ã—ã€Œé¡”ã®å˜åœ¨ã™ã‚‹ä½ç½®ã€ã€Œå‚¾ãã€ãŒä¸Žãˆã‚‰ã‚Œã¦ã„ã‚‹ãªã‚‰ã€ãã®é ˜åŸŸã‚’ç‹™ã„æ‰“ã¡ã—ã¦ OpenCV ã§æ¤œå‡ºã™ã‚‹ã“ã¨ã‚‚å¯èƒ½ãªã¯ãšã€‚

é¡”ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ãã‚Œãžã‚Œã«ã¤ã„ã¦ã€

ä¸Žãˆã‚‰ã‚Œã¦ã„ã‚‹å‚¾ãã‚’è£œæ£ã™ã‚‹ã‚ˆã†å›žè»¢ã•ã›ã¦
é¡”ã®ä¸å¿ƒåº§æ¨™ã‚’ä¸å¿ƒã¨ã™ã‚‹ é•·å¾„ * 1.1 ã®ã€å°‘ã—å¤§ãã‚ã®ã‚µã‚¤ã‚ºã®æ£æ–¹å½¢ã§åˆ‡ã‚ŠæŠœã

ã¨ã„ã†æ“ä½œã§ã€Œç¸¦ã«çœŸã£ç›´ãã«ãªã£ãŸé¡”ãŒå†™ã£ã¦ã„ã‚‹ã¯ãšã®é ˜åŸŸã€ã‚’æŠ½å‡ºã—ãŸç”»åƒã‚’ä¸€åº¦ä½œã‚Šã€ãã‚Œã«å¯¾ã—ã¦ OpenCV ã«ã‚ˆã‚‹é¡”æ¤œå‡ºã‚’ã‹ã‘ã‚‹ã€‚ ãã†ã—ã¦æ¤œå‡ºã•ã‚ŒãŸç›®ã®é ˜åŸŸã‚’è¡¨ã™åº§æ¨™ã‚’ãã‚Œãžã‚Œå›žè»¢å‰ã®åº§æ¨™ã«å¤‰æ›ã™ã‚Œã°ã€å…ƒç”»åƒã«å¯¾ã™ã‚‹ç›®ã®é ˜åŸŸã‚‚å–å¾—ã§ãã‚‹ã€‚

ã‚„ã¯ã‚Šã‚ã‚‹ç¨‹åº¦ã®èª¤æ¤œå‡ºã¯ã‚ã‚‹ã®ã§ã€é©å½“ã«ãƒ•ã‚£ãƒ«ã‚¿ãƒªãƒ³ã‚°ã—ã¦è£œæ£ã—ã€é™¤å¤–ã€‚ ã“ã‚“ãªæ„Ÿã˜ã®ã‚³ãƒ¼ãƒ‰ã§

import cv2
import math
import os

CASCADES_DIR = os.path.normpath(os.path.join(cv2.__file__, '..', '..', '..', '..', 'share', 'OpenCV', 'haarcascades'))
FACE_CASCADE = cv2.CascadeClassifier(os.path.join(CASCADES_DIR, 'haarcascade_frontalface_default.xml'))
EYES_CASCADE = cv2.CascadeClassifier(os.path.join(CASCADES_DIR, 'haarcascade_eye.xml'))

def detect_faces(img, lines):
    results = []
    for line in lines:
        e = line.split(' ')
        size = max(float(e[0]), float(e[1])) * 1.1
        # å°ã•ã™ãŽã‚‹ã‚‚ã®ã¯é™¤åŽ»
        if size < 60.0:
            break
        # çœŸã£ç›´ãã«ãªã£ã¦ã„ã‚‹ã¯ãšã®é ˜åŸŸã‚’åˆ‡ã‚ŠæŠœã
        center = (int(float(e[3])), int(float(e[4])))
        angle = float(e[2]) / math.pi * 180.0
        if angle < 0:
            angle += 180.0
        M = cv2.getRotationMatrix2D(center, angle - 90.0, 1)
        M[0, 2] -= float(e[3]) - size
        M[1, 2] -= float(e[4]) - size
        target = cv2.warpAffine(img, M, (int(size * 2), int(size * 2)))

        # åˆ‡ã‚ŠæŠœã„ãŸç”»åƒã‹ã‚‰é¡”ã¨ç›®ã‚’æ¤œå‡ºã™ã‚‹
        faces = FACE_CASCADE.detectMultiScale(target)
        if len(faces) != 1:
            print('{} faces found...'.format(len(faces)))
            break
        face = faces[0]
        face_img = target[face[1]:face[1] + face[3], face[0]:face[0] + face[2]]
        eyes = []
        for eye in EYES_CASCADE.detectMultiScale(face_img):
            # å§‹ç‚¹ã®é«˜ã•ãŒå…ƒç”»åƒã®ä¸‹åŠåˆ†ã«ã‚ã‚‹ã‚ˆã†ãªã‚‰ãŠãã‚‰ããã‚Œã¯èª¤æ¤œå‡º
            if eye[1] > face_img.shape[0] / 2:
                break
            eyes.append(eye)
        if len(eyes) != 2:
            print('{} eyes found...'.format(len(eyes)))
            break
        # ä¸¡ç›®ã®ã‚µã‚¤ã‚ºãŒã‚ã¾ã‚Šã«ã‚‚ç•°ãªã‚‹ã®ã¯ä¸è‡ªç„¶ãªã®ã§æ¤œå‡ºå¤±æ•—ã¨ã™ã‚‹
        if not (2. / 3. < eyes[0][2] / eyes[1][2] < 3. / 2. and 2. / 3. < eyes[0][3] / eyes[1][3] < 3. / 2.):
            break
    ...

ã“ã‚Œã§ã ã„ãŸã„ã¯ä¸Šæ‰‹ãæ¤œå‡ºã§ããŸã‚ˆã†ã ã£ãŸã€‚

ã“ã®æ–¹æ³•ã§ä¸Šæ‰‹ãæ¤œå‡ºã§ãã€ä¸Žãˆã‚‰ã‚Œã¦ã„ã‚‹ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ã¨åŒæ•°ã®é¡”ãŒæ£ã—ãä¸¡ç›®ã¨å…±ã«æ¤œå‡ºã•ã‚ŒãŸã‚‚ã®ã ã‘ã‚’ç”¨ã„ã¦ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ä½œæˆã€‚ çµæžœã¨ã—ã¦ã€ä½¿ç”¨ã§ããŸã®ã¯2,845ç‚¹ã®ã†ã¡936ç‚¹ã ã£ãŸã€‚ ã¡ã‚‡ã£ã¨å°‘ãªã„ã‘ã©ä»•æ–¹ãªã„ã€‚ trainç”¨ã¨validationç”¨ã«åˆ†ã‘ã‚‹å¿…è¦ãŒã‚ã‚‹ã‚ˆã†ã ã£ãŸã®ã§ã“ã‚Œã‚’ã•ã‚‰ã« 843:93 ã«åˆ†å‰²ã—ã¦ä½¿ç”¨ã—ãŸã€‚

ã§ã€ã‚ã¨ã¯ã“ã‚Œã‚’ãã‚Œãžã‚Œç”»åƒã«å¯¾ã™ã‚‹ image/objcet/bbox/* ã‚„ image/object/class/* ã¨ã„ã£ãŸkeyã«æƒ…å ±ã‚’å«ã‚ã¦ tfrecord å½¢å¼ã«æ›¸ãå‡ºã™ã€‚

feature = {
    'image/height': tf.train.Feature(int64_list=tf.train.Int64List(value=[h])),
    'image/width': tf.train.Feature(int64_list=tf.train.Int64List(value=[w])),
    'image/filename': tf.train.Feature(bytes_list=tf.train.BytesList(value=[filepath.encode('utf-8')])),
    'image/source_id': tf.train.Feature(bytes_list=tf.train.BytesList(value=[filepath.encode('utf-8')])),
    'image/encoded': tf.train.Feature(bytes_list=tf.train.BytesList(value=[encoded])),
    'image/format': tf.train.Feature(bytes_list=tf.train.BytesList(value=['jpeg'.encode('utf-8')])),
    'image/object/bbox/xmin': tf.train.Feature(float_list=tf.train.FloatList(value=xmin)),
    'image/object/bbox/xmax': tf.train.Feature(float_list=tf.train.FloatList(value=xmax)),
    'image/object/bbox/ymin': tf.train.Feature(float_list=tf.train.FloatList(value=ymin)),
    'image/object/bbox/ymax': tf.train.Feature(float_list=tf.train.FloatList(value=ymax)),
    'image/object/class/text': tf.train.Feature(bytes_list=tf.train.BytesList(value=class_text)),
    'image/object/class/label': tf.train.Feature(int64_list=tf.train.Int64List(value=class_label)),
}
example = tf.train.Example(features=tf.train.Features(feature=feature))
writer.write(example.SerializeToString())

ã“ã‚Œã§ä¸€å¿œã€ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆãŒä½œæˆã§ããŸã®ã§ ã‚ã¨ã¯ã“ã‚Œã‚’ä½¿ã£ã¦å¦ç¿’ã•ã›ã‚‹ã€‚ ssd_inception_v2_coco ã®å¦ç¿’æ¸ˆã¿ãƒ¢ãƒ‡ãƒ«ã‚’ãƒ™ãƒ¼ã‚¹ã«Fine-Tuningã™ã‚‹å½¢ã§ã€‚ Google Cloud Machine Learning ã‚’ä½¿ã†æ–¹æ³•ã‚‚æ›¸ã„ã¦ã‚ã£ãŸã®ã ã‘ã© ã¡ã‚‡ã£ã¨ä½•æ•…ã‹ä¸Šæ‰‹ãã„ã‹ãªã‹ã£ãŸ(è¦ å†æŒ‘æˆ¦)ã®ã§ã€ä»Šå›žã¯EC2ã®g2.2xlargeã‚¤ãƒ³ã‚¿ãƒ³ã‚¹ã‚’ä½¿ã£ã¦å¦ç¿’ã‚’è¡Œã£ãŸã€‚ 1stepã‚ãŸã‚Š2ç§’å¼±ãã‚‰ã„ã€ä¸¸ä¸€æ—¥ã§ 50,000stepã»ã©å¦ç¿’ãŒé€²ã¿ã€ã ã„ãŸã„ã¯å¦ç¿’ãŒå‡ºæ¥ãŸé›°å›²æ°—ã ã£ãŸã€‚

f:id:sugyan:20170820190012p:plain

ã“ã‚Œã‚’ä½¿ã£ã¦æ¤œå‡ºã—ã¦ã¿ãŸçµæžœãŒå†’é ã®ç”»åƒã€‚

ç”¨æ„ã—ãŸãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã«å‚¾ã„ã¦ã„ã‚‹é¡”ã‚‚ã‚ã‚‹ç¨‹åº¦ã¯å«ã¾ã‚Œã¦ã„ãŸã®ã§ã€ãã†ã„ã†ã‚‚ã®ã‚‚ã‚ã‚‹ç¨‹åº¦ã¯æ¤œå‡ºã§ãã‚‹ã‚ˆã†ã ã£ãŸã€‚ ãŸã£ãŸ800ä»¶ã¡ã‚‡ã£ã¨ã®ç”»åƒã§ã®ãƒ‡ãƒ¼ã‚¿ã‚’ç”¨æ„ã ã‘ã§ã‚‚ã“ã‚Œã ã‘æ¤œå‡ºã§ãã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã‚‹ã®ã ã‹ã‚‰ååˆ†ã‹ãªã€ã¨ã„ã†æ„Ÿè§¦ã€‚ ã“ã“ã‹ã‚‰ã•ã‚‰ã«ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’å¢—ã‚„ã—ã¦ã„ã‘ã°ã©ã‚“ã©ã‚“ç²¾åº¦ã¯ä¸Šã’ã‚‰ã‚Œãã†ãªæ°—ãŒã™ã‚‹ã€‚

ã‚ã¨ã¯å®Ÿéš›ã®é¡”è˜åˆ¥ã«ä½¿ã†ã‚ˆã†ãªè‡ªæ’®ã‚Šã®å¤šã„ç”»åƒãŸã¡ã‚’ ã©ã†ã‚¢ãƒŽãƒ†ãƒ¼ã‚·ãƒ§ãƒ³ä»˜ã‘ã¦ã©ã†ç®¡ç†ã—ã€ã©ã†æ€§èƒ½è©•ä¾¡ã—ã¦ã„ãã‹ã€ã£ã¦è©±ã«ãªã£ã¦ãã‚‹ã¨æ€ã†

Webã‚¢ãƒ—ãƒªåŒ–

ã“ã“ã‹ã‚‰ã¯å®Œå…¨ã«ä½™è«‡ãªã®ã ã‘ã©ã€ã›ã£ã‹ãé«˜é€Ÿã«é¡”æ¤œå‡ºã§ãã‚‹ãƒ¢ãƒ‡ãƒ«ã‚’TensorFlowã§æ§‹ç¯‰ã§ããŸã®ã ã‹ã‚‰ã€Webã‚µãƒ¼ãƒ“ã‚¹ã¨ã—ã¦å…¬é–‹ã§ãã‚‹ã‚ˆã†ã«ã—ã‚ˆã†ã€ã¨ã€‚ é¡”æ¤œå‡ºãƒ¢ãƒ‡ãƒ«ã¯Flaskã‚’ä½¿ã£ã¦JSON APIåŒ–ã§ãã‚‹ã€‚ ã‚ã¨ã¯ãƒ•ãƒãƒ³ãƒˆã‚¨ãƒ³ãƒ‰ã ã‘ã©ã†ã«ã‹ã—ã¦UIã‚’ä½œã‚‹ã ã‘ã€‚

ä»¥å‰ã‚‚ã¡ã‚‡ã„ã¡ã‚‡ã„Reactã¨ã‹webpackã¨ã‹ä½¿ã£ã¦ä¼¼ãŸã‚ˆã†ãªã‚‚ã®ã¯ä½œã£ã¦ã„ãŸã®ã§ä½¿ã„å›žã—ã ã‘ã©ã€ä»Šå›žã¯TypeScriptã§.tsxã‚’æ›¸ã„ã¦ts-loaderã§ãƒˆãƒ©ãƒ³ã‚¹ãƒ‘ã‚¤ãƒ«ã€ã¨ã„ã†æ„Ÿã˜ã§ã‚„ã£ã¦ã¿ãŸã€‚ åž‹ãŒä»˜ãã¨åˆ†ã‹ã‚Šã‚„ã™ãæ›¸ãã‚„ã™ã„ã€ã‚“ã ã‘ã© ãªã‹ãªã‹æ…£ã‚Œãªãã¦æ€ã£ãŸä»¥ä¸Šã«è‹¦æˆ¦ã—ãŸâ€¦

ã§ã€ã¨ã‚Šã‚ãˆãšæœ€ä½Žé™å‹•ãã¨ã“ã‚ã¾ã§å‡ºæ¥ãŸã®ã§å…¬é–‹ã—ãŸã®ãŒã“ã¡ã‚‰ã€‚

https://tf-face-detector.herokuapp.com/

ã“ã‚Œãã‚‰ã„ãªã‚‰Herokuã§å‹•ã‹ã›ã‚‹ã‹ã¨æ€ã£ãŸã‘ã©ã€ã„ã–deployã—ã¦ã¿ãŸã¨ã“ã‚ “Memory quota exceeded” ã®ã‚¨ãƒ©ãƒ¼ãŒå‡ºã¾ãã£ã¦ã—ã¾ã£ã¦ã€ã©ã†ã‚‚ãƒ¡ãƒ¢ãƒªã®ä½¿ç”¨é‡ãŒãƒ¤ãƒã„ã‚‰ã—ã„â€¦ã€‚ ã„ã¡ãŠã†å‹•ãã“ã¨ã¯å‹•ãã‘ã©ã€ã„ã¤æ¢ã¾ã£ã¦ã—ã¾ã£ã¦ã‚‚ãŠã‹ã—ããªã„ã€ã¨ã„ã†æ„Ÿã˜ã€‚ ç•³ã¿è¾¼ã¿4å±¤ã®è˜åˆ¥ãƒ¢ãƒ‡ãƒ«ãã‚‰ã„ãªã‚‰å¤§ä¸ˆå¤«ã ã£ãŸã‘ã© ã“ã‚Œãã‚‰ã„ã®è¦æ¨¡ã ã¨åŽ³ã—ã„ã‹ã€ã€ã€

Herokuã§ãƒ¡ãƒ¢ãƒªå¤šã‚ã®dynoã«ã‚¢ãƒƒãƒ—ã‚°ãƒ¬ãƒ¼ãƒ‰ã™ã‚‹ã¨$25ãã‚‰ã„ã‹ã‹ã‚‹ã¿ãŸã„ã ã—ã€ãã‚Œã ã£ãŸã‚‰ã©ã“ã‹ã®VPSã§2GBãã‚‰ã„ã‚ã‚‹ã‚„ã¤ã‚’å€Ÿã‚ŠãŸæ–¹ãŒã„ã„ã‹â€¦ï¼Ÿ çœŸé¢ç›®ã«é‹ç”¨ã™ã‚‹ã“ã¨ã«ãªã£ãŸã‚‰è€ƒãˆã‚ˆã†ã€‚ã€‚