Treasure Data - naoyaã®ã¯ã¦ãªãƒ€ã‚¤ã‚¢ãƒªãƒ¼

å°‘ã—å‰ã«ãƒã‚°ã®è©±ã‚’æ›¸ã„ãŸ http://d.hatena.ne.jp/naoya/20130219/1361262854 ã¨ãã«ã€Treasure Data ã«ã¤ã„ã¦ã¯å¾Œæ—¥ã«ã‚‚ã†å°‘ã—è©³ç´°ã«æ›¸ãã¨è¨€ã£ãŸã®ã§æ›¸ãã¨ã—ã‚ˆã†ã€‚

è¿‘é ƒ Treasure Data (ä»¥ä¸‹ã€æ™‚æŠ˜ TD) ã¨ã„ã†åå‰ã‚’ã¡ã‚‰ã»ã‚‰èžã„ãŸã“ã¨ãŒã‚ã‚‹äººã¯å¤šã„ã®ã§ã¯ãªã„ã‹ã¨æ€ã„ã¾ã™ã€‚ã€Œãƒ“ãƒƒã‚°ãƒ‡ãƒ¼ã‚¿ã®ã‚¯ãƒ©ã‚¦ãƒ‰ã‚µãƒ¼ãƒ“ã‚¹ã§ã‚ã‚‹ã€ã¨ã‹ã€Œæ—¥æœ¬äººãŒå‰µæ¥ã—ãŸã‚·ãƒªã‚³ãƒ³ãƒãƒ¬ãƒ¼ã®ãƒ™ãƒ³ãƒãƒ£ãƒ¼ã€ã€ã‚ã‚‹ã„ã¯ Yahoo! å‰µæ¥è€…ã® Jerry Yang ãŒæŠ•è³‡ã—ãŸã¨ã‹ã€Fluentd ã¨ä½•ã‹é–¢ä¿‚ãŒã‚ã‚‹ã¨ã„ã£ãŸæ–‡è„ˆãªã©ãªã©ã€‚

ã‘ã©ã€å…·ä½“çš„ã« Treasure Data ãŒã©ã†ã„ã†ã‚µãƒ¼ãƒ“ã‚¹ã§ã€ã©ã†ã„ã†æ©Ÿèƒ½ã‚’æŒã£ã¦ã„ã¦ã€ã©ã‚“ãªå ´é¢ã§åˆ©ç”¨ã•ã‚Œã‚‹ã‚‚ã®ãªã®ã‹ã¯ã¾ã ã‚ã¾ã‚Šè‰¯ãçŸ¥ã‚‰ã‚Œã¦ã„ãªã„ã‹ã‚‚ã—ã‚Œãªã„ï½¥ï½¥ï½¥ã‚ˆã†ã«ã‚‚è¦‹ãˆã‚‹ã€‚ä»Šæ—¥ã¯ãã®è¾ºã‹ã‚‰å°‘ã—ç´¹ä»‹ã—ã¦ã„ã“ã†ã‹ãªã¨æ€ã†ã€‚

Treasure Data ãŒæä¾›ã™ã‚‹ã‚µãƒ¼ãƒ“ã‚¹

æœ¬å½“ã«ã”ãã”ãå˜ç´”åŒ–ã—ã¦è¨€ã†ã¨TDã¯ã€Œæ‰‹å…ƒã®ã‚µãƒ¼ãƒãƒ¼ã¨ã‹ã‹ã‚‰ãƒã‚°ã‚’ã©ã‚“ã©ã‚“é€ã‚Šã¤ã‘ã¦ãŠãã¨ãã‚Œã‚’ä¿å˜ã—ã¨ã„ã¦ãã‚Œã¦ã€SQL ã‚’æŠ•ã’ã‚‹ã¨ MapReduce ã§å¤§è¦æ¨¡ä¸¦åˆ—ã«ãã‚Œã‚’å®Ÿè¡Œã—ã¦çµæžœã ã‘è¿”ã—ã¦ãã‚Œã‚‹ã‚¯ãƒ©ã‚¦ãƒ‰ãªã‚µãƒ¼ãƒ“ã‚¹ã€ã§ã™ã€‚

è‡ªåˆ†ã¯å€‹äººã§ã‚‚ TD ã‚’åˆ©ç”¨ã—ã¦ã„ã‚‹ã®ã ã‘ã©ã€ä¾‹ãˆã° amazlet ã¨ã„ã†ãšã„ã¶ã‚“æ˜”ã«ä½œã£ãŸã‚¦ã‚§ãƒ–ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã®ãƒã‚°ã€ã‚¢ã‚¯ã‚»ã‚¹ãƒã‚°ã«ã™ã“ã—æƒ…å ±ã‚’åŠ ãˆãŸã‚‚ã®ãªã‚“ã‹ã‚’ TD ã«é€ã‚Šç¶šã‘ã¦ã„ã‚‹ã€‚OSX ã«ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ãŸ td ã‚³ãƒžãƒ³ãƒ‰ã§ã€TD ã®ã‚µãƒ¼ãƒãƒ¼ã«ã‚¹ãƒ†ãƒ¼ã‚¿ã‚¹ã‚’å•ã„åˆã‚ã›ã‚‹ã€‚

% td tables nginx
+----------+--------+------+---------+--------+---------------------------+--------+
| Database | Table  | Type | Count   | Size   | Last import               | Schema |
+----------+--------+------+---------+--------+---------------------------+--------+
| nginx    | access | log  | 2649812 | 0.1 GB | 2013-03-22 17:01:57 +0900 |        |
+----------+--------+------+---------+--------+---------------------------+--------+

ã¾ã€ãã‚“ãªã«å¤§ã—ãŸè¦æ¨¡ã®ãƒ‡ãƒ¼ã‚¿ã§ã¯ãªã„ã‘ã©ã€‚ã¨ã¯ã„ãˆã“ã‚Œã§ã‚‚æœˆé–“æ•°ä¸‡äººãã‚‰ã„ã®ãƒ¦ãƒ¼ã‚¶ãƒ¼ã¯ã„ã‚‹ã€‚

ã•ã¦ã€ã“ã®é€ã‚Šç¶šã‘ãŸãƒã‚°ã‹ã‚‰ç›´è¿‘ä¸€ãƒ¶æœˆãã‚‰ã„ã®é–“ã«ã€amazlet ã§ç´¹ä»‹ã•ã‚ŒãŸ Amazon ã®å•†å“ã‚’è¨ˆç®—ã—ã¦ã¿ã‚ˆã†ã€‚

% td query -w -d nginx "select v['asin'] as asin, count(1) as cnt from access group by v['asin'] order by cnt desc limit 100"

td ã‚³ãƒžãƒ³ãƒ‰ã§ SQL (ã£ã½ã„) ã‚¯ã‚¨ãƒªã‚’é€ä¿¡ã™ã‚‹ã€‚ã™ã‚‹ã¨

Job 2131709 is queued.
Use 'td job:show 2131709' to show the status.
queued...
  started at 2013-03-22T08:07:49Z
  Hive history file=/mnt/hive/tmp/1624/hive_job_log__1111533064.txt
  Total MapReduce jobs = 2
  Launching Job 1 out of 2
  Number of reduce tasks not specified. Defaulting to jobconf value of: 12
  In order to change the average load for a reducer (in bytes):
    set hive.exec.reducers.bytes.per.reducer=<number>
  In order to limit the maximum number of reducers:
    set hive.exec.reducers.max=<number>
  In order to set a constant number of reducers:
    set mapred.reduce.tasks=<number>
  Starting Job = job_201301150013_218289, Tracking URL = â€¦
  2013-03-22 08:08:18,702 Stage-1 map = 0%,  reduce = 0%
  2013-03-22 08:08:26,779 Stage-1 map = 26%,  reduce = 0%
  2013-03-22 08:08:29,814 Stage-1 map = 41%,  reduce = 0%
  2013-03-22 08:08:32,858 Stage-1 map = 58%,  reduce = 0%
  2013-03-22 08:08:35,907 Stage-1 map = 72%,  reduce = 0%
  2013-03-22 08:08:38,935 Stage-1 map = 83%,  reduce = 0%

ã“ã‚“ãªæ„Ÿã˜ã§ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ã®å‘ã“ã†å´ã§ MapReduce è¨ˆç®—ãŒå§‹ã¾ã£ã¦å‡¦ç†ãŒè¡Œã‚ã‚Œã‚‹ã€‚åˆã‚ã¦å®Ÿè¡Œã—ãŸã¨ãã¯æ‰‹å…ƒã®OSXã‹ã‚‰ã‚³ãƒžãƒ³ãƒ‰ã‚’é€ã‚‹ã ã‘ã§ã€ã‚¤ãƒ³ã‚¿ãƒ¼ãƒãƒƒãƒˆã‚’é€šã˜ã¦ MapReduce ã‚’å®Ÿè¡Œã—ã¦ã‚‹ãªã‚“ã¦ï½¥ï½¥ï½¥! ã¨ã¡ã‚‡ã£ã¨ã—ãŸé«˜æšæ„ŸãŒã‚ã£ãŸã‚Šã—ãŸã€‚

ã§ã€çµæžœã¯ãã®ã¾ã¾æ¨™æº–å‡ºåŠ›ã«è¿”ã£ã¦ãã‚‹ã€‚

| B00BHAF688 | 307 | â‡’ ã‚¸ãƒ§ã‚¸ãƒ§ (PlayStation 3)
| B00BHO0FK8 | 274 | â‡’ Evangelion Q ã® Blu-ray
| B009GSX0A4 | 147 | â‡’ é–ƒä¹±ã‚«ã‚°ãƒ© (PSP Vita)
| B00A64CFIK | 136 | â‡’ åˆéŸ³ãƒŸã‚¯ (PlayStation 3)
| B00APVDHLI | 134 | â‡’ ã‚¸ãƒ§ã‚¸ãƒ§ (PlayStation 3)
| B0095D6I86 | 128 | â‡’ ãƒ¡ã‚¿ãƒ«ã‚®ã‚¢ ãƒ©ã‚¤ã‚¸ãƒ³ã‚° (PlayStation 3)
| B00BIYSEFA | 123 | â‡’ çœŸãƒ»å¥³ç¥žè»¢ç”ŸIV (Nintendo 3DS)
| B00AHA5OCC | 113 | â‡’ SOUL SACRIFICE (PlayStaion 3)
| B00BIYSF7C | 112 | â‡’ ã‚µãƒ¢ãƒ³ãƒŠã‚¤ãƒˆ5

çŸ¢å°ä»¥é™ã¯è‡ªåˆ†ãŒè£œã£ãŸã‚‚ã®ã€‚ã©ã†ã‚„ã‚‰ amazlet ã¯ã‚²ãƒ¼ãƒ ã‚½ãƒ•ãƒˆã‚’ç´¹ä»‹ã™ã‚‹ã®ãªã‚“ã‹ã«ã‚ˆãä½¿ã‚ã‚Œã¦ã€ç›´è¿‘ä¸€ãƒ¶æœˆãã‚‰ã„ã¯ PS3 ã®ã‚¸ãƒ§ã‚¸ãƒ§ã‚„ã‚¨ãƒ´ã‚¡ãƒ³ã‚²ãƒªã‚ªãƒ³ã®æ˜ ç”»ã® Blu-ray ãŒäººæ°—ã ã£ãŸï½¥ï½¥ï½¥ãªã‚“ã¦ã“ã¨ãŒã‚ã‹ã£ãŸã€‚ã“ã“ã§ã¯å‰²ã¨å˜ç´”ãªã‚¯ã‚¨ãƒªã‚’æŠ•ã’ã¦ã„ã‚‹ã‘ã©ã€ã„ã‚ã‚“ãªãƒ‡ãƒ¼ã‚¿ã¨ç´ã¥ã‘ã¦ã‚‚ã£ã¨è¤‡é›‘ãªã‚¯ã‚¨ãƒªã‚’å®Ÿè¡Œã•ã›ãŸã¨ã—ã¦ã‚‚ã€ãã“ã¯ MapReduce ãªã‚“ã§ I/O ãƒªã‚½ãƒ¼ã‚¹ã‚‚ CPU ãƒªã‚½ãƒ¼ã‚¹ã‚‚ãƒªãƒ‹ã‚¢ã«ã‚¹ã‚±ãƒ¼ãƒ«ã™ã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã‚‹ã€‚

ã“ã®ä¾‹ã®ã‚±ãƒ¼ã‚¹ã®å ´åˆã€é€ã£ã¦ã„ã‚‹ãƒ‡ãƒ¼ã‚¿ã¯ã›ã„ãœã„ã¾ã æ•°ç™¾MBç¨‹åº¦ãªã®ã§ä½•ã‚‚ Treasure Data ã‚’é ¼ã‚‰ãªãã¦ã‚‚ MySQL ã‚„ MongoDB ã§ã‚‚ååˆ†å‡¦ç†ã§ãã‚‹ã€‚ã§ã‚‚ãƒã‚¤ãƒ³ãƒˆã¯ãã“ã§ã¯ãªãã€ãŸã¨ãˆãƒ‡ãƒ¼ã‚¿ãŒ æ•°ç™¾GB ã‚„ TB ã‚ªãƒ¼ãƒ€ãƒ¼ã«ãªã£ã¦ã‚‚ã‚ªãƒšãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã¨ã—ã¦ã¯ä½•ã‚‰ã‹ã‚ã‚‰ãªã„ã€ã¤ã¾ã‚Šã‚¹ã‚±ãƒ¼ãƒ©ãƒ–ãƒ«ã§ã‚ã‚‹ã€ã¨ã„ã†ã¨ã“ã‚ãªã®ã¯ã„ã‚ãšã‚‚ãŒãªã€‚

é€”ä¸ã€ã‚¸ãƒ§ãƒ–ã®çµŒéŽå‡ºåŠ›ã« Hadoop ã‚„ Hive ãªã‚“ã¦å˜èªžãŒã¡ã‚‰ã»ã‚‰è¦‹ãˆã‚‹é€šã‚Šã€TD ã¯ MapReduce ã®å®Ÿè¡ŒåŸºç›¤ã¨ã—ã¦ã® Hadoopã€ãã‚Œã‹ã‚‰ SQL é¢¨ã®è¨€èªž (HiveQL) ã§ Hadoop ä¸Šã®ãƒ‡ãƒ¼ã‚¿ã‚’æ“ä½œã§ãã‚‹ Hiveã€ãã‚Œã‚‰ã‚’ä½¿ã£ã¦æ§‹ç¯‰ã•ã‚Œã¦ã„ã‚‹ã€‚ã¾ãŸå¾Œã§ã‚‚ã†ã™ã“ã—è§¦ã‚Œã‚‹ã‘ã‚Œã©ã‚‚ã€å®Ÿéš›ã«ã¯å˜ãªã‚‹ Hadoop + Hive ã®ãƒ›ã‚¹ãƒ†ã‚£ãƒ³ã‚°ã§ã¯ãªããƒ‡ãƒ¼ã‚¿ã‚’å—ã‘ä»˜ã‘ã‚‹éƒ¨åˆ†ã€ãƒ‡ãƒ¼ã‚¿ã‚’ä¿å˜ã™ã‚‹ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã€ãƒžãƒ«ãƒãƒ†ãƒŠãƒ³ãƒˆã®ã‚¸ãƒ§ãƒ–ã‚’åˆ†é…ã™ã‚‹ã‚¹ã‚±ã‚¸ãƒ¥ãƒ¼ãƒ©ã€ã‚ã‚‹ã„ã¯çµæžœã‚’è¿”ã™å„ç¨® API ãªã©ã¯ TD ç¤¾ãŒç‹¬è‡ªã«é–‹ç™ºã—ãŸã‚‚ã®ã§ã¾ã‹ãªã„å…¨ä½“ã‚’çµ±åˆã—ã€ã“ã®ã€Œãƒã‚°ã‚’ãŒã‚“ãŒã‚“é€ã‚Šã¤ã‘ã¦ãŠã„ã¦å¥½ããªã¨ãã« SQL ã§ MapReduceã§ãã‚‹ã€ã¨ã„ã†ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã‚’æä¾›ã™ã‚‹ã€‚

ã“ã‚ŒãŒ Treasure Data ã¨ã„ã†ã‚µãƒ¼ãƒ“ã‚¹ï½¥ï½¥ï½¥ã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ã€‚

å®Ÿéš›ã©ã‚“ãªå ´é¢ã§ä½¿ã‚ã‚Œã‚‹ã®ã‹

å¤§è¦æ¨¡ã« SQL çš„ã«ãƒ‡ãƒ¼ã‚¿è§£æžãŒã§ããŸã¨ã—ã¦ã€å®Ÿéš›ã«ã©ã‚“ãªå ´é¢ã§ä½¿ã‚ã‚Œã‚‹ã®? ã¨ã„ã†ã®ãŒæ¬¡ã«æ°—ã«ãªã‚‹ã¨ã“ã‚ã§ã—ã‚‡ã†ã€‚

ã‚½ãƒ¼ã‚·ãƒ£ãƒ«ã‚²ãƒ¼ãƒ ã‚’ã¯ã˜ã‚ã¨ã™ã‚‹æœ€è¿‘ã®Webã‚µãƒ¼ãƒ“ã‚¹ã§ã¯ãƒã‚°è§£æžãŒé‡è¦ãªå½¹å‰²ã‚’å ã‚ã‚‹ï½¥ï½¥ï½¥ã¨ã„ã†è©±ã¯èžã„ãŸã“ã¨ãŒã‚ã‚‹äººã‚‚å¤šã„ã¨æ€ã„ã¾ã™ã€‚TD ã®ã‚ˆã†ãªã‚½ãƒªãƒ¥ãƒ¼ã‚·ãƒ§ãƒ³ãŒä½¿ã‚ã‚Œã‚‹ã®ã¯ã€ã¾ã•ã«ãã“ã§ã™ã€‚æœ€è¿‘ã¯åºƒå‘Šãªã‚“ã‹ã‚‚æŠ€è¡“é©æ–°ãŒé€²ã‚“ã§ã‹ãªã‚Šå¤§è¦æ¨¡ãªãƒ‡ãƒ¼ã‚¿ã‚’å‡¦ç†ã™ã‚‹ã‚ˆã†ã«ãªã£ã¦ãã¦ã„ã¦ã€ãã“ã§ã‚‚ä½¿ã‚ã‚Œã¦ã„ã‚‹ã€‚ä¸ã®äººã®ãƒ—ãƒ¬ã‚¼ãƒ³ ã«ã‚ã‚‹äº‹ä¾‹ã ã¨ã‚¯ãƒƒã‚¯ãƒ‘ãƒƒãƒ‰ã€MobFox ãªã‚“ã‹ãŒæœ‰åã©ã“ã‚ã§ã™ã€‚è³‡æ–™ã«ã¯è¼‰ã£ã¦ãªã„ã‘ã©ã€å‰²ã¨å›½å†…ã®ã‚½ãƒ¼ã‚·ãƒ£ãƒ«ã‚²ãƒ¼ãƒ ãƒ‡ãƒ™ãƒãƒƒãƒ‘ãƒ¼å„ç¤¾ã§ã¯ã‹ãªã‚Šå°Žå…¥ãŒé€²ã‚“ã§ã„ã‚‹ã¨èžã„ã¦ã¾ã™ã€‚

ãã‚‚ãã‚‚ä½•ã§ãã‚“ãªã“ã¨ã«ãªã£ã¦ã„ã‚‹ã®? ã¨ã„ã†ç‚¹ã«ã¤ã„ã¦å°‘ã—æ•æ‰ã—ã¦ãŠããŸã„ã€‚

ã‚‚ã¨ã‚‚ã¨ã‚¦ã‚§ãƒ–ã‚·ã‚¹ãƒ†ãƒ ã®ãƒ‡ãƒ¼ã‚¿è§£æžã¨ã„ã£ãŸã‚‰ã‚‚ã£ã±ã‚‰ãã‚Œã¯ã‚¦ã‚§ãƒ–ã‚µãƒ¼ãƒãƒ¼ã®ã‚¢ã‚¯ã‚»ã‚¹ãƒã‚°ã®ã“ã¨ã ã£ãŸã€‚Apache ã® access_logã€ã‚ã‚Œã€‚ã‚¢ã‚¯ã‚»ã‚¹ãƒã‚°ã«é–¢ã—ã¦ã¯ã€æœ€è¿‘ã¯ãƒã‚°ã‹ã‚‰ PV ã‚„ UU ã‚’è¨ˆç®—ã™ã‚‹ãã‚‰ã„ã ã£ãŸã‚‰ Google Analytics ãªã‚“ã‹ã‚’æœ€åˆã‹ã‚‰ä½¿ã£ã¦ã‚‹ã€ã¨ã„ã†äº‹ä¾‹ã®ã»ã†ãŒå¤šã„ã‹ã‚‚ã—ã‚Œãªã„ã€‚ã„ãšã‚Œã«ã—ã¦ã‚‚æœ¬è³ªçš„ã«ã¯HTTPãƒªã‚¯ã‚¨ã‚¹ãƒˆã‹ã‚‰å¾—ã‚‰ã‚Œã‚‹æƒ…å ±ã ã‘ã§åˆ†æžã—ã¦ã„ã‚‹ã¨ã„ã†ã“ã¨ã§å¾—ã‚‰ã‚Œã‚‹æƒ…å ±ã¯ä¸€ç·’ã§ã™ã€‚

ã“ã®ã‚¢ã‚¯ã‚»ã‚¹ãƒã‚°åˆ†æžã§ã¯ã€ã©ã®URLã«ã©ã®ç¨‹åº¦ã®ã‚¢ã‚¯ã‚»ã‚¹ãŒã‚ã£ãŸã‹ã¨ã‹ã€ã ã„ãŸã„æ—¥ã‚„æœˆã«ã©ã‚Œãã‚‰ã„ã® UU ãŒã‚ã£ãŸã‹ã¨ã„ã£ãŸã“ã¨ã¯ã‚ã‹ã‚‹ã€‚ã§ã‚‚ã€ãã‚Œä»¥ä¸Šã¯ã‚ã‹ã‚‰ãªã„ã€‚ã‚¢ã‚¯ã‚»ã‚¹ã—ãŸãƒ¦ãƒ¼ã‚¶ãƒ¼ã®æ€§åˆ¥ã‚„å¹´é½¢ã¨ã„ã£ãŸå€‹åˆ¥ã®å±žæ€§ã€ãƒˆãƒ©ãƒ³ã‚¶ã‚¯ã‚·ãƒ§ãƒ³IDã€è³¼å…¥ã—ã‚ˆã†ã¨ã—ãŸå•†å“ï½¥ï½¥ï½¥ã¿ãŸã„ãªã‚¦ã‚§ãƒ–ã‚µãƒ¼ãƒãƒ¼ãŒæ„ŸçŸ¥ã—ã‚ˆã†ã®ãªã„ãƒ‡ãƒ¼ã‚¿ã¯å«ã¾ã‚Œã¦ã„ãªã„ã®ã§ã€ãã‚Œä»¥ä¸Šã®ã“ã¨ã‚’èª¿ã¹ã‚ˆã†ã¨æ€ã£ã¦ã‚‚èª¿ã¹ã‚ˆã†ãŒãªã„ã€‚

ã€Œè©³ç´°ãªãƒ‡ãƒ¼ã‚¿ãŒå–ã‚Œãªã„ãªã‚‰å–ã‚Œã‚‹ã‚ˆã†ã«ã™ã‚Œã°ã„ã„ã˜ã‚ƒãªã„ã€ã¨ã„ã†ã“ã¨ã§ã€ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã®ãƒã‚¸ãƒƒã‚¯ã‹ã‚‰è‰²ã€…ã¨ãã®è¾ºã‚’ç´ã¥ã‘ãŸãƒã‚°ã‚’åãã‚ˆã†ã«ã—ã¦ã‚„ã‚Œã°ã„ã„ï½¥ï½¥ï½¥ã¿ã‚“ãªå½“ç„¶ãã†ã™ã‚‹ã‚ã‘ã§ã™ã€‚

ã©ã†ã„ã†ã‚³ãƒ¼ãƒ‰ã§ä¾‹ã‚’æ›¸ã„ãŸã‚‰ã„ã„ã‹ã¡ã‚‡ã£ã¨å¾®å¦™ã ã‘ã©ã‚‚

# å•†å“è³¼å…¥ç”»é¢
post '/purchase'  => sub {
    my $self = shift;
    my $item = My::Item->find(â€¦);
    my $user = My::User->purchase( $item );
    
    # ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ã‚·ãƒ§ãƒ³ãƒã‚°ã‚’å‡ºåŠ›ã™ã‚‹
    $self->logger->emit(
        user_hash => $user->hash,
        age => $user->age,
        sex => $user->sex,
        session => $user->session_id,
        item => $item->id,
        â€¦   
    );
    
    $self->render;
};

ã“ã‚“ãªæ„Ÿã˜ã§ã€ã¨ã‚ã‚‹ã‚¤ãƒ™ãƒ³ãƒˆã«å¯¾ã—ã¦ã‚¢ã‚¯ã‚»ã‚¹ãƒã‚°ã ã‘ã§ã¯æ•æ‰ã—ã‚ˆã†ãŒãªã„ãƒ‡ãƒ¼ã‚¿ã‚’ãƒã‚°ã¨ã—ã¦æ›¸ãå‡ºã—ã¦ã‚„ã‚‹ã€‚ã“ã®æ‰‹ã®ãƒã‚°ã‚’ã‚ã¡ã“ã¡ã§ã¨ã£ã¦ãŠã„ã¦å¾Œã‹ã‚‰è§£æžã™ã‚Œã°ã€ä¾‹ãˆã°ã€Œå•†å“è³¼è²·å‰ã®ç”»é¢ã§ä½•%ãŒãƒ‰ãƒãƒƒãƒ—ã—ã¦ã„ã‚‹ã‘ã©ãã‚ŒãŒã©ã‚“ãªå±žæ€§ã®ãƒ¦ãƒ¼ã‚¶ãƒ¼ã ã£ãŸã€ã¨ã‹ã€Œä¸€ãƒ¶æœˆã«æ•°å›žä»¥ä¸Šè¨ªã‚Œã‚‹ãƒ¦ãƒ¼ã‚¶ãƒ¼ã¨ãã†ã§ãªã„ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®ã‚³ãƒ³ãƒãƒ¼ã‚¸ãƒ§ãƒ³ã®ç¨‹åº¦ãŒã“ã®ãã‚‰ã„é•ã£ãŸã€ãªã‚“ã¦ã„ã†åˆ†æžãŒå¯èƒ½ã«ãªã‚‹ã€‚ã“ã®ãƒ‡ãƒ¼ã‚¿ã‚’ä½¿ã£ã¦æ„å¿—æ±ºå®šã‚’ã™ã‚Œã°ã€ã‚„ã¿ãã‚‚ã«ã‚µã‚¤ãƒˆã‚’æ”¹å–„ã™ã‚‹ã‚ˆã‚Šã¯ãšã£ã¨ç¢ºåº¦ã®é«˜ã„æ–½ç–ã‚’æ‰“ã¤ã“ã¨ãŒã§ãã‚‹ã—ã€A/B ãƒ†ã‚¹ãƒˆãªã‚“ã‹ã§ã®è©•ä¾¡ã«ã‚‚åˆ©ç”¨ã—ã‚„ã™ã„ã€‚

ï½¥ï½¥ï½¥è§£æžã§ãã‚‹ã‚ˆã†ã«ãªã‚‹ã®ã¯ã„ã„ã‚“ã ã‘ã©ã€ãã‚“ãªã«ã†ã¾ã„è©±ã¯ãªã„ã€‚å½“ç„¶ã„ã‚ã„ã‚æ‚©ã¾ã—ã„å•é¡ŒãŒã§ã¦ãã‚‹ã€‚ç‰¹ã«ã‚µã‚¤ãƒˆã®è¦æ¨¡ãŒå¤§ãããªã‚Œã°ãªã‚‹ã»ã©ã€‚

ãã®ãƒã‚°ã£ã¦ã©ã†ã‚„ã£ã¦åŽé›†ã™ã‚‹ã®?
ãã‚“ãªã§ã‹ã„ãƒ‡ãƒ¼ã‚¿ã©ã“ã«ã‚¹ãƒˆã‚¢ã™ã‚‹ã®?
ãã‚“ãªã§ã‹ã„ãƒ‡ãƒ¼ã‚¿ã©ã†ã‚„ã£ã¦è¨ˆç®—ã™ã‚‹ã®?
ãƒã‚°ã®ãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆå¤‰æ›´ã«ã©ã†å¯¾å¿œã™ã‚‹ã®?
è¨ˆç®—çµæžœã¯ã©ã†ã‚„ã£ã¦å‚ç…§ã™ã‚‹ã®?

ãƒãƒ¼ã‚«ãƒ«ã«åãå‡ºã—ãŸãƒã‚°ã¯ã€ã©ã†ã«ã‹ã—ã¦è§£æžç”¨ã®ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã«é›†ã‚ã¦ã“ãªã„ã¨ã„ã‘ãªã„ã€‚ã‚¤ãƒ™ãƒ³ãƒˆãƒã‚°ã¨ã„ã†æ€§æ ¼ä¸Šã€ãã‚Œã¯ãªã‚‹ã¹ããƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ ã§åŽé›†ã—ã¦ãŠããŸã„ã€‚é›†ã‚ãŸãƒ‡ãƒ¼ã‚¿ã‚’ä¿å˜ã™ã‚‹ã¨ã—ã¦ã€æ—¥ã«æ•°ç™¾GBã«ãªã‚‹ã‚ˆã†ãªãƒ‡ãƒ¼ã‚¿ã‚’ã„ã£ãŸã„ã©ã“ã«ä¿å˜ã—ã¤ã¥ã‘ã‚‹ã¨ã„ã†ã®ã‹ã€‚MySQL? MongoDB? ã†ãƒ¼ã‚“ã€‚é›†ã‚ãŸã¯ã„ã„ã‘ã©ã€ãƒ‡ãƒ¼ã‚¿ãŒã§ã‹ã™ãŽã¦é›†è¨ˆã®ãƒãƒƒãƒãŒä¸€æ—¥ã§çµ‚ã‚ã‚‰ãªã„ï½¥ï½¥ï½¥!! è¨ˆç®—ã§ãã‚‹ã®ã¯ã„ã„ã‘ã©ã€æ¯Žå›žã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã«ãŠé¡˜ã„ã—ãªã„ã¨ã„ã‘ãªã„ã€ã§ã‚‚ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãŒå¿™ã—ãã¦ã‚„ã£ã¦ãã‚Œãªã„! ãƒã‚°ã«æ–°ã—ã„å±žæ€§ã‚’è¿½åŠ ã—ãŸã„! ãˆã€ãªã«ã‚ã‚“ãªå·¨å¤§ãª MySQL ã®ãƒ†ãƒ¼ãƒ–ãƒ«ã‚’ alter table ã™ã‚‹ã‚ã‘? ãƒãƒ¼ãƒ‰ãƒ‡ã‚£ã‚¹ã‚¯ãŒå£Šã‚Œã¾ã—ãŸ! ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯å¸¯åŸŸãŒæº¢ã‚Œã¾ã—ãŸï½¥ï½¥ï½¥!

ã€ŒãŽã‚ƒãƒ¼ã€

ãªãƒ¼ã‚“ã¦ã“ã¨ãŒèµ·ã“ã£ã¦ã€ã¾ã‚ãªã‹ãªã‹ã€ãã‚“ãªã«é«˜åº¦ãªåˆ†æžãŒã—ãŸã„ã‚ã‘ã˜ã‚ƒãªã‹ã£ãŸã¨ã—ã¦ã‚‚ã€ãã‚Œãªã‚Šã«ã“ã“ã®ã‚·ã‚¹ãƒ†ãƒ æ§‹ç¯‰ã¨é‹ç”¨ç¶æŒã¯éª¨ã®æŠ˜ã‚Œã‚‹è©±ï½¥ï½¥ï½¥ã ã£ãŸã€‚ã ã‹ã‚‰ã¿ã‚“ãªã‚¢ã‚¯ã‚»ã‚¹ãƒã‚°ç¨‹åº¦ã®åˆ†æžã§å¦¥å”ã—ã¦ã„ãŸã€‚ã¨ã“ã‚ãŒã€ãã“ã®ã¨ã“ã‚ã‚’é ‘å¼µã£ã¦ãã¡ã‚“ã¨ã‚„ã£ã¦ã€ãƒ‡ãƒ¼ã‚¿åˆ†æžã‚’ã‚‚ã¨ã«ã—ãŸæ„å¿—æ±ºå®šã‚’å¯èƒ½ã«ã—ãŸã®ãŒ Zynga ãªã‚“ã‹ãŒæœ‰åã«ã—ä»Šã§ã¯ä¸€èˆ¬çš„ã«ãªã‚Šã¤ã¤ã‚ã‚‹ã‹ã®æ‰‹æ³•ã§ã™ã€‚

Webã‚µãƒ¼ãƒ“ã‚¹ã®ã‚ˆã†ãªã‚¹ã‚¿ãƒ¼ãƒˆå°è¦æ¨¡B2Cã§å§‹ã¾ã‚‹ã‚ˆã†ãªä¸–ç•Œã§ã¯ã€ã“ã®ãƒ‡ãƒ¼ã‚¿è§£æžå‘¨ã‚Šã¨ã„ã†ã®ã¯ã“ã“æ•°å¹´ã®é–“ã«æ€¥æ¿€ã«ç››ã‚Šä¸ŠãŒã£ãŸåˆ†é‡Žã ã‘ã‚Œã©ã‚‚ã€ã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ãƒ©ã‚¤ã‚ºã‚·ã‚¹ãƒ†ãƒ ã§ã¯ (è‡ªåˆ†ã‚‚ã‚ã‚“ã¾ã‚Šã‚ˆãã‚ã‹ã£ã¦ãªã„ã‘ã©) ERM ã‚„ã‚‰ SCM ã‚„ã‚‰ãã®è¾ºã®åŸºå¹¹çµ±åˆã‚·ã‚¹ãƒ†ãƒ ã‹ã‚‰é›†ã‚ãŸå¤§é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚’æ ¼ç´ã—ã€åˆ†æžã€è¡¨ç¤ºã™ã‚‹ä¸€é€£ã®ã‚·ã‚¹ãƒ†ãƒ ã¯ DWH (ãƒ‡ãƒ¼ã‚¿ã‚¦ã‚§ã‚¢ãƒã‚¦ã‚¹) ã¨è¨€ã‚ã‚Œã¦ã€ãã‚Œã¯ãã‚Œã¯ã„ã‚ã‚“ãªã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ãƒ©ã‚¤ã‚¸ãƒ¼ãªãƒãƒ¼ãƒ‰ã‚„ã‚½ãƒ•ãƒˆã«ã‚ˆã£ã¦å®Ÿç¾ã•ã‚Œã¦ããŸï½¥ï½¥ï½¥ã‚‰ã—ã„ã€‚

å…ˆæ—¥ã‚‚ã€ã¨ã‚ã‚‹ã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ãƒ©ã‚¤ã‚ºãªåŸºå¹¹æ¥å‹™ã«æºã‚ã£ã¦ã„ã‚‹å‹äººãŒã€ŒåŸºå¹¹ã®ãƒãƒƒãƒã‚’ä¸€æ—¥ã§çµ‚ã‚ã‚‰ã›ãªã„ã¨ã„ã‘ãªã„ã‚“ã ã‘ã©ã€ãƒ‡ãƒ¼ã‚¿ãŒå¤šã™ãŽã¦çµ‚ã‚ã‚‰ãªãã£ã¦å¤§å¤‰ã€‚ãã®ãŸã‚ã«çµæ§‹ãªæ€§èƒ½ã®å•†ç”¨è£½å“ã‚’è²·ã£ã¦ã‚‹ã€‚ãã®ã†ã¡ Hadoop ã¨ã‹åˆ†æ•£ã‚·ã‚¹ãƒ†ãƒ ã§ã‚„ã‚Œã‚‹ã¨ã„ã„ã‚“ã ã‘ã©ãã€ã¨è¨€ã£ã¦ã¾ã—ãŸã€‚

ãƒ“ãƒƒã‚°ãƒ‡ãƒ¼ã‚¿ã®æ´»ç”¨ã¯ã€3ã¤ã®æ®µéšŽã«åˆ†ã‘ã‚‰ã‚Œã‚‹ã¨è€ƒãˆã¦ã„ã¾ã™ã€‚ç¬¬1æ®µéšŽã¯ã‚¦ã‚§ãƒ–ãƒã‚°ãƒ‡ãƒ¼ã‚¿ãŒå¯¾è±¡ã§ã€ä¸»ã«ãƒ‰ãƒƒãƒˆã‚³ãƒ ä¼æ¥ãŒã“ã‚Œã‚‰ã®ãƒ‡ãƒ¼ã‚¿ã‚’è§£æžã—ã¦ã„ã¾ã—ãŸã€‚ç‰¹ã«ã€ãƒˆãƒ©ãƒ³ã‚¶ã‚¯ã‚·ãƒ§ãƒ³ãƒ‡ãƒ¼ã‚¿ã®éƒ¨åˆ†ã«ç„¦ç‚¹ã‚’å½“ã¦ã¦ã„ãŸã®ã§ã™ã€‚ã—ã‹ã—ãƒ“ãƒƒã‚°ãƒ‡ãƒ¼ã‚¿ã®åˆ°æ¥ã«ã‚ˆã£ã¦ã€ãƒˆãƒ©ãƒ³ã‚¶ã‚¯ã‚·ãƒ§ãƒ³ã‚ˆã‚Šã‚‚ã†ä¸€æ®µéšŽè©³ç´°ãªãƒ¬ãƒ™ãƒ«ã§ã‚ã‚‹ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ã‚·ãƒ§ãƒ³ãƒ‡ãƒ¼ã‚¿ã€ã¤ã¾ã‚Šã€ã‚„ã‚Šå–ã‚Šã•ã‚Œã‚‹ãƒ‡ãƒ¼ã‚¿ã®ä¸èº«ãŒè§£æžã•ã‚Œã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã—ãŸã€‚
ç¬¬2æ®µéšŽã¯ã€è§£æžã®å¯¾è±¡ãŒã‚½ãƒ¼ã‚·ãƒ£ãƒ«ãƒ¡ãƒ‡ã‚£ã‚¢ã«ç§»ã£ã¦ãã¾ã—ãŸã€‚Facebookã‚„Twitterã€ãƒ–ãƒã‚°ãªã©ã«æ›¸ã‹ã‚Œã‚‹ãƒ†ã‚ã‚¹ãƒˆã‚’å¯¾è±¡ã¨ã—ãŸã‚‚ã®ã§ã™ã€‚ç¾åœ¨ã¯ã“ã®ç¬¬2æ®µéšŽã«ã‚ã‚Šã¾ã™ã€‚

ã¨ã€ã“ã® DWH ä¼æ¥ã® Teradata ã® CTO ãŒè¨€ã†ã‚ˆã†ã«ãŸã ã®ã‚¢ã‚¯ã‚»ã‚¹ãƒ‡ãƒ¼ã‚¿ã‹ã‚‰ä¸€æ©é€²ã‚“ã§ã€Œã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ã‚·ãƒ§ãƒ³ãƒ‡ãƒ¼ã‚¿ã€ã‚’åˆ†æžãƒ»æ´»ç”¨ã™ã‚‹ã‚ˆã†ã«ãªã£ãŸã¨ã„ã†ã®ãŒå¤§ããªæµã‚Œã§ãã®èƒŒå¾Œã«ã¯ãƒ“ãƒƒã‚°ãƒ‡ãƒ¼ã‚¿(ã«ã¾ã¤ã‚ã‚‹ãƒãƒ¼ãƒ‰ã‚¦ã‚§ã‚¢ã®é€²åŒ–ã‚„ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢æŠ€è¡“ã®ç™»å ´)ãŒã‚ã£ãŸã€ã¨ã„ã†ã®ãŒè¿‘å¹´ã§ã™ã€‚

ãã‚Œã‚’ã€ä¸€éƒ¨ã®é–‹ç™ºåŠ›ã®ã‚ã‚‹ä¼æ¥ã¯è‡ªç¤¾ã®ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãŒãŒã‚“ã°ã£ãŸã‚Šã€ã‚ã‚‹ã„ã¯è³‡é‡‘åŠ›ã®ã‚ã‚‹ä¼æ¥ã¯å°‚æ¥ãƒ™ãƒ³ãƒ€ãƒ¼ã¨çµ„ã‚“ã§ãã„ã†ã„ã£ãŸã‚‚ã®ã‚’æ§‹ç¯‰ã—ã¦ããŸã®ã ã‘ã©ã€AWS ãŒä»®æƒ³åŒ–æŠ€è¡“ã‚’ã¯ã˜ã‚ã¨ã—ã¦å¤§è¦æ¨¡ã‚¤ãƒ³ãƒ•ãƒ©ã‚’ã‚³ãƒ¢ãƒ‡ã‚£ãƒ†ã‚£åŒ–ã—ãŸã‚ˆã†ã«ã€ãƒ‡ãƒ¼ã‚¿è§£æžã‚·ã‚¹ãƒ†ãƒ ã‚’ã‚¯ãƒ©ã‚¦ãƒ‰ã«ã‚ˆã£ã¦ã‚³ãƒ¢ãƒ‡ã‚£ãƒ†ã‚£åŒ–ã—ã‚ˆã†ã¨ã™ã‚‹è©¦ã¿ã‚‹äººãŸã¡ãŒã“ã“æœ€è¿‘ã§ã¦ããŸã€‚Treasure Data ç¤¾ã¯ãã‚“ãªé‡Žå¿ƒæº¢ã‚Œã‚‹ãƒ™ãƒ³ãƒãƒ£ãƒ¼ä¼æ¥ã®ã²ã¨ã¤ã€ãªã‚“ã§ã—ã‚‡ã†ã€‚

Treasure Data ã®ã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ (ã–ã£ãã‚Š)

ã‚ˆã‚Šå…·ä½“çš„ã« Treasure Data ã¯å…ˆã»ã©ã®å¤§è¦æ¨¡ãƒã‚°è§£æžã«ã¾ã¤ã‚ã‚‹å„ç¨®å•é¡Œã«ã©ã†å¯¾å¿œã™ã‚‹ã®ã‹ã€‚

ã“ã®è¾ºã¯ å…ˆæ—¥ã® JAWS DAYS 2013 ã§ã® @repeatedly ã®ãƒ—ãƒ¬ã‚¼ãƒ³ãŒè©³ã—ã„ã€‚

ãƒã‚°ã®åŽé›†ã¯ã€Treasure Data ãŒã‚¹ãƒãƒ³ã‚µãƒ¼ã«ãªã£ã¦é–‹ç™ºã•ã‚Œã¦ã„ã‚‹ OSS ã® Fluentd ã§è¡Œã†ã€‚ã‚ˆã‚Šæ£ç¢ºã«ã¯ãã® OSS ã® Fluentd ã‚’ã€Treasure Data å‘ã‘ã«ä½¿ã†å‰æã«ãƒ‘ãƒƒã‚±ãƒ¼ã‚¸ãƒ³ã‚°ã—ãŸ td-agent (https://github.com/treasure-data/td-agent) ã‚’ä½¿ã†ã€‚API ã‚ãƒ¼ã‚’å…¥åŠ›ã—ã¦ã¡ã‚‡ã¡ã‚‡ã„ã¨å…¥å‡ºåŠ›ã®è¨å®šã‚’ã—ã¦ã‚„ã‚‹ã ã‘ã§ TD ã«ãƒ‡ãƒ¼ã‚¿ã‚’é€ã‚‹ã“ã¨ãŒã§ãã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã‚‹ã€‚Fluentd ãã®ã‚‚ã®ã¯éžå¸¸ã«ã‚¹ã‚±ãƒ¼ãƒ©ãƒ–ãƒ«ãªä½œã‚Šã«ãªã£ã¦ã„ã‚‹ã—ã€å®Ÿç¸¾é¢ã‚‚(ã‚ˆãçŸ¥ã‚‰ã‚Œã¦ã„ã‚‹ã‚ˆã†ã«) LINE ã®ãƒãƒƒã‚¯ã‚¨ãƒ³ãƒ‰ãªã‚“ã‹ã«ã‚‚ä½¿ã‚ã‚Œã¦ã„ãŸã‚Šã—ã¦ååˆ†ã€‚ãƒ—ãƒ©ã‚¬ãƒ–ãƒ«ãªã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ã«ã‚ˆã£ã¦ãƒã‚°ãã®ã»ã‹ã®å…¥åŠ›ã‚’å¤šç¨®å¤šæ§˜ãªãƒ•ã‚©ãƒ¼ãƒžãƒƒãƒˆã«å¯¾å¿œã—ã€ãã‚Œã‚’ JSON ã¨ã„ã†å¤‰åŒ–ã«å¼·ã„æŸ”è»Ÿãªå½¢ã«å¤‰æ›ã—ã¦å–ã‚Šæ‰±ã†ã€‚ãƒ—ãƒã‚°ãƒ©ãƒ å†…ã‹ã‚‰ Fluentd ã«ãƒã‚°ã‚’é£›ã°ã™ãŸã‚ã®ãƒã‚¬ãƒ¼ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚‚ã€å„ç¨®è¨€èªžã«å¯¾å¿œã—ãŸå®Ÿè£…ãŒç”¨æ„ã•ã‚Œã¦ã„ã‚‹ã€‚

ãƒ‡ãƒ¼ã‚¿ã‚¹ãƒˆã‚¢ã¯ TD ç¤¾ãŒç‹¬è‡ªã«é–‹ç™ºã—ãŸã‚«ãƒ©ãƒ ãƒŠãƒ¼ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ãŒä½¿ã‚ã‚Œã‚‹ã€‚ç‹¬è‡ªã«é–‹ç™ºã—ãŸã¨ã„ã£ã¦ã‚‚å®Ÿéš›ã«ã¯ S3 ä¸Šã«æ§‹ç¯‰ã•ã‚ŒãŸã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã®ã‚ˆã†ã§ã€99.999999999% ã®å …ç‰¢æ€§ã¨ 99.99% ã®å¯ç”¨æ€§ã‚’è¬³ã† S3 ã®ä¸Šã«ã€HDFS ã®å¼±ç‚¹ã‚’å…‹æœã™ã‚‹ãŸã‚(+ ãã®ã»ã‹å¹¾ã¤ã‹ã®ç›®çš„ã®ãŸã‚)ã‚«ãƒ©ãƒ ãƒŠãƒ¼å½¢å¼ã®ã‚¤ãƒ³ã‚¿ãƒ•ã‚§ãƒ¼ã‚¹ã‚’å®Ÿç¾ã—ãŸã‚‚ã®ã«ãªã£ã¦ã„ã‚‹ã€‚S3 ãªã®ã§å¢—ãˆç¶šã‘ã‚‹ãƒ‡ãƒ¼ã‚¿ã«å¯¾ã—ã¦ã‚¹ã‚±ãƒ¼ãƒ©ãƒ–ãƒ«ã ã—ã€ã‚«ãƒ©ãƒ ãƒŠãƒ¼å½¢å¼ãªã®ã§ç‰¹å®šã®ãƒ‡ãƒ¼ã‚¿ã ã‘ã‚’å‡¦ç†ã—ãŸã„ã€ãªã‚“ã¦ã¨ãã«ä½™è¨ˆãª I/O ãŒç™ºç”Ÿã—ãªã„ä½œã‚Šã«ãªã£ã¦ã„ã‚‹ã®ã§åŠ¹çŽ‡çš„ã€‚

å¤§è¦æ¨¡ãƒ‡ãƒ¼ã‚¿ã«å¯¾ã—ã¦ã‚¹ã‚±ãƒ¼ãƒ«ã™ã‚‹ãŸã‚ã®è¨ˆç®—åŸºç›¤ã¯ Hive + Hadoopã€‚ã§ã€Hadoop ã‚’å…ˆã®ã‚«ãƒ©ãƒ ãƒŠãƒ¼ã‚¹ãƒˆãƒ¬ãƒ¼ã‚¸ã«å¯¾å¿œã•ã›ã¦ã„ã‚‹ã€‚

è¨ˆç®—çµæžœã®å—ã‘å–ã‚Šæ–¹ï½¥ï½¥ï½¥ã“ã“ã¯ TD ã®ã‚¦ãƒªã®ä¸€ã¤ã§ã‚‚ã‚ã£ã¦ã€Web API ã‚„ MySQL ã‚„ S3 ãªã©ã„ã‚ã‚“ãªå½¢å¼ã§å—ã‘å–ã‚Œã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã‚‹ã€‚ãã‚Œã‚‰ã¨è‡ªç¤¾ã®ã‚°ãƒ©ãƒ•åŒ–ãƒ„ãƒ¼ãƒ«ï½¥ï½¥ï½¥ã“ã®åˆ†é‡Žã§ã¯ BI (Business Intelligence) ãªã‚“ã¦è¨€ã£ãŸã‚Šã™ã‚‹ã‘ã©ã‚‚ã€ãã“ã«æµã—è¾¼ã‚“ã§ã‚„ã‚‹ã“ã¨ã§ TD ã§è¨ˆç®—ã—ãŸå„ç¨®æŒ‡æ¨™ã‚’å®šç‚¹è¦³æ¸¬ã—ãŸã‚Šã™ã‚‹ã“ã¨ãªã‚“ã‹ã‚‚ã§ãã‚‹ã€‚

ï½¥ï½¥ï½¥ã¨ã„ã†ãƒ‡ãƒ¼ã‚¿åŽé›†ã‹ã‚‰å‡ºåŠ›ã¾ã§ã®ä¸€é€£ã®ã‚·ã‚¹ãƒ†ãƒ ã‚’æ§‹ç¯‰ã™ã‚‹ã“ã¨ã§ã€Œãƒ‡ãƒ™ãƒãƒƒãƒ‘ãƒ¼ã®è‹¦ç—›ã€ã‚’è‚©ä»£ã‚ã‚Šã—ã¦ã€ã¾ãŸãã‚Œã‚’ã‚ªãƒ¼ãƒ«ã‚¤ãƒ³ãƒ¯ãƒ³ã€ã‚¯ãƒ©ã‚¦ãƒ‰ã‚µãƒ¼ãƒ“ã‚¹ã¨ã—ã¦ã§æä¾›ã™ã‚‹ã“ã¨ã«ã‚ˆã£ã¦ä»¶ã®å•é¡Œã‚’è§£æ±ºã—ã¦ã„ã‚‹ã€‚

Treasure Data vs ...

Bigdata as a Service ã®æµã‚Œã¯ä½•ã‚‚ Treasure Data ã ã‘ãŒé€²ã‚ã¦ã„ã‚‹åˆ†é‡Žã¨ã„ã†ã‚ã‘ã§ã¯ãªãã€ä»–ã«ã‚‚ã„ã‚ã‚“ãªç«¶åˆãŒã„ã‚‹ã€‚ç‰¹ã«æ¯”è¼ƒã•ã‚Œã‚„ã™ã„ã®ã¯ TD ã®ãƒãƒƒã‚¯ã‚¨ãƒ³ãƒ‰ã«ã‚‚ãªã£ã¦ã„ã‚‹ Amazon ãŒã€AWSã®ä¸€ç’°ã¨ã—ã¦æä¾›ã™ã‚‹ãƒ‡ãƒ¼ã‚¿è§£æžç”¨ã®å„ç¨®ã‚µãƒ¼ãƒ“ã‚¹ã€‚*1 ã‚ˆã‚Šå…·ä½“çš„ã«ã¯

Amazon Elastic MapReduce (EMR)
Amazon Redshift

ã‚ãŸã‚ŠãŒãã‚Œã«ç›¸å½“ã™ã‚‹ã€‚
EMR ã¯ãã®åã®é€šã‚Š AWS ã«ãŠã‘ã‚‹ MapReduce ã®ã‚µãƒ¼ãƒ“ã‚¹ã§ã€Hive ã‚’ä½¿ã†ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã‚‚ã‚ã‚‹ã€‚S3 ã«ã‚¹ãƒˆã‚¢ã—ãŸãƒ‡ãƒ¼ã‚¿ã‚’èªã¿è¾¼ã‚“ã§ä»»æ„ã® MapReduce å‡¦ç†ã‚’å®Ÿè¡Œã•ã›ã‚‹ã“ã¨ãŒã§ãã‚‹ã€‚Redshift ã«ã„ãŸã£ã¦ã¯ã¾ã•ã« DWH ãã®ã‚‚ã®ã§ã™ã€‚

ãã‚Œã«å¯¾ã—ã¦ Treasure Data ãŒæä¾›ã™ã‚‹ã‚‚ã®ã¯ã„ã£ãŸã„? ãã‚Œã‚‚å…ˆã®ãƒ—ãƒ¬ã‚¼ãƒ³ã‚’ã¿ã‚‹ã¨ã„ã„ã€‚å‹•ç”»ã®æœ€å¾Œã§ã¯ã€ã¾ã•ã«ãã‚Œãã®é€šã‚Šã®è³ªç–‘å¿œç”ãŒã‚ã£ãŸã‚Šã™ã‚‹ã€‚

ãã‚Œã«å¯¾ã™ã‚‹ç”ãˆã¯ã€æ™®é€šã« EMR ã‚„ Redshift ã‚’ä½¿ã†ã ã‘ãªã‚‰åŒã˜ã ã‘ã‚Œã©ã€å®Ÿéš›ã«ã¯ Treasure Data ã¯åŽé›†ã‹ã‚‰å‡ºåŠ›ã¾ã§ã‚’çµ±åˆçš„ã«ã¾ã¨ã‚ã¦é¢å€’ã‚’è¦‹ã¦ã„ã‚‹ã“ã¨ã€ãã“ã«è±Šå¯Œãª API ã‚’ç”¨æ„ã™ã‚‹ã“ã¨ã§ãƒ‡ãƒ™ãƒãƒƒãƒ‘ãƒ¼ãƒ•ãƒ¬ãƒ³ãƒ‰ãƒªãƒ¼ã«ä»•ä¸Šã’ã¦ã„ã‚‹ã“ã¨ãŒå¤§ããªå·®åˆ¥åŒ–ãƒã‚¤ãƒ³ãƒˆã«ãªã£ã¦ã„ã‚‹ã€‚èª¤è§£ã‚’æã‚Œãšã«è¨€ã£ã¦ã¿ã‚Œã°ã€ç”Ÿã® AWS ã«å¯¾ã™ã‚‹ Herokuã€ã¿ãŸã„ãªã‚‚ã®ã ã¨è¦‹ã¦ã‚‚ã„ã„ã‹ã‚‚ã—ã‚Œãªã„ã€‚DWH ã¯é‹ç”¨ãŒã¨ã«ã‹ãé¢å€’ãªã®ã‚’æˆ‘ã€…ãŒé¢å€’è¦‹ã‚‹ãœ! ã¨ã„ã†ã®ãŒã“ã®æ‰‹ã®ã‚½ãƒªãƒ¥ãƒ¼ã‚·ãƒ§ãƒ³ã®ã‚¹ã‚¿ãƒ³ã‚¹ã ã—ã€ãã®é¡§å®¢ãŒã„ã¡ã°ã‚“ã‚„ã£ã¦æ¬²ã—ã„éƒ¨åˆ†ã«ç‰¹ã«ãƒ•ã‚©ãƒ¼ã‚«ã‚¹ã™ã‚‹ã“ã¨ã§å·®åˆ¥åŒ–ã—ã¦ã„ã‚‹ã¨ã„ã†æ„å‘³ã§ Treasure Data ã®æˆ¦ç•¥ã¯çµæ§‹ç‹ãŒã„ã„ï½¥ï½¥ï½¥ã¨è‡ªåˆ†ã‚‚æ€ã†ã—æ–¹ã€…ã§ã‚‚ãã†è¦‹ã‚‰ã‚Œã¦ã„ã‚‹ã‚ˆã†ã ã€‚

TD ã®ä½¿ç”¨æ„Ÿ

å®Ÿéš› TD ãŒè§£æ±ºã™ã‚‹ã®ã¯å¤§è¦æ¨¡ãƒã‚°è§£æžãªã‚ã‘ã ã‘ã‚Œã©ã‚‚ã€è‡ªåˆ†ã®ã‚ˆã†ã«å°è¦æ¨¡ã«ä½¿ã†ã¨ã„ã†ã®ã§ã‚‚å…¨ãå•é¡Œãªã„ã€‚ã¨ã„ã†ã‹ TD ã¯ãã‚Œã‚‚æƒ³å®šã—ã¦ã„ã‚‹ã€‚

ã“ã®è¾ºã¯ http://d.hatena.ne.jp/naoya/20130219/1361262854 ã§ã‚‚æ›¸ã„ãŸé€šã‚Šä»Šå¾Œã‚‚ãšã£ã¨å¢—ãˆç¶šã‘ã‚‹ãƒã‚°ã‚’ãŸã ãŸã TD ã«é€ã‚Šç¶šã‘ã‚‹ã ã‘ã§è‰¯ã„ã¨ã†ä½¿ã„å‹æ‰‹ã®è‰¯ã•ã€‚ãã®ãƒžãƒã‚¸ãƒ¡ãƒ³ãƒˆã‚’ã—ãªãã¦ã¨ã„ã†ç²¾ç¥žçš„å®‰å¿ƒãŒå¾—ã‚‰ã‚Œã‚‹ã€‚å…ˆã®ã‚‚è¿°ã¹ãŸé€šã‚Šã€ãƒ‡ãƒ™ãƒãƒƒãƒ‘ãƒ¼ãƒ•ãƒ¬ãƒ³ãƒ‰ãƒªãƒ¼ã§ã‚ã‚‹ã“ã¨ã‚’ã‚¦ãƒªã«ã—ã¦ã„ã‚‹ã“ã¨ã‚‚ã‚ã£ã¦ã€ç…©é›‘ãªè¨å®šã‚‚ã„ã‚‰ãªã„ã—ã€å‡ã£ãŸã“ã¨ã‚’ã—ã‚ˆã†ã¨æ€ã£ãŸã‚‰ã ã„ãŸã„ã‚„ã‚ŠãŸã„ã“ã¨ã«ç›¸å½“ã™ã‚‹ API ãŒç”¨æ„ã•ã‚Œã¦ã„ã‚‹ã€‚ãã® API ã‚‚ Restful ã§ã‚·ãƒ³ãƒ—ãƒ«ãªã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ã«ãªã£ã¦ã¦å¦ç¿’ã‚³ã‚¹ãƒˆã¯ä½Žã„ã€‚

ãªãŠã€è‡ªåˆ†ã¯ Fluentd ã‚’ä½¿ã£ã¦å‡ºåŠ›ã‚’2æ–¹å‘ã«ã‚³ãƒ”ãƒ¼ã—ã¦ã€ç”Ÿãƒã‚°ã¯ä¿å˜ç›®çš„ã§ S3 ã«ç›´æŽ¥è»¢é€ã—ã¦ã€åˆ†æžå‘ã‘ã®ã„ã‚ã‚“ãªãƒ‡ãƒ¼ã‚¿ã‚’ãã£ã¤ã‘ãŸã‚‚ã®ã‚’ TD ã«é€ã‚Šã¤ã‘ã‚‹ãªã©ã—ã¦ä½¿ã£ã¦ã„ã¾ã™ã€‚

Treasure Data ã®ã„ã¾ã‚„ä»Šå¾ŒãŒã©ã‚“ãªé¢¨ã«è¦‹ãˆã‚‹ã‹ã¨ã„ã†ã®ã¯ã€æºã‚ã‚‹ã‚·ã‚¹ãƒ†ãƒ å¤§å°ã®è¦–ç‚¹ã«ã‚ˆã£ã¦å¤‰ã‚ã£ã¦ãã‚‹ã¨æ€ã†ã€‚

ã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ãƒ©ã‚¤ã‚ºãªäººã‚„å¤§è¦æ¨¡Webå±‹ã«ã¨ã£ã¦ã¯æ—¢å˜ã®DWHã‚ã‚‹ã„ã¯è‡ªç¤¾ã§é–‹ç™ºã—ãŸãƒã‚°è§£æžã‚·ã‚¹ãƒ†ãƒ ã‚’ç½®ãæ›ãˆã‚‹ã‚‚ã®ã€ã¤ã¾ã‚Š Treasure Data ãŒæƒ³å®šã™ã‚‹ãƒ¦ãƒ¼ã‚¶ãƒ¼åƒã®é€šã‚Šã«ãã‚Œã‚’èªè˜ã™ã‚‹ã¨æ€ã„ã¾ã™ã€‚å®Ÿéš›ã€ã‚¯ãƒƒã‚¯ãƒ‘ãƒƒãƒ‰ç¤¾ãªã‚“ã‹ã¯è‡ªåˆ†ãŸã¡ã§ Hadoop ã‚’é‹ç”¨ã—ã¦ã„ãŸã‘ã‚Œã©ã‚‚ãã®é‹ç”¨ã‚³ã‚¹ãƒˆãŒé«˜ãã¤ãã€ã¨ã„ã†ã®ã§ Treasure Data ã«ç§»è¡Œã—ãŸã¨ã„ã†ã—ã€ã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ãƒ©ã‚¤ã‚ºé ˜åŸŸã«é–¢ã—ã¦ã¯å…ˆã«è¿°ã¹ãŸé€šã‚Šãƒãƒƒãƒã«ä½¿ã‚ã‚Œã‚‹å¤§è¦æ¨¡ãƒ‡ãƒ¼ã‚¿ãƒ™ãƒ¼ã‚¹ãªã‚“ã‹ãŒå¿…è¦ã ã£ãŸéƒ¨åˆ†ã®ç½®æ›ã‚’æƒ³åƒã™ã‚‹ã¨ã“ã‚ã ã¨æ€ã†ã€‚ã€Œã‚¨ãƒ³ã‚¿ãƒ¼ãƒ—ãƒ©ã‚¤ã‚ºé ˜åŸŸã¯ãƒ‡ãƒ¼ã‚¿ã‚’ã‚¯ãƒ©ã‚¦ãƒ‰ã«é ã‘ã‚‰ã‚Œã‚‹ã‹å•é¡Œã€ã¨ã„ã†ã„ã¤ã‚‚ã®èª²é¡ŒãŒã‚ã‚‹ã®ã§ãªã‹ãªã‹ã‚¹ãƒ ãƒ¼ã‚ºã«æµ¸é€ã—ã¦ã„ã‹ãªã„ã¨ã¯æ€ã†ãŒã€å…ˆé€²çš„ãªãƒ¦ãƒ¼ã‚¶ãƒ¼ã¯ã™ã§ã«å°Žå…¥ã‚’é–‹å§‹ã—ã¦ã„ã‚‹ã¨ã„ã†ã“ã¨ã‚‚ã‚ã£ã¦ã€æ¡ˆå¤–æ¥½è¦³çš„ãªæœªæ¥ãŒå¾…ã£ã¦ã„ã‚‹ã‹ã‚‚ã—ã‚Œãªã„ã€‚

ä¸€æ–¹ã€ã“ã‚Œã¯å€‹äººçš„ãªå¦„æƒ³ã§ã‚‚ã‚ã‚‹ã®ã ã‘ã©ã€ã‚¹ã‚¿ãƒ¼ãƒˆã‚¢ãƒƒãƒ—ã‚„å°è¦æ¨¡ãªãƒ‡ãƒ™ãƒãƒƒãƒ‘ãƒ¼ã‹ã‚‰ã¯ AWS ãŒå€‹äººã«å¯¾ã—ã¦ã‚‚ä»®æƒ³åŒ–ã‚µãƒ¼ãƒãƒ¼ã‚„ãƒãƒ¼ãƒ‰ãƒãƒ©ãƒ³ã‚µãƒ¼ãã®ã»ã‹ã‚’çµ„ã¿åˆã‚ã›ãŸã‚·ã‚¹ãƒ†ãƒ ã‚’ã‚³ãƒ¢ãƒ‡ã‚£ãƒ†ã‚£åŒ–ã—ãŸã‚ˆã†ã«è¦‹ãˆãŸã®ã¨åŒã˜ã§ã€TDç¤¾ã‚ã‚‹ã„ã¯åŒç¤¾ã®ç«¶åˆãŒã€ã“ã‚Œã‹ã‚‰å…ˆãƒ‡ãƒ¼ã‚¿è§£æžåŸºç›¤ (DWH) ã‚’ã‚³ãƒ¢ãƒ‡ã‚£ãƒ†ã‚£åŒ–ã—ã¦ã„ãã“ã¨ã‚’æœŸå¾…ã—ãŸã„ã€‚ã‚¯ãƒ©ã‚¦ãƒ‰ã¯ã‚ã‚‹æ„å‘³ã€å€‹äººã‚„ã‚¹ã‚¿ãƒ¼ãƒˆã‚¢ãƒƒãƒ—ã®ã‚ˆã†ãªå°è¦æ¨¡ãªãƒãƒ¼ãƒ ã‚’ã‚¨ãƒ³ãƒ‘ãƒ¯ãƒ¼ãƒ¡ãƒ³ãƒˆã™ã‚‹ãƒ„ãƒ¼ãƒ«ã§ã‚‚ã‚ã‚Šã€ã‚ãšã‹ 4äººã®ä¼šç¤¾ã§ 1,000 ä¸‡ãƒ¦ãƒ¼ã‚¶ãƒ¼ã‚’ã•ã°ããã£ãŸ Instagram ã®æˆåŠŸãªã‚“ã‹ã¯ AWS ãŒãã†ã„ã†ã‚µãƒ¼ãƒ“ã‚¹ãªã‚“ã ã¨ã„ã†ã“ã¨ã‚’ä¸–ã®ä¸ã«çŸ¥ã‚‰ã—ã‚ãŸã€‚TD ã‚‚åŒã˜ã‚ˆã†ã«ã€å·¨äººã¨æˆ¦ãŠã†ã¨ã™ã‚‹ãã‚“ãªå°ã•ãªãƒãƒ¼ãƒ ã®æ–°ã—ã„æ¦å™¨ã«ãªã‚Œã°ã„ã„ã—ã€ãã†ãªã£ãŸã‚‰æ¥½ã—ã„ã€‚

ï½¥ï½¥ï½¥ã¨ã„ã†ã‚ã‘ã§ãªã‚“ã‹è‰²ã€…æ›¸ã„ã¦ãŸã‚‰ç†±ããªã£ã¦ã—ã¾ã£ã¦æ›¸ãã™ãŽã¾ã—ãŸãŒ Treasure Data ã®ç´¹ä»‹ã§ã—ãŸã€‚

è‡ªåˆ†ãŒãªã‚“ã§ã“ã‚“ãªã« Treasure Data æŽ¨ã—ã‹ã¨ã„ã†ã¨ã€ã¾ã‚æ£ç›´ã«è¨€ã£ã¦ CTO ã® @kzk_mover ã‚’çŸ¥ã£ã¦ã„ã‚‹ã‹ã‚‰å¿œæ´ã—ãŸã„ã¨ã„ã†å€‹äººçš„ãªæ°—æŒã¡ãŒçµæ§‹ã‚ã‚‹ã®ã¯éš ã•ãªã„ã€‚ã§ã‚‚ã€å®Ÿéš›ã«è‡ªåˆ†ã§ä½¿ã£ã¦ã¿ãŸã‚‰è¦‹äº‹ã«è‡ªåˆ†ã®æŠ±ãˆã¦ã„ãŸå•é¡Œã‚’è§£æ±ºã—ã¦ãã‚ŒãŸã—ã€æŠ€è¡“çš„ã‚‚çœŸã£å½“ã§ã€ãªã«ã‚ˆã‚Šãã®å€‹äººçš„å±•æœ›ã¿ãŸã„ãªã®ã‚’å®Ÿç¾ã—ã¦ãã‚Œã‚‹å¯èƒ½æ€§ãŒã‚ã‚Šãã†ã ã‹ã‚‰ã€ã¤ã„ã¤ã„æœŸå¾…ã—ã¡ã‚ƒã£ãŸã‚“ã§ã‚ã‚‹ã€‚

ã“ã®è¨˜äº‹ãŒçµæ§‹èªã¾ã‚Œã¦ã•ã‚‰ã«å°†æ¥ TD ç¤¾ãŒã‚‚ã£ã¨å¤§ãããªã£ã¦ã‚µã‚¯ã‚»ã‚¹ (!) ã—ãŸæ—¥ã«ã¯ã€ç‰¹ä¸Šå¯¿å¸ã§ã‚‚å¥¢ã£ã¦ã‚‚ã‚‰ã†ã“ã¨ã«ã™ã‚‹ã¨ã„ã†ã“ã¨ã§æœ¬ç¨¿ã‚’ç· ã‚ãŸã„ã¨æ€ã„ã¾ã™ã€‚

*1:è‹¥å¹²æ›¸ãæ–¹ãŒç´›ã‚‰ã‚ã—ã„ã§ã™ãŒTDãŒEMRã‚„Redshiftã‚’ãƒãƒƒã‚¯ã‚¨ãƒ³ãƒ‰ã«ã—ã¦ã„ã‚‹ã‚ã‘ã§ã¯ãªã„ã§ã™ã€‚TDã¯AWSã®ã†ã¡S3ã€ERBã€EC2ã€RDSç¨‹åº¦ã®ã¿åˆ©ç”¨ã—ã¦ã„ã‚‹ã¨ã®ã“ã¨