データマイニング+web勉強会ã«è¡Œã£ã¦ãã¾ã—ãŸ
é…ããªã‚Šã¾ã—ãŸãŒ データマイニング+web勉強会ã«è¡Œã£ã¦ãã¾ã—ãŸã€‚
http://atnd.org/events/4319
最åˆè£œæ¬ ã§ã‚‚ã†ã ã‚ã½ã¨æ€ã£ãŸã‚‰ã€twitter ã§ã¾ã å¸ãŒç©ºã„ã¦ã„ã‚‹ã¨ã„ã†æ›¸ãè¾¼ã¿ãŒã‚ã£ãŸã®ã§ã€
ä¼šå ´ã®ã‚¹ãƒ¼ãƒ“エã¾ã§é£›ã‚“ã§ã„ã£ãŸã€‚
æ°·æµ·ã®ä¸Šã€æµ·ã‚’支é…ã™ã‚‹7英雄ã¨ãƒãƒˆãƒ«ãŒé–‹å§‹ã•ã‚Œã‚‹----(嘘)
「ソーシャルウェブã¨ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‡ãƒ¼ã‚·ãƒ§ãƒ³
http://www.slideshare.net/hamadakoichi/ss-4113135
メモã£ãŸã“ã¨ã‚’ã¾ã¨ã‚ãªãŒã‚‰ã¤ã‚‰ã¤ã‚‰æ›¸ã„ã¦ã„ã。
レコメンド手法
レコメンド手法ã¯å¤§ãã2ã¤+ãã®ä»–ãŒã‚る。
コンテンツベース(類似度ã§)
å”調フィルタリング(ユーザã®è¡Œå‹•ã‹ã‚‰äºˆæ¸¬)ã§è¡Œã†ã€‚
ãã®ä»–ã®ãƒ†ã‚¯ã¨ã—ã¦ã¯ã€
ルールベース(XXXã¨ã„ã£ãŸã‚‰YYYã¿ãŸã„ãªãƒªã‚¹ãƒˆã‹ã‚‰ãŠå‹§ã‚)
ベイジアンベース(ã‚る状æ³ã®å¾Œã«ã¯ã“ã†ãªã‚‹ã ã‚ã†ã¨ã„ã†äºˆæ¸¬)ãªã©ã®æ‰‹æ³•ãŒã‚る。
amazonã®ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‡ãƒ¼ã‚·ãƒ§ãƒ³ãŒä¸€ç•ªæœ‰åã§ã‚¢ã‚¤ãƒ†ãƒ ・アイテムã®ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‰ã‚’è¡Œã†ã€‚
コンテンツベースã®ãƒ¡ãƒªãƒƒãƒˆ
ã™ããªã„データã§ã‚‚動作ã™ã‚‹
コンテンツベースã®ãƒ‡ãƒ¡ãƒªãƒƒãƒˆ
コンテンツã®è³ªè‡ªä½“ã¯è©•ä¾¡ã§ããªã„。
(åŒã˜å˜èªžãŒãŸãã•ã‚“出ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã£ã¦ã‚‚ãã‚ŒãŒã„ã„ã®ã‹ã©ã†ã‹ã¯ã‚ã‹ã‚‰ãªã„。)
強調フィルタリングã®ãƒ¡ãƒªãƒƒãƒˆ
言語ã«ä¾å˜ã—ãªã„ã€ã‚³ãƒ³ãƒ†ãƒ³ãƒ„ã®è³ªãŒã‚ã‹ã‚‹ã€‚
リンクや購入ãªã©ã®æŠ•ç¥¨ãŒã‚ã‚‹ã‹ã‚‰è¨€èªžã«ä¾å˜ã—ãªã„。
強調フィルタリングã®ãƒ‡ãƒ¡ãƒªãƒƒãƒˆ
データãŒå°‘ãªã„ã¨äºˆæ¸¬èƒ½åŠ›ãŒä½Žã„。
æ–°è¦ãƒ¦ãƒ¼ã‚¶ãªã©ã®ç›¸äº’作用ãŒã‚ã¾ã‚Šãªã„å ´åˆã¯ä½Žã„。
ユーザーã¨ã‚¢ã‚¤ãƒ†ãƒ ã®ã©ã¡ã‚‰ã®ãƒ‡ãƒ¼ã‚¿ã‚’ベースã«ã™ã‚‹ã¹ãã‹ï¼Ÿ
経験則ã§ã‚¢ã‚¤ãƒ†ãƒ ベースã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®ã»ã†ãŒæ—©ã„らã—ã„?
明らã‹ã«ä½¿ã‚ãªã„ã‚‚ã®ã‚’消ã—ã¦ã„ã‘ã‚‹ã‹ã‚‰ã€æ¬¡å…ƒè½ã¨ã—ãŒã—ã‚„ã™ã„ãŸã‚らã—ã„。
ユーザーã¯è²·ã‚ãªã‹ã£ãŸã¨ã„ã†å€¤ã‚‚レコメンドã®ãƒ‘ラメータã«ãªã‚‹ã‹ï¼Ÿ
å¯èƒ½æ€§ã¯ã‚る。ã©ã£ã‹ãŒå®Ÿè£…ã—ã¦ã„る?
web botã®ãƒ‡ãƒ¼ã‚¿ã‚’無視ã—ãªã„ã¨å¤§å¤‰ãªäº‹ã«ãªã‚‹ã‚ˆã†ãªæ°—ãŒã™ã‚‹ã€‚
全部ã®ãƒã‚°ã‚’解æžã™ã‚‹ã®ã‹ï¼Ÿ
期間ã§çµžã‚‹ã€‚
コンテンツベースã¨å”調フィルタリングã®ã©ã¡ã‚‰ã‚’使ã†ã¹ãã‹ã€‚
組ã¿åˆã‚ã›ã¦ä½¿ã†ã€‚
å”調フィルタリングã¯ã€æ–°è¦ã‚µã‚¤ãƒˆãªã©ã®ãƒ¦ãƒ¼ã‚¶ãŒã‚ã¾ã‚Šã„ãªã„サイトã§ã¯ãƒ‡ãƒ¼ã‚¿ãŒå°‘ãªã„ã®ã§ã‚ã¾ã‚Šæ©Ÿèƒ½ã—ãªã„。
ã¾ãŸã€å•†å“ã®å…¥ã‚Œæ›¿ã‚ã‚ŠãŒæ¿€ã—ã„サイトãªã©ã‚‚å•é¡Œã«ãªã£ã¦ãる。
コンテンツベースã¯å°Žå…¥ã—ã‚„ã™ã„ãŒã€ãƒ‡ãƒ¼ã‚¿ã®è³ªãŒå•é¡Œã«ãªã£ã¦ãる。
ã ã‹ã‚‰ã€ã¾ãšãƒ«ãƒ¼ãƒ«ãƒ™ãƒ¼ã‚¹ã‚’入れã¦ã€ã“ã‚Œã¨ã„ã£ãŸã‚‰ã‚ã‚Œã ã‚’ã¨æ‰‹ã§ã‚„ã£ã¦ã„ãã®ãŒã„ã„らã—ã„。
ãã‚Œã§ãƒ¦ãƒ¼ã‚¶ã®å±¥æ´ãƒã‚°ã‹ã‚‰ã©ã‚Œãらã„ã®ç²¾åº¦ãŒæ¤œè¨Žã™ã‚‹ã€‚
ã†ã¾ãã„ã£ãŸãƒ«ãƒ¼ãƒ«ã¯ãã®ã¾ã¾ã«ã—ã¦ãŠãã€ãƒ€ãƒ¡ãªã‚‚ã®ã¯å…¥ã‚Œæ›¿ãˆã‚‹ã€‚
ãã®ã†ã¡ãƒ‡ãƒ¼ã‚¿ãŒãŸã¾ã£ã¦ãã‚Œã°ã€å°‘ã—ã¥ã¤å”調フィルタリングãªã©ã®ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‰ã‚¨ãƒ³ã‚¸ãƒ³ã«ç§»å‹•ã—ã¦ã„ãã¿ãŸã„。
ãªã‚‹ã»ã©ã€‚。。
ã¾ãŸã€ãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‰ã‚¨ãƒ³ã‚¸ãƒ³ã‚’入れãŸã‚ã¨ã«ãƒã‚°ã‚’クラスタ解æžã«ã‹ã‘ã‚‹ã¨ã€ã„ã‚ã„ã‚é¢ç™½ã„ã“ã¨ãŒã‚ã‹ã£ãŸã‚Šã™ã‚‹ã‚‰ã—ã„。
レコメンデーション活用編 -開発者より-
http://www.slideshare.net/karubi/tokyowebminingkarubinamuru
amazon EC2 + Hadoop / mahout を利用ã—ãŸå•†å“ç”»åƒèªè˜ã‚’利用ã—ãŸãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‰ã‚·ã‚¹ãƒ†ãƒ 。
mahout(マホウト)ã¨ã¯ã€hadoop上ã§å‹•ä½œã™ã‚‹æ©Ÿæ¢°å¦ç¿’エンジン。
mahoutã¨ã¯è±¡ä½¿ã„ã®æ„味。Hadoopã®ã‚¢ã‚¤ã‚³ãƒ³ã¯è±¡ã•ã‚“。
å‚考:
http://www.infoq.com/jp/news/2009/04/mahout
EC2ã®ãŠã‹ã’ã§ã€ã‚¹ã‚±ãƒ¼ãƒ©ãƒ“リティãªã‚·ã‚¹ãƒ†ãƒ を構築出æ¥ã¦ã„るらã—ã„。
ユーザー数ãŒæ•°å€ã«çªç„¶å¢—ãˆã¦ã‚‚ãªã‚“ã¨ã‹ãªã£ã¦ã„る。(ã™ã”ã„)
ãŸã ã—ã€ã‚¯ãƒ©ã‚¦ãƒ‰ã¨ã„ã†ã®ã¯ã€ã„ã¤ã§ã‚‚作れるã—ã„ã¤ã§ã‚‚消ãˆã‚‹ã‚‚ã®ãªã‚“ã§ã™ã€‚(å言)
ãªãœ mahout を利用ã—ãŸã®ã‹ï¼Ÿ
機械å¦ç¿’ã¯ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ãŒã‚ã‹ã£ã¦ã„ã¦ã‚‚ã€å®Ÿè£…ã«ã‚³ãƒ„ãŒã‚ã‚Šã€ç‹¬è‡ªå®Ÿè£…ã¯é¿ã‘ãŸã‹ã£ãŸã‹ã‚‰ã‚‰ã—ã„
Hadoopï¼å…¥é–€ã¨ã‚¯ãƒ©ã‚¦ãƒ‰ã§ã®æ´»ç”¨
http://www.slideshare.net/yanaoki/hadoop-4113186
hadoop(MapReduce)ã¯æ°—ã«ãªã£ã¦ã„ãŸã‘ã©ã€ã¾ã 使ã£ãŸã“ã¨ãŒãªã„ã—ãœã²å‹‰å¼·ã—ã¦ã„ããŸã„ã¨æ€ã£ãŸã€‚
amazon クラウドã«amazon EMR ã¨ã„ㆠhadoop 環境ã®ã‚る。
å°‘ã—ä¾¡æ ¼ãŒé«˜ã„。
http://aws.amazon.com/elasticmapreduce/
map reduce ã®èª¬æ˜Ž
|--map--| | |--reduce-- map reduce ---|--map--| master | |--reduce-- |--map--|
ã“ã‚Œã« ãƒ‡ãƒ¼ã‚¿ã‚’æ ¼ç´ã™ã‚‹éƒ¨åˆ†ã®Key Value Store ã® HDFS (ストレージ)ãŒã‚ã‚‹
ç§ã®ç†è§£ã€‚
master ã¯ã€ãƒ‡ãƒ¼ã‚¿ã‚’ mapノードã«é©å½“ã«æ¸¡ã™ã€‚
mapã¯ãƒ‡ãƒ¼ã‚¿ã‚’見ã¦ã€ãã‚Œã®æ‹…当者㮠reduce ã«æ¸¡ã™ã€‚
ã“ã®æ™‚データã«åŠ å·¥ã™ã‚‹ã“ã¨ã‚‚ã§ãる。
担当㮠reduce ãŒé›†è¨ˆã—ã¦ã€ HDFS ã«æ›¸ã出ã™ã€‚
ã™ã¹ã¦ãŒçµ‚ã‚ã£ãŸã‚‰ã€å®Œäº†ã€‚
1å·¡ã§ã™ã¹ã¦ãŒçµ‚ã‚ã‚‹ã¨ãé™ã‚‰ãªã„。
3å·¡ãらã„ã™ã‚‹ã“ã¨ã‚‚ã‚るらã—ã„。
Unixã®ãƒ‘イプã¿ãŸã„ã«ã©ã‚“ã©ã‚“ã¤ãªã’ã‚‹ã“ã¨ãŒã§ãる。
サーãƒæ§‹æˆã¯ã€ãƒžã‚¹ã‚¿ãƒ¼1å°ã¨ãれ以外ãŒã™ã¹ã¦ã‚¹ãƒ¬ãƒ¼ãƒ–。
マスターã¯ã‚¹ãƒ¬ãƒ¼ãƒ–ã«æŒ‡ç¤ºã‚’出ã™ã€‚スレーブã¯ãã®æŒ‡ç¤ºã‚’実行ã™ã‚‹ã€‚
スレーブ間ã®ã‚„ã‚Šã¨ã‚Šã¯ãªã—?(基本ã¯ãªã—?)
→ã ã‹ã‚‰mapã‚„reduce ã¯ä¸¦åˆ—ã§å‹•ä½œã™ã‚‹ã®ã‹ãªã¨æ€ã†ã€‚
→ステートをæŒã£ã¦ã—ã¾ã†ã¨ä¸¦åˆ—処ç†ã¯ã¨ãŸã‚“ã«é›£ã—ããªã‚‹ã—ã€ã€ã€
http://mikilab.doshisha.ac.jp/dia/research/report/2009/1306/001/report20091306001.html
データをmap reduceã«æµã—込むコツã¯ï¼Ÿ
ã¾ã ã¿ã‚“ãªãŒãƒŽã‚¦ãƒã‚¦ã‚’貯ã‚ã¦ã„る状æ³ã€‚
ã“ã‚Œã¨ã„ã£ãŸæ‰‹æ³•ã¯ãªã„。
ãã®ã†ã¡äº‹ä¾‹ãŒã‚ã¤ã¾ã£ã¦ã€ã„ãã®ã‹ãªãã¨ã€‚
Wikipediaã«ã‚ˆã‚‹ãƒ†ã‚ストマイニング入門
http://www.slideshare.net/nokuno/datamining04-textmining
wikipediaをデータマイニングã—ã¦æ—¥æœ¬èªžIMEãªã©ã«åˆ©ç”¨ã§ãる辞書を作る話。
Linuxã®ãƒ„ールã§ã“ã“ã¾ã§ã§ãã‚‹ã®ã‹ã¨æ€ã£ãŸã€‚。。
mecabã¯æœªçŸ¥èªžå¼±ããªã„?ã£ã¦èžã„ãŸã‚‰ã€å…·ä½“çš„ã«ã©ã‚“ãªæœªçŸ¥èªžãƒ‡ãƒ¼ã‚¿ã‚’使ã£ãŸã®ï¼Ÿã¨èžã‹ã‚Œã¦ã€ãˆãƒ¼ã¨ã€ã‚¨ãƒå˜èªžã€‚。。。ã¨ã‹ã„ã£ãŸww。
エãƒã‚¨ãƒã§ã™ã€‚
ã¿ã‚“ãªå¤§å¥½ãエãƒã€‚
ã¨ã‚る仕事ã§ã‚ã‚‹æ–‡ç« ãŒã‚¨ãƒã„ã‹ã‚¨ãƒããªã„ã‹ã‚’判別ã™ã‚‹ã‚·ã‚¹ãƒ†ãƒ を作ã£ãŸã‚“ã§ã™ã‚ˆã€‚エãƒåˆ¤å®šã€‚
ãã—ãŸã‚‰ã€mecabã¯ã‚¨ãƒå˜èªžã‚’ã¶ã£ãŸåˆ‡ã£ã¦ãれるã‚ã‘ã§ã™ã‚ˆã€‚
「肉ã¨æ£’ã€ã¨ã‹ãã‚“ãªæ„Ÿã˜ã«ã€‚。。
mecabã¯ã€ãªã‚“ã¦ãƒ”ュアãªãƒ¤ãƒ„ãªã‚“ã www。
mecabãŒå…ƒã«ã—ã¦ã„ã‚‹(?)æ–°èžã«ã¯ã‚¨ãƒå˜èªžã§ã¦ã“ãªã„ã‹ã‚‰ã—ã‹ãŸãªã„ã‚ã‘ã§ã™ãŒã€‚
mecabã¯ã‚‚ã£ã¨å®˜èƒ½å°èª¬ã¨ã‹ã‚’èªã‚€ã¹ãw
mecabã®ãƒ¦ãƒ¼ã‚¶è¾žæ›¸ã«ã‚¨ãƒå˜èªžè¾žæ›¸ã‚’çªã£è¾¼ã‚€ä½œæ¥ã¯è™šã—ã„デスよwww
コード
講師をã•ã‚ŒãŸnokunoã•ã‚“ã®ãƒšãƒ¼ã‚¸ã«å‡¦ç†ã«ä½¿ã£ãŸã‚³ãƒ¼ãƒ‰ã¸ã®ãƒªãƒ³ã‚¯ãŒæœ‰ã‚Šã¾ã—ãŸã€‚
http://d.hatena.ne.jp/nokuno/20100516/1274006341
Webã®ç‰©ç†ä¸–界をã¤ãªã -Webã¨Gainerã®é€£æº-
http://www.slideshare.net/ogashin/web-oga-shin
オフィス全体ã§ã¯ãªãã€å€‹ã€…ã®å€‹äººå‘ã‘ã«å¿«é©ã®ç’°å¢ƒã‚’æä¾›ã—ã¾ã—ょã†ã¨ã„ã†è©±ã€‚
オフィスã£ã¦å¸ã«ã‚ˆã£ã¦å¦™ã«ç†±ã‹ã£ãŸã‚Šå¯’ã‹ã£ãŸã‚Šã™ã‚‹ã‚ˆãã‡ã€‚。。
ãã®ãŸã‚ã«ã¯ã€å€‹äººç”¨ã®å¸ã®æ¸©åº¦ãªã©ã‚’観察ã—ã¦ã€ãã‚Œã«ã‚ˆã‚Šæ‰‡é¢¨æ©Ÿãªã©ã‚’渡ã—ãŸã‚Šã™ã‚‹ã€‚
ãれ㫠gainer(ゲイナー) を利用ã§ããªã„ã‹ã¨ã„ã†ã“ã¨ã€‚
最é©ã®OSã£ã¦ã‚»ãƒ³ã‚µãƒ¼æ©Ÿèƒ½ã‚’サãƒãƒ¼ãƒˆã—ã¦ãã¦ã„ã‚‹ã‹ã‚‰ã€å…¥åŠ›ã¨ã‹ã¯ã‚½ãƒƒãƒã®æ–¹ã‹ã‚‰ã®ã‚¢ãƒ—ãƒãƒ¼ãƒã‚‚ã‚ã‚‹ã®ã‹ãªã¨æ€ã£ãŸã€‚
ラップトップã«ã¯ Windows 7 センサー API ã§ä½¿ãˆã‚‹ã‚»ãƒ³ã‚µãƒ¼ãŒã„ã£ã±ã„付ã„ã¦ã„ã‚‹ï¼
http://japan.internet.com/itenglish/20090904/1.html
FreeBSD ã§ã®å„種センサå–å¾—
http://blog.unnamed.jp/archives/2007/02/freebsd.html
貧ä¹æºã™ã‚Šã‚’カウントã™ã‚‹ãƒ‡ãƒã‚¤ã‚¹ã‚’カーãƒãƒ«ã«ãƒžãƒ¼ã‚¸ã—ãŸOpenBSD
http://slashdot.jp/opensource/article.pl?sid=10/03/01/0956254
ã“ã‚Œã¯ã“ã®äººé”ã®ä»•æ¥w↓
http://groups.google.co.jp/group/kernelvm
出力ã¯ã€ã€ã‚„ã£ã±ã‚Šèª²é¡Œã よãã€ã€ãã“ã¯gainerã®ã™ã”ã„点ã ã¨æ€ã†ã€‚
昔ã€ãƒ—ライベートã§éŸ³å£°èªè˜ + å¦ç¿’リモコンを利用ã—ãŸç©ºèª¿åˆ¶å¾¡ã£ã¦ã„ã†ã®ã‚„ã£ã¦ã„ãŸã‚“ã§ã™ã€‚
ã ã‘ã©ã€ãã®ã¨ã家ã«ã‚ã£ãŸã‚¨ã‚¢ã‚³ãƒ³ãŒå¦ç¿’リモコンã§ã†ã¾ãå¦ç¿’ã•ã›ã‚‹ã“ã¨ãŒå‡ºæ¥ãªã‹ã£ãŸã‚“ã§ã™ã€‚。。
ãã®ã‚¨ã‚¢ã‚³ãƒ³ã¯å¤§å®¶ã•ã‚“ãŒå–り付ã‘ãŸã‚‚ã®ã ã£ãŸã®ã§å‹æ‰‹ã«äº¤æ›ã™ã‚‹ã‚ã‘ã«ã‚‚ã„ã‹ãšã€ã€ã€
ソフトウェアã¯ã‚³ãƒ³ãƒ”ュータã®ä¸ã§å‹•ãç›®ã«è¦‹ãˆãªã„ã‚‚ã®ã ã‹ã‚‰ã€
ãƒãƒ¼ãƒ‰ã‚¦ã‚§ã‚¢ã‚’ã†ã¾ã使ã£ã¦ã€
プãƒã‚°ãƒ©ãƒ ã‚’ç¾å®Ÿä¸–ç•Œã«ãƒ•ã‚£ãƒ¼ãƒ‰ãƒãƒƒã‚¯ã•ã›ã‚‹ä»•çµ„ã¿ã‚’作ã£ã¦ã„ããŸã„ã¨æ€ã£ã¦ã„ã¾ã™ã€‚。。
ãã‚“ãªã‚ã‘ã§ã€ã•ã£ãã Gainer ã§éŠã¶ä¼š ã§ç™»éŒ²ã•ã‚ã¦ã„ã ãã¾ã—ãŸã€‚
http://groups.google.co.jp/group/gainer_asobu
ã¾ãšã¯ã€gainer è²·ã‚ãªã„ã¨ã€‚。。