「Mobageの大規模データマイニング」PRMU 2011 Big Data and Cloud で講演してきました
http://d.hatena.ne.jp/hamadakoichi/20111229/p1
1 of 161
More Related Content
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
1. Pattern Recognition and Media Understanding(PRMU)Conference
-Big Data and Cloud : Webスケール時代のパターン認識-
2011/10/06
Mobageの大規模データマイニング
Large Scale Data Mining of the Mobage Service
株式会社ディー・エヌ・エー
濱田晃一
DeNA Co.,ltd. ALL rights reserved
2. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
3. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
7. 活動領域
ソーシャルメディアのデータマイニング活用
2900万人以上の人々へ
各人のつながり・楽しみ・好み 個性にあった適切なサービス提供
Social Media
Social Graph
Fun Like Personality
Objective Process
Data Mining
Machine Learning
各人のつながり、楽しみ、好み、個性にあった
より適切なサービス提供
7
13. 数理解析手法の実ビジネスへの適用
2004年 博士号取得後
数理解析手法を実ビジネス適用の方法論構築
主な領域
◆活動の数理モデル化・解析手法
◆活動の分析手法・再構築手法
◆活動の実行制御・実績解析システム
…
内容抜粋
“Decoupling Executions in Navigating Manufacturing "Unified graph representation of processes
Processes for Shortening Lead Time and Its Implementation for scheduling with flexible resource
to an Unmanned Machine Shop”, assignment",
13
14. 数理解析手法の実ビジネスへの適用:活動例
活動の統一グラフモデルを構築・解析
Unified graphical model of processes and resources
青字:割付モデル属性
[ ] : Optional
Node ・priority(優先度) Edge
・duration(予定時間)
[・earliest(再早開始日時) ] Process Edge
Process [・deadline(納期) ]
[・or(条件集約数) ]
前プロセスの終了後に後プロセスが
プロセスを表す 開始できること表す
・attributes(属性)
preemptable(中断可否),
successive(引継ぎ可否)
Uses Edge
workload(作業負荷) Processが使用する
uses uses uses uses uses uses Assign Region を表す
Assign Region Assigns from Edge
同一Resourceを割付け続ける Assign Regionに
assigns from assigns from 指定Resourceの子Resource集合の
範囲を表す
assigns assigns 中から割付けることを示す
企業01 [process]
has has [startDate(開始日時)]
[endDate(終了日時)] Assigns Edge
製品01 組織A StartDateからEndDateまでの間
Resource has Assign RegionにResourceを
割付対象要素を表す has has has has has has 割付けることを表す
・capacity(容量)
・calender(カレンダー)
AAA01 AAB02 … 山田さん 田中さん 鈴木さん ・attributes(属性) Has Edge
東さん Resourceの所有関係を表す
14
16. 数理解析手法の実ビジネスへの適用:活動例
ビジネスとともに
学術分野でも貢献
変動性から生じる動的な課題
・リソースの競合 ・滞留 ・納期遅延 …
一品一様な業務プロセスを含む
統計解析・制御数理モデル
・統計的な有効変数算出
・統計数理モデル化
-優先順位制御
-実行タイミング制御
-統計フィードバック
-適正リソース量算出
・予測数理体系
論文(体系の一部)
M.Nakao, N. Kobayashi, K.Hamada, T.Totsuka, S.Yamada,
“Decoupling Executions in Navigating Manufacturing Processes for Shortening Lead Time and Its Implementation
to an Unmanned Machine Shop”,
CIRP Annals - Manufacturing Technology Volume 56, Issue 1, Pages 171-174 (2007) 16
17. 思い
より広く蓄積されたデータを有効活用し
世界の未来をよりよいものにしていきたい
データマイニング+WEB勉強会@東京
Google Group: http://groups.google.com/group/webmining-tokyo 17
18. 現在の活動領域
ソーシャルメディアのデータマイニング活用
2900万人以上の人々へ
各人のつながり・楽しみ・好み 個性にあった適切なサービス配信
日々20億以上の活動の活用
Social Media
Social Graph
Fun Like Personality
Objective Process
Data Mining
Machine Learning
各人のつながり、楽しみ、好み、個性にあった
より適切なサービス提供
18
19. よりよい世界の実現
ソーシャル・活動情報の活用により
より適切な情報・サービス配信される世界を実現したい
Social Media
Social Graph
Fun Like Personality
Objective Process
Data Mining
Machine Learning
各人のつながり、楽しみ、好み、個性にあった
より適切なサービス提供
19
20. よりよい世界の実現
ソーシャル・活動情報の活用により
より適切な情報・サービス配信される世界を実現したい
世界中の人々が
個々人のつながり・楽しみ・好みにあった適切な情報・サービスを
自ら探さなくても得ることができる世界
Social Media
Social Graph
Fun Like Personality
Objective Process
Data Mining
Machine Learning
各人のつながり、楽しみ、好み、個性にあった
より適切なサービス提供
20
24. ソーシャルゲーム業界の世界リーダー比較
独自の位置づけと高い収益性
DeNA Co.,ltd. ALL rights reserved ※出展:株式会社ディー・エヌ・エー:平成23年3月期 第2四半期決算説明会資料 24
25. バーチャルソーシャルグラフ
興味を軸としたソーシャルグラフ
DeNA Co.,ltd. ALL rights reserved ※出展:株式会社ディー・エヌ・エー:平成23年3月期 第2四半期決算説明会資料 25
26. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
27. データマイニング活用によるサービス洗練
データマイニング・機械学習の活用により
迅速なサービス洗練を実現しています
Data-mining
Machine-Leaning Data Mining Infrastructure
Results
KPI Inspection
DeNA Data Mining Libraries
KPI Views
Data Mining/Machine Learning
R
Mahout MapReduce
…
Morphological Analysis Perl
DeNA Social MA Pig Java Business
Pre-processing/Indexing
Planning
Lucene Hive HUE
Service Log API
Service Log API Hadoop DFS
Log API
Service
Unified Description of
… …
Action/Status Log
DeNA Co.,ltd. ALL rights reserved 27
28. データマイニング活用によるサービス洗練
Data Mining Infrastructure
DeNA Co.,ltd. ALL rights reserved 28
29. データマイニング活用によるサービス洗練
KPI(Key Performance Indicator)定常算出・共有
ビジネス・サービス変化を検知
Data Mining Infrastructure
KPI Inspection
KPI Views
DeNA Co.,ltd. ALL rights reserved 29
30. データマイニング活用によるサービス洗練
経営判断・サービス洗練を行うための
データマイニング実行
Data Mining Infrastructure
KPI Inspection
KPI Views
Business
Planning
DeNA Co.,ltd. ALL rights reserved 30
31. データマイニング活用によるサービス洗練
データマイニング・機械学習 結果のサービス活用
より楽しんでもらえるサービスへ
Data-mining
Machine-Leaning Data Mining Infrastructure
Results
KPI Inspection
KPI Views
…
Business
Planning
Service Log API
Service Log API
Log API
Service
… …
DeNA Co.,ltd. ALL rights reserved 31
32. 大規模データマイニング基盤
データマイニング・機械学習の活用により
迅速なサービス洗練を実現しています
Data-mining
Machine-Leaning Data Mining Infrastructure
Results
KPI Inspection
DeNA Data Mining Libraries
KPI Views
Data Mining/Machine Learning
R
Mahout MapReduce
…
Morphological Analysis Perl
DeNA Social MA Pig Java Business
Pre-processing/Indexing
Planning
Lucene Hive HUE
Service Log API
Service Log API Hadoop DFS
Log API
Service
Unified Description of
… …
Action/Status Log
DeNA Co.,ltd. ALL rights reserved 32
33. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
34. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
36. 1日20億超の行動情報
統計的有意な結果を
多くのユーザー体験へ還元
2900万人以上
1日20億超アクション
DeNA Co.,ltd. ALL rights reserved 36
37. 1日20億超の行動情報
統計的有意な結果を
多くのユーザー体験へ還元
統計的有意
データマイニング・機械学習の
結果の統計的有意性
2900万人以上
1日20億超アクション
DeNA Co.,ltd. ALL rights reserved 37
38. 1日20億超の行動情報
統計的有意な結果を
多くのユーザー体験へ還元
統計的有意 多くの人へ還元
データマイニング・機械学習の 多くのユーザー体験へ
結果の統計的有意性 還元できる
2900万人以上
1日20億超アクション
DeNA Co.,ltd. ALL rights reserved 38
39. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
40. 詳細行動情報
目的・感情が分かる詳細行動情報
DeNA Co.,ltd. ALL rights reserved 40
41. 詳細行動情報
目的・感情が分かる詳細行動情報
ミッション ボス挑戦
勝つ 負ける
DeNA Co.,ltd. ALL rights reserved 41
42. 詳細行動情報
目的・感情が分かる詳細行動情報
ステータスアップ
ミッション ボス挑戦
勝つ 負ける
DeNA Co.,ltd. ALL rights reserved 42
43. 詳細行動情報
目的・感情が分かる詳細行動情報
ステータスアップ
ミッション ボス挑戦 応援 プレゼント
勝つ 負ける 仲間申請 ウィンク
交換
DeNA Co.,ltd. ALL rights reserved 43
44. 詳細行動情報
目的・感情が分かる詳細行動情報
ステータスアップ 助け合う
ミッション ボス挑戦 応援 プレゼント
勝つ 負ける 仲間申請 ウィンク
交換
DeNA Co.,ltd. ALL rights reserved 44
45. 詳細行動情報
目的・感情が分かる詳細行動情報
ステータスアップ 助け合う
ミッション ボス挑戦 応援 プレゼント バトル 奪う
勝つ 負ける 仲間申請 ウィンク 奪われる
交換
DeNA Co.,ltd. ALL rights reserved 45
46. 詳細行動情報
目的・感情が分かる詳細行動情報
ステータスアップ 助け合う スリル
ミッション ボス挑戦 応援 プレゼント バトル 奪う
勝つ 負ける 仲間申請 ウィンク 奪われる
交換
DeNA Co.,ltd. ALL rights reserved 46
47. 詳細行動情報
目的・感情が分かる詳細行動情報
ステータスアップ 助け合う スリル
ミッション ボス挑戦 応援 プレゼント バトル 奪う
勝つ 負ける 仲間申請 ウィンク 奪われる
交換
育成
耕す 種まき
水やり 収穫
捕獲
DeNA Co.,ltd. ALL rights reserved 47
50. 楽しさのマイニング
楽しさのマイニング
ユーザー体験へ還元
Social Media
Experience
DeNA Co.,ltd. ALL rights reserved 50
51. 楽しさのマイニング
楽しさのマイニング
ユーザー体験へ還元
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 51
52. 楽しさのマイニング
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 52
53. 楽しさのマイニング
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 53
54. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
55. 楽しさのマイニング
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 55
56. 活動例(抜粋)
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 56
59. 活動例(抜粋): Recommendation
Recommendation Strategy
推薦戦略
Standard Recommendation Methodologies
Memory Based Paradigm Model Based Paradigm
(most user decision focused) (most detailed experiments and rationale)
> 協調フィルタリング (users that play A play B) > パターンの学習と予測
> ソーシャルグラフ (user neighborhood) > latent semantic analysis (game text similarity)
> 強化学習 (user feedback) > artificial neural network
> locality sensitive hashing (user profile similarity)
Emergent Intelligence Paradigm Hybridized Intelligence Paradigm
(fastest adaptation) (most successful globally)
> エージェントランダムウォーク(user similarity search) > 手法の組合せによる向上
> 遺伝的アルゴリズム (game preference convergence) >> 友人がいないとき (e.g. new user)
>> 利用データが存在しないとき (e.g. new game)
>> モデルからメタデータが取得できないとき
> 混合手法によるこれらの課題解決
DeNA Co.,ltd. ALL rights reserved
60. 活動例(抜粋): Recommendation
Recommendation Strategy
推薦戦略
Standard Recommendation Methodologies
Memory Based Paradigm Model Based Paradigm
(most user decision focused) (most detailed experiments and rationale)
> 協調フィルタリング (users that play A play B) > パターンの学習と予測
> ソーシャルグラフ (user neighborhood) > latent semantic analysis (game text similarity)
> 強化学習 (user feedback) > artificial neural network
> locality sensitive hashing (user profile similarity)
Emergent Intelligence Paradigm Hybridized Intelligence Paradigm
(fastest adaptation) (most successful globally)
> エージェントランダムウォーク(user similarity search) > 手法の組合せによる向上
> 遺伝的アルゴリズム (game preference convergence) >> 友人がいないとき (e.g. new user)
>> 利用データが存在しないとき (e.g. new game)
>> モデルからメタデータが取得できないとき
> 混合手法によるこれらの課題解決
DeNA Co.,ltd. ALL rights reserved
61. 活動例(抜粋): Recommendation
Social Collaborative Filtering
ソーシャルグラフを用いたユーザー行動履歴・グラフによる推薦
Social Graph
Input User History
and Social Graph Collaborative Filtering (Global)
RECS
(Global Matrix Model for “A likes B”)
New user with no history
Friend Input User History and
Collaborative Filtering (Personal)
RECS
Neighborhood
user (Neighborhood Matrix Model for “A likes B”)
Neighborhood
User with history
Item-Item Matrix of Relationships (Invented by Amazon.com)
Friend of Friend
Wikipedia Image of a Social Network Relationship between Game A2 and C2
There are thousands of collaborative filtering varieties:
+ user friend neighborhood… Users who “bought A bought C”, “viewed A viewed C”…
+ user similarity clustered neighborhood…
References (International Research Copyrights)
DeNA Co.,ltd. ALL rights reserved
62. 活動例(抜粋): Recommendation
Recommendation Strategy
推薦戦略
Standard Recommendation Methodologies
Memory Based Paradigm Model Based Paradigm
(most user decision focused) (most detailed experiments and rationale)
> 協調フィルタリング (users that play A play B) > パターンの学習と予測
> ソーシャルグラフ (user neighborhood) > latent semantic analysis (game text similarity)
> 強化学習 (user feedback) > artificial neural network
> locality sensitive hashing (user profile similarity)
Emergent Intelligence Paradigm Hybridized Intelligence Paradigm
(fastest adaptation) (most successful globally)
> エージェントランダムウォーク(user similarity search) > 手法の組合せによる向上
> 遺伝的アルゴリズム (game preference convergence) >> 友人がいないとき (e.g. new user)
>> 利用データが存在しないとき (e.g. new game)
>> モデルからメタデータが取得できないとき
> 混合手法によるこれらの課題解決
DeNA Co.,ltd. ALL rights reserved
63. 活動例(抜粋): Recommendation
Content Similarity
コンテンツ類似度の利用
1
Latent Semantic Analysis via
Singular Value Decomposition
2
Cosine Similarity Equation
3 Similarity Game A2 and C2
4 5 6
Game A to B Cosine Similarity Matrix Smoothing Normalization
Statistical Z-Score removes Low
Game A to B Relationship Matrix
Confidence Scores
DeNA Co.,ltd. ALL rights reserved
64. 活動例(抜粋): Recommendation
Social Neural Networks
ソーシャルグラフを用いたユーザー行動履歴・グラフによる推薦
Social Graph 1 G1 G1 0
1 G2 G2 0
0 G3 G3 0
0 G4 G4 1
0 G5 G5 0
Friend
0 G6 G6 0
user
0 G7 G7
Input User History 0
Neighborhood and Neighborhood
0 G8 G8 0
0 G9 G9 0
HISTORY RECOMMENDATIONS
Friend of Friend
Wikipedia Image of a Social Network
DeNA Co.,ltd. ALL rights reserved
65. 活動例(抜粋): Recommendation
Recommendation Strategy
推薦戦略
Standard Recommendation Methodologies
Memory Based Paradigm Model Based Paradigm
(most user decision focused) (most detailed experiments and rationale)
> 協調フィルタリング (users that play A play B) > パターンの学習と予測
> ソーシャルグラフ (user neighborhood) > latent semantic analysis (game text similarity)
> 強化学習 (user feedback) > artificial neural network
> locality sensitive hashing (user profile similarity)
Emergent Intelligence Paradigm Hybridized Intelligence Paradigm
(fastest adaptation) (most successful globally)
> エージェントランダムウォーク(user similarity search) > 手法の組合せによる向上
> 遺伝的アルゴリズム (game preference convergence) >> 友人がいないとき (e.g. new user)
>> 利用データが存在しないとき (e.g. new game)
>> モデルからメタデータが取得できないとき
> 混合手法によるこれらの課題解決
DeNA Co.,ltd. ALL rights reserved
66. 活動例(抜粋): Recommendation
Social Agent Emergence
エージェントによる隠されたグループ抽出
Sub-culture 1
Sub-culture 2
AGENT Random Walk
Genetic Algorithm
DeNA Co.,ltd. ALL rights reserved
67. 活動例(抜粋): Recommendation
Recommendation Strategy
推薦戦略
Standard Recommendation Methodologies
Memory Based Paradigm Model Based Paradigm
(most user decision focused) (most detailed experiments and rationale)
> 協調フィルタリング (users that play A play B) > パターンの学習と予測
> ソーシャルグラフ (user neighborhood) > latent semantic analysis (game text similarity)
> 強化学習 (user feedback) > artificial neural network
> locality sensitive hashing (user profile similarity)
Emergent Intelligence Paradigm Hybridized Intelligence Paradigm
(fastest adaptation) (most successful globally)
> エージェントランダムウォーク(user similarity search) > 手法の組合せによる向上
> 遺伝的アルゴリズム (game preference convergence) >> 友人がいないとき (e.g. new user)
>> 利用データが存在しないとき (e.g. new game)
>> モデルからメタデータが取得できないとき
> 混合手法によるこれらの課題解決
DeNA Co.,ltd. ALL rights reserved
68. 活動例(抜粋): Recommendation
Hybrid Models
Hybrid Model
Users that Like A Like B
Prediction
CF
AGENT SIM
NN
RL
DeNA Co.,ltd. ALL rights reserved
69. 活動例(抜粋): Recommendation
Recommendation
より楽しんでもらえるサービス推薦
Standard Recommendation Methodologies
Memory Based Paradigm Model Based Paradigm
(most user decision focused) (most detailed experiments and rationale)
> 協調フィルタリング (users that play A play B) > パターンの学習と予測
> ソーシャルグラフ (user neighborhood) > latent semantic analysis (game text similarity)
> 強化学習 (user feedback) > artificial neural network
> locality sensitive hashing (user profile similarity)
Emergent Intelligence Paradigm Hybridized Intelligence Paradigm
(fastest adaptation) (most successful globally)
> エージェントランダムウォーク(user similarity search) > 手法の組合せによる向上
> 遺伝的アルゴリズム (game preference convergence) >> 友人がいないとき (e.g. new user)
>> 利用データが存在しないとき (e.g. new game)
>> モデルからメタデータが取得できないとき
> 混合手法によるこれらの課題解決
DeNA Co.,ltd. ALL rights reserved
70. 活動例(抜粋)
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 70
72. 活動例(抜粋): Pattern/Clustering/Classification
Feature Analysis
楽しさの行動パターン、やめてしまう状況パターン
Pattern Mining
F1 E1
F2
E1
F3
F4
F5
Clustering Feature Analysis
Activity N, …
Classification
Activity 1 Regression
DeNA Co.,ltd. ALL rights reserved
73. 活動例(抜粋)
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
■楽しさの行動パターン
■やめてしまう状況パターン
DeNA Co.,ltd. ALL rights reserved 73
74. 活動例(抜粋)
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
■楽しさの行動パターン
・夢中になるきっかけ
⇒夢中になる体験をしてもらう
■やめてしまう状況パターン
DeNA Co.,ltd. ALL rights reserved 74
75. 活動例(抜粋)
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
■楽しさの行動パターン
・夢中になるきっかけ
⇒夢中になる体験をしてもらう
・楽しんでサービス継続している行動特徴
⇒楽しさのパターンを高頻度発生。より楽しいサービス体験。
⇒楽しさのパターンをサービス初期で体験。楽しさを理解。
■やめてしまう状況パターン
DeNA Co.,ltd. ALL rights reserved 75
76. 活動例(抜粋)
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
■楽しさの行動パターン
・夢中になるきっかけ
⇒夢中になる体験をしてもらう
・楽しんでサービス継続している行動特徴
⇒楽しさのパターンを高頻度発生。より楽しいサービス体験。
⇒楽しさのパターンをサービス初期で体験。楽しさを理解。
■やめてしまう状況パターン
・飽きはじめるきっかけ・不快な状況
⇒やめるきっかけを発生させないようにする。
DeNA Co.,ltd. ALL rights reserved 76
77. 活動例(抜粋)
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
■楽しさの行動パターン
・夢中になるきっかけ
⇒夢中になる体験をしてもらう
・楽しんでサービス継続している行動特徴
⇒楽しさのパターンを高頻度発生。より楽しいサービス体験。
⇒楽しさのパターンをサービス初期で体験。楽しさを理解。
■やめてしまう状況パターン
・飽きはじめるきっかけ・不快な状況
⇒やめるきっかけを発生させないようにする。
・飽きはじめたユーザーの予測・判別
⇒新鮮・斬新な体験を提供する
⇒他の楽しみ方の提供(他サービスへの推薦 等)
DeNA Co.,ltd. ALL rights reserved 77
78. 活動例(抜粋)
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
■楽しさの行動パターン
・夢中になるきっかけ
⇒夢中になる体験をしてもらう
・楽しんでサービス継続している行動特徴
⇒楽しさのパターンを高頻度発生。より楽しいサービス体験。
⇒楽しさのパターンをサービス初期で体験。楽しさを理解。
■やめてしまう状況パターン
・飽きはじめるきっかけ・不快な状況
⇒やめるきっかけを発生させないようにする。
・飽きはじめたユーザーの予測・判別
⇒新鮮・斬新な体験を提供する
⇒他の楽しみ方の提供(他サービスへの推薦 等)
DeNA Co.,ltd. ALL rights reserved 78
80. 活動例(抜粋): Pattern/Clustering/Classification
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
例) Pattern Mining
F1 E1 やめてしまう
F2
E1 夢中になり始める
F3
F4
F5
DeNA Co.,ltd. ALL rights reserved
81. 活動例(抜粋): Pattern/Clustering/Classification
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
例) Pattern Mining
F1 E1 やめてしまう
F2
E1 夢中になり始める
F3
F4
F5
Clustering
Activity N, …
離脱
継続
Activity 1
DeNA Co.,ltd. ALL rights reserved
82. 活動例(抜粋): Pattern/Clustering/Classification
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
例) Pattern Mining
F1 E1 やめてしまう
F2
E1 夢中になり始める
F3
F4
F5
Clustering Feature Analysis
Activity N, …
離脱
継続
Classification
Activity 1 Regression
DeNA Co.,ltd. ALL rights reserved
83. 活動例(抜粋): Pattern/Clustering/Classification
Feature Analysis/Prediction
楽しさの行動パターン、やめてしまう状況パターン
例) Pattern Mining
F1 E1 やめてしまう
F2
E1 夢中になり始める
F3
F4
F5
Clustering Feature Analysis
Activity N, …
離脱
User Experience
Improvement
継続
Classification
Activity 1 Regression
DeNA Co.,ltd. ALL rights reserved
84. 活動例(抜粋)
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 84
85. 活動例(抜粋): Time Series Analysis
Anomaly detection
複数時系列から異常な振る舞いを検知する
C
A
時系列のモデリング 複数時系列の異常検知 B
時系列A 時系列A
異常な振る舞い
時系列B
時系列C 時系列B 時系列C
異常な振る舞いの時系列を検出
例1:トラフィック異常検知 例2:CM効果のノイズ除去
トラフィックA ケースA
CM効果
トラフィックB ケースB
トラフィックC 調査 ケースC
異常な振る舞いをしている 異常な振る舞いをしているケースを
トラフィックの原因を調査する 除外して、CMの効果を算出する
85
86. 活動例(抜粋): Time Series Analysis
Anomaly detection
新しいデータと過去時系列モデルの乖離から異常検出
異常スコア推移
モデル構築
異常値
◇例 : ARIMAモデル
異常スコアの算出
◇例 : 対数損失
t
86
87. 活動例(抜粋): Time Series Analysis
TV Commercial Effects
時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出
イベン
CM時系列 ト
新規
登録
CM ARPP
U
ARPU
各KPIの時系列
その
他
継続
外部
率
要因
ケー
ス
87
88. 活動例(抜粋)
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
88
90. 楽しさのマイニング
楽しさのマイニング
ユーザー体験へ還元
Data Mining
Machine Learning
of Fun
PatternMining Clustering
Classification Regression Recommendation
TimeSeriesAnalysis StatisticalAnalysis
NaturalLanguageProcessing ..etc
Social Media
Experience
Social Graph
Detailed Actions
Changes of Status
Social Communications
Personality ..etc
DeNA Co.,ltd. ALL rights reserved 90
91. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
92. Case Study : Social Game 洗練
Case Study : Social Game 洗練
Social Game 洗練
Case: 離脱率抑制
DeNA Co.,ltd. ALL rights reserved 92
93. Case Study : Social Game 洗練
Case Study : Social Game 洗練
Social Game 洗練
Case: 離脱率抑制
DeNA Co.,ltd. ALL rights reserved 93
94. Case Study : Social Game 洗練
分析に基づいたパラメータチューニングやゲーム内ロジック変更を行い
ユーザー体験を向上する
データ(ログ)整備
大規模データ 各サービスの
データ抽出・集計 分析~施策実行
処理基盤整備 企画・開発・運用
共通モジュール開発
データマイニング データマイニング分析系 企画・開発・運用担当
基盤系エンジニア エンジニア/アナリスト (EC・ソーシャルゲーム等)
DeNA Co.,ltd. ALL rights reserved 94
95. Case Study : Social Game 洗練
ユーザー体験を向上させるには
問題発見・解釈・提案の3つが一貫して行えることが必要
データマイニング分析系
エンジニア/アナリスト
問題発見 解釈 提案
空は青い 雨は降らない 傘はおいていく
現状分析 問題の明示化 方向性の決定
大きなトレンド 戦略的解釈 具体的な解決案
こうなっている! だとすればこうだ! だからこうすべき!
DeNA Co.,ltd. ALL rights reserved 95
96. Case Study : Social Game 洗練
ゲーム内パラメータの設計(ex.確率系パラメータの
パラメータ設計 設定、ユーザーの組み合わせロジック作成)
ユーザーのプレイ・課金状況が当初の想定と異
ゲーム/イベントの なった場合、途中で悪化した場合などに、ゲーム
振り返り・改善策検討 ログを分析して、その原因を掘り下げて究明し対
応策を考える
タイトル別
ゲームデザインに 企画的視点から、ゲームデザイン/イベント企画
対するインプット に対して、改善提案を行う
ゲーム/イベントにおける盛り上がり状況(プレイ・課
金)やその変化がわかるようなKPIを設計し、かつそれ
KPIの設計・見える化 らを定常的に追うことができるようなレポートを作成・
共有する
上記タイトルごとの業務で得られた知見で、他タイトル
ナレッジの整理/シェア にも展開できるようなナレッジについて、資料化/共
有を進める
タイトル横断
ゲーム横断で使えるような施策を検討し、またそ
共通的施策の実行支援 の実現のための仕組みを提供する
DeNA Co.,ltd. ALL rights reserved 96
97. Case Study : Social Game 洗練
ゲーム内パラメータの設計(ex.確率系パラメータの
パラメータ設計 設定、ユーザーの組み合わせロジック作成)
ユーザーのプレイ・課金状況が当初の想定と異
ゲーム/イベントの なった場合、途中で悪化した場合などに、ゲーム
振り返り・改善策検討 ログを分析して、その原因を掘り下げて究明し対
応策を考える
タイトル別
ゲームデザインに 企画的視点から、ゲームデザイン/イベント企画
対するインプット に対して、改善提案を行う
ゲーム/イベントにおける盛り上がり状況(プレイ・課
金)やその変化がわかるようなKPIを設計し、かつそれ
KPIの設計・見える化 らを定常的に追うことができるようなレポートを作成・
共有する
上記タイトルごとの業務で得られた知見で、他タイトル
ナレッジの整理/シェア にも展開できるようなナレッジについて、資料化/共
有を進める
タイトル横断
ゲーム横断で使えるような施策を検討し、またそ
共通的施策の実行支援 の実現のための仕組みを提供する
DeNA Co.,ltd. ALL rights reserved 97
98. Case Study : Social Game 洗練
Case Study : Social Game 洗練
Social Game 洗練
Case: 離脱率抑制
DeNA Co.,ltd. ALL rights reserved 98
99. Case: 離脱率抑制
怪盗ロワイヤルを題材にした
シンプルなケーススタディを みなで考えてみましょう
ミッションをこなし、悪者をやっつける!
DeNA Co.,ltd. ALL rights reserved 99
100. Case Study : Social Game 洗練
注
本Caseで使用するデータは
Case Study用に作成したデータです
サービスのデータではありません
DeNA Co.,ltd. ALL rights reserved 100
109. Case Study : Social Game 洗練
Case Study : Social Game 洗練
Social Game 洗練
Case: 離脱率抑制
DeNA Co.,ltd. ALL rights reserved 109
110. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
111. 迅速なサービス洗練
解析結果を反映した
数時間~数日スパンで迅速なサービス洗練
DeNA Co.,ltd. ALL rights reserved 111
112. 迅速なサービス洗練
解析結果を反映した
数時間~数日スパンで迅速なサービス洗練
より楽しんでもらえるユーザー体験へ
DeNA Co.,ltd. ALL rights reserved 112
113. AGENDA
◆講師紹介
◆ソーシャルプラットフォーム:Mobage
◆データマイニング活用によるサービス洗練
◆楽しさのマイニング
◆1日20億超の行動情報
◆楽しさのデータマイニング
◆活動例
◆ケーススタディ: Social Game洗練
◆迅速なサービス洗練
◆大規模データマイニング基盤構成
◆世界へ
DeNA Co.,ltd. ALL rights reserved
114. Hadoopを用いた
大規模データマイニング基盤
DeNA Co.,ltd. ALL rights reserved 114
115. Hadoop
Hadoopとは
大規模分散処理を行うための基盤
・Apache プロジェクト
・Java オープンソース
・Googleが2004年に発表した論文を実装
・主要コンポーネント
・分散ファイルシステム: HDFS (Hadoop Distributed File System)
・分散処理フレームワーク: Mapreduce
DeNA Co.,ltd. ALL rights reserved 115
116. Hadoopの主な利用企業
広告・ECサイト・検索・SNS等
大規模データを有するサービスで利用されている
DeNA Co.,ltd. ALL rights reserved 116
117. 分散ファイルシステム:HDFS
HDFS (Hadoop Distributed File System)
DataNodeを増やすことで大容量化が可能
• NameNode
– Meta情報を持つ、ファイル名、レプリケーション数、ファイルの保存場所など
• DataNode
– 実際のデータを格納するNode。ブロックサイズごとにファイルを分割して1
つのファイルを複数のNodeで保存
クライアントからは
巨大な一つのストレージに DataNode
アクセスしているように見える NameNode
HDFS
クライアント
DeNA Co.,ltd. ALL rights reserved 117
121. 大規模データマイニング基盤
データマイニング・機械学習の活用により
迅速なサービス洗練を実現しています
DeNA Co.,ltd. ALL rights reserved 121
122. 大規模データマイニング基盤
データマイニング・機械学習の活用により
迅速なサービス洗練を実現しています
Data-mining
Machine-Leaning Data Mining Infrastructure
Results
KPI Inspection
DeNA Data Mining Libraries
KPI Views
Data Mining/Machine Learning
R
Mahout MapReduce
…
Morphological Analysis Perl
DeNA Social MA Pig Java Business
Pre-processing/Indexing
Planning
Lucene Hive HUE
Service Log API
Service Log API Hadoop DFS
Log API
Service
Unified Description of
… …
Action/Status Log
DeNA Co.,ltd. ALL rights reserved 122
123. 大規模データマイニング基盤
Data Mining Infrastructure
DeNA Co.,ltd. ALL rights reserved 123
124. 大規模データマイニング基盤
KPI(Key Performance Indicator)定常算出・共有
ビジネス・サービス変化を検知
Data Mining Infrastructure
KPI Inspection
KPI Views
DeNA Co.,ltd. ALL rights reserved 124
125. 大規模データマイニング基盤
経営判断・サービス洗練を行うための
データマイニング実行
Data Mining Infrastructure
KPI Inspection
KPI Views
Business
Planning
DeNA Co.,ltd. ALL rights reserved 125