SlideShare a Scribd company logo
SmartNews のデータサイエンティストの
高速イテレーションを支える広告システム
SmartNews, Inc.
KOMIYA Atsushi
Yuyang Lan
Agenda
1.Introduction
2.SmartNews Ads and AWS
3.Data science with AWS
4.How we build our ad system with AWS
5.Current working
Agenda
1.Introduction
2.SmartNews Ads and AWS
3.Data science with AWS
4.How we build our ad system with AWS
5.Current working
SmartNews Ads System - AWS Summit Tokyo 2015
月間アクティブユーザ数 No.1
5
月間のアクティブユーザー数が417万超*で国内No.1
100%
75%
50%
25%
0%
MAU
417万人
A CB
ニュースアプリとの比較
*Nielsen Mobile NetView 2015年3月
月間総訪問時間 No.1
6
総利用時間
(千時間)
1位
13,350
A CB
2位
3,067
4位
4,116
3位
4,343
1,335万時間
SPENDS
*Nielsen Mobile NetView 2015年3月
7:00 12:00 19:00
アクセスのピークは1日3回
ニュースアプリとの比較*
0:00 24:00
米国ニュースアプリで No.1
7
2014年10月1日リリース
米国AppStore/Google Playの2大
ストアにてニュースアプリでNo.1*
を記録
全世界で累計1200万DLを突破!**
*App Storeより2014年10月6日現在。
Google Playより2014年11月14日現在。
SmartNews2.0は2014年10月1日リリース。
**2015年5月18日リリースより。
No.1
NewsRank
アルゴリズムによる記事表示
8
アルゴリズムによる記事表示
9
We’re Machine Learning Company
Agenda
1.Introduction
2.SmartNews Ads and AWS
3.Data science with AWS
4.How we build our ad system with AWS
5.Current working
SmartNews Ads
11
Standard Ads Premium Movie Ads
• 大量の広告リクエストをごく短時間で処理する Ad server
• 広告のクリエイティブ画像を効率よく配信する仕組み
• ログデータを分析して、ユーザと広告をマッチさせる

配信ロジック
• 広告主別・メディア別のパフォーマンスを計測・表示する

レポート機能
• 広告入稿と審査をするための管理コンソール、などなど
広告システムに求められるもの
12
その広告システムを支えるインフラ
13
We built it on
Amazon Web Services
なぜ AWS を利用するのか:詳しくは…
14
http://www.slideshare.net/smartnews/20150415-smartnews-technightrev3
• インフラ専任のエンジニアはいない
• ≠ インフラに詳しいエンジニアがいない
• 少数精鋭の組織
• 本当に大事なところに注力したい
• 外部サービス・リソースを有効活用
なぜ AWS を利用するのか
15
System overview
16
Agenda
1.Introduction
2.SmartNews Ads and AWS
3.Data science with AWS
4.How we build our ad system with AWS
5.Current working
• 広告システムにおいても、様々な機械学習・最適化タスクが存在する
• CTR / CVR prediction
• Creative optimization
• CPA optimization
• Budget smoothing
• Ad allocation optimization
• User profiling, etc.
• データサイエンスによる Iterative な改善が求められる
広告システムとデータサイエンス
18
• 広告システムにおいても、様々な機械学習・最適化タスクが存在する
• CTR / CVR prediction
• Creative optimization
• CPA optimization
• Budget smoothing
• Ad allocation optimization
• User profiling, etc.
• Iterative なデータサイエンスによる改善が求められる
広告システムとデータサイエンス
19
A/B testing
A/B テストをする理由:詳しくは…
20
http://developer.smartnews.com/blog/
数字でみる広告システムのデータサイエンス
21
4+ running tests / day
10+ times testing / month
1. 仮説を立てる
• ログデータの分析
2. 準備・開発する
• 実験計画・ロジック実装
3. A/B テストを実施する
4. 結果を集計・統計的に解釈する
• レポーティング・仮説検定
5. 意思決定をする
A/B テストのサイクル
22
1. 仮説を立てる
• ログデータの分析
2. 準備・開発する
• 実験計画・ロジック実装
3. A/B テストを実施する
4. 結果を集計・統計的に解釈する
• レポーティング・仮説検定
5. 意思決定をする
A/B テストのサイクル
23
長期間のログデータをいろんな軸で
さくさく集計したい
• やりたいこと
• 過去のログを長期間 って、いろいろな集計・分析
をしたい
• 課題
• ログは日毎に増大していく(それなりの規模)
• 途中でログの項目が増えることもある
• 投げるクエリは目的によって大きく異なる
ケース1:ログデータの分析
24
• S3 + EMR (+ Presto) で解決!
• ログデータの蓄積に S3 を利用する
• Presto on EMR で S3 上のログデータに対してクエリ
を投げる
• ログ項目の追加にも、スキーマ変更は比較的柔軟
ケース1:ログデータの分析
25
1. 仮説を立てる
• ログデータの分析
2. 準備・開発する
• 実験計画・ロジック実装
3. A/B テストを実施する
4. 結果を集計・統計的に解釈する
• レポーティング・仮説検定
5. 意思決定をする
A/B テストのサイクル
26
新しい配信ロジックを production で
試してみたい
• やりたいこと
• 広告配信の新しいロジック(予測モデル)を production で試してみたい
• 課題
• 複雑な配信ロジックほど時間計算量は大きくなる傾向にある
• 大量のリクエストをごく短時間でさばかなければならない Ad server には

重いタスク
• パフォーマンス改善には相当の時間がかかり、実装も総じて難しい
• 精度が向上するか断言できない機能の準備に、時間をかけ過ぎたくない
ケース2:配信ロジックの実装
27
• EMR (+ Hivemall) + DynamoDB で解決!
• EMR (と Hivemall) でお手軽に予測モデルを構築
• 広告の配信を制御するデータを予測モデルから事前計算し、

あらかじめ決められたデータ構造で表現& DynamoDB にストア
• Ad server から参照&広告配信を制御する
• DynamoDB のレイテンシは十分に小さい (数ms)
ケース2:配信ロジックの実装
28
• データサイエンティスト的には、
• 時間・空間計算量的に高性能が求められる Ad server の

実装に頭を悩ませる必要がない
• 自身のタスクである分析・予測モデル構築に集中できる
• リアルタイム性が損なわれるため、精度が低下してしまう欠
点がある
• A/B テストによって新しいロジックに優位性があると判断
されれば、Ad server に最適化して組み込まれる
ケース2:配信ロジックの実装
29
1. 仮説を立てる
• ログデータの分析
2. 準備・開発する
• 実験計画・ロジック実装
3. A/B テストを実施する
4. 結果を集計・統計的に解釈する
• レポーティング・仮説検定
5. 意思決定をする
A/B テストのサイクル
30
A/B テストの状況を手軽に確認したい
• やりたいこと
• 実施中の A/B テストの状況を手軽に確認したい
• 課題
• 都度 SQL を用意して集計 → Excel でレポーティング、
というのは手間がかかり過ぎる
• レポート閲覧用の Web アプリケーションを作るのも

開発&メンテナンスコストがかかる
ケース3:A/B テスト結果のレポーティング
31
• Redshift (+ Chartio) で解決!
• A/B テストすべてにおいて、共通の集計軸とメトリクス(複数)を利用する
• 毎時に集計バッチを実行して、ログデータから A/B テストのレポートを
Redshift 上で集計・作成する
• A/B テストの結果を Redshift から取得して表示する Chartio ダッシュボードを用
意する
• 集計軸とメトリクスが同じなので、異なる A/B テストでも同じダッシュボード
を再利用できる
ケース3:A/B テスト結果のレポーティング
32
• SmartNews の広告システムは AWS を活用して作られている
• 本当に大事なところ(事業)に集中するため、

マネージドサービスを積極的に活用する
• データサイエンスの高速な iteration を実現するために、

AWS の各種サービスのよいとこどりをしている
ここまでのまとめ
33
Agenda
1.Introduction
2.SmartNews Ads and AWS
3.Data science with AWS
4.How we build our ad system with AWS
5.Current working
When We Make Tech Choices
• Speed (50ms MAX latency
• Availability
• Scalability
• Operationally “Raku”
• Decouple-able
• People-Friendly (Engineers, Data Scientists, ..
System Overview
Speed Avalaibility Scalability
People
Friendly
Decouple-
able
Operationally
“Raku”
HBase ★ △ ★ ⚪ ⚪ △
Redis ★ △ △ ★ ★ ⚪
Memcached ★ ⚪ △ ⚪ ★ ⚪
Cassandra ★ ★ ★ ★ ★ △
Why DynamoDB
Why DynamoDB
Speed Avalaibility Scalability
People
Friendly
Decouple-
able
Operationally
“Raku”
HBase ★ △ ★ ⚪ ⚪ △
Redis ★ △ △ ★ ★ ⚪
Memcached ★ ⚪ △ ⚪ ★ ⚪
Cassandra ★ ★ ★ ★ ★ △
DynamoDB ★ ★ ★ ★ ★ ★
Why DynamoDB
No Single Engineer Needed To Operate It
Why DynamoDB
OPERATION COST
$0
Audience Data in DynamoDB
device_id media attr_1 attr_2 scores tags … abtest_label abtest_group …
Hash Key
Range
Key
map<campaign,
score> score
set
<tag>
d101 SN B {123=>3.5} … watabe_test control
d102 APP_2 2.5
d102 SN A … … {akb48} … …
d302 SN … …
{car,
hourse}
watabe_test house_targeting
d888 SN
…
… … … …
…
Audience Data in DynamoDB
device_id media attr_1 attr_2 scores tags … abtest_label abtest_group …
Hash Key
Range
Key
map<campaign,
score> score
set
<tag>
d101 SN B {123=>3.5} … watabe_test control
d102 APP_2 2.5
d102 SN A … … {akb48} … …
d302 SN … …
{car,
hourse}
watabe_test house_targeting
d888 SN
…
… … … …
…
Audience Data in DynamoDB
device_id media attr_1 attr_2 scores tags … abtest_label abtest_group …
Hash Key
Range
Key
map<campaign,
score> score
set
<tag>
d101 SN B {123=>3.5} … watabe_test control
d102 APP_2 2.5
d102 SN A … … {akb48} … …
d302 SN … …
{car,
hourse}
watabe_test house_targeting
d888 SN
…
… … … …
…
System Overview
EMR
• Yarn + Hive + Spark + Python* + alpha
• All data managed by Hive, stored in S3
• Store no states inside the cluster
• HDFS is used as a tmp/cache layer (dfs.replication = 1)
• Use it elastically
• Scale-out for large jobs
• Multiple small clusters for difference purposes
Ad Hoc EMR Cluster
When Need Do Experimental・Ad-hoc Data Work
(e.g. New Machine Learning Experiment, ..)
Ad Hoc EMR Cluster
Write directly from Hive to DynamoDB
We’re Contributing
Sometimes you even don’t need to distribute
COST
$1.0
System Overview
Reporting
• Hourly reporting in Redshift
• Query raw log in S3 through Presto
• Query realtime data in Kinesis through Spark Streaming
• Charting using Chartio
We Using Both Redshift and Presto
Redshift Presto
Purpose Business Report General
Data Core Structured Data
Data in S3,
Tables in RDS, etc.
Stable Good
OOM sometimes
Occasionally down is OK
Performance Good
Good but
high variance
User More Business side More Engineering side
Extensible No
Custom Patch ,
Functions, Connectors
We’re Contributing
Agenda
1.Introduction
2.SmartNews Ads and AWS
3.Data science with AWS
4.How we build our ad system with AWS
5.Current working
Current working
Kinesis-enabled System
Online Learning based on Kinesis + Spark
The Last
Our Wish List
• Lambda Available to Tokyo Region
• Better way to control DynamoDB write capacity
• Time-to-live support in DynamoDB
• UDF in Redshift
Thanks!
We’re hiring!
http://about.smartnews.com/ja/careers/
iOSエンジニア / Androidエンジニア
/ Webアプリケーションエンジニア
/ プロダクティビティエンジニア
/ 機械学習 / 自然言語処理エンジニア
/ グロースハックエンジニア
/ サーバサイドエンジニア
/ 広告エンジニア…

More Related Content

What's hot (20)

現場的!オンプレとAWSの違い
現場的!オンプレとAWSの違い現場的!オンプレとAWSの違い
現場的!オンプレとAWSの違い
真吾 吉田
 
Amazon Machine Learning
Amazon Machine LearningAmazon Machine Learning
Amazon Machine Learning
Yuta Imai
 
ビックデータ最適解とAWSにおける新しい武器
ビックデータ最適解とAWSにおける新しい武器ビックデータ最適解とAWSにおける新しい武器
ビックデータ最適解とAWSにおける新しい武器
Akihiro Kuwano
 
Serverless services on_aws_dmm_meetup_20170801
Serverless services on_aws_dmm_meetup_20170801Serverless services on_aws_dmm_meetup_20170801
Serverless services on_aws_dmm_meetup_20170801
Amazon Web Services Japan
 
クラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンクラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
 
AWSでのビッグデータ分析
AWSでのビッグデータ分析AWSでのビッグデータ分析
AWSでのビッグデータ分析
Amazon Web Services Japan
 
Amazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティスAmazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティス
Amazon Web Services Japan
 
Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Kinesis Familyを活用したストリームデータ処理Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Web Services Japan
 
AWS ML Update
AWS ML UpdateAWS ML Update
AWS ML Update
Amazon Web Services Japan
 
AWSデータベースアップデート2017
AWSデータベースアップデート2017AWSデータベースアップデート2017
AWSデータベースアップデート2017
Amazon Web Services Japan
 
Pydata Amazon Kinesisのご紹介
Pydata Amazon Kinesisのご紹介Pydata Amazon Kinesisのご紹介
Pydata Amazon Kinesisのご紹介
Toshiaki Enami
 
Machine Learning forDigital Advertising
Machine Learning forDigital AdvertisingMachine Learning forDigital Advertising
Machine Learning forDigital Advertising
Amazon Web Services Japan
 
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!
Satoru Ishikawa
 
Growing up serverless
Growing up serverlessGrowing up serverless
Growing up serverless
Amazon Web Services Japan
 
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
Eiji Shinohara
 
Awsで作るビッグデータ解析今とこれから
Awsで作るビッグデータ解析今とこれからAwsで作るビッグデータ解析今とこれから
Awsで作るビッグデータ解析今とこれから
Shohei Kobayashi
 
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning  フレームワーク "Apache MXNet” を AWS で学ぶスケーラブルな Deep Leaning  フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
Amazon Web Services Japan
 
Amazon Machine Learning Tutorial
Amazon Machine Learning TutorialAmazon Machine Learning Tutorial
Amazon Machine Learning Tutorial
Yoshimi Tominaga
 
SAP HANA on AWS
SAP HANA on AWSSAP HANA on AWS
SAP HANA on AWS
satoshi
 
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
 
現場的!オンプレとAWSの違い
現場的!オンプレとAWSの違い現場的!オンプレとAWSの違い
現場的!オンプレとAWSの違い
真吾 吉田
 
Amazon Machine Learning
Amazon Machine LearningAmazon Machine Learning
Amazon Machine Learning
Yuta Imai
 
ビックデータ最適解とAWSにおける新しい武器
ビックデータ最適解とAWSにおける新しい武器ビックデータ最適解とAWSにおける新しい武器
ビックデータ最適解とAWSにおける新しい武器
Akihiro Kuwano
 
Serverless services on_aws_dmm_meetup_20170801
Serverless services on_aws_dmm_meetup_20170801Serverless services on_aws_dmm_meetup_20170801
Serverless services on_aws_dmm_meetup_20170801
Amazon Web Services Japan
 
クラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターンクラウド上のデータ活用デザインパターン
クラウド上のデータ活用デザインパターン
Amazon Web Services Japan
 
Amazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティスAmazon S3を中心とするデータ分析のベストプラクティス
Amazon S3を中心とするデータ分析のベストプラクティス
Amazon Web Services Japan
 
Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Kinesis Familyを活用したストリームデータ処理Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Web Services Japan
 
Pydata Amazon Kinesisのご紹介
Pydata Amazon Kinesisのご紹介Pydata Amazon Kinesisのご紹介
Pydata Amazon Kinesisのご紹介
Toshiaki Enami
 
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!
Satoru Ishikawa
 
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
個人的にAmazon EMR5.0.0でSpark 2.0を使ってZeppelinでSQL集計してみる
Eiji Shinohara
 
Awsで作るビッグデータ解析今とこれから
Awsで作るビッグデータ解析今とこれからAwsで作るビッグデータ解析今とこれから
Awsで作るビッグデータ解析今とこれから
Shohei Kobayashi
 
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning  フレームワーク "Apache MXNet” を AWS で学ぶスケーラブルな Deep Leaning  フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
Amazon Web Services Japan
 
Amazon Machine Learning Tutorial
Amazon Machine Learning TutorialAmazon Machine Learning Tutorial
Amazon Machine Learning Tutorial
Yoshimi Tominaga
 
SAP HANA on AWS
SAP HANA on AWSSAP HANA on AWS
SAP HANA on AWS
satoshi
 
データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築データレイクを基盤としたAWS上での機械学習サービス構築
データレイクを基盤としたAWS上での機械学習サービス構築
Amazon Web Services Japan
 

Viewers also liked (20)

BrainWarsを支えるAWSサービスたち
BrainWarsを支えるAWSサービスたちBrainWarsを支えるAWSサービスたち
BrainWarsを支えるAWSサービスたち
Masakazu Matsushita
 
Docomo Cloud Package
Docomo Cloud PackageDocomo Cloud Package
Docomo Cloud Package
Osaka University
 
東急ハンズを支える技術
東急ハンズを支える技術東急ハンズを支える技術
東急ハンズを支える技術
Tomoaki Imai
 
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
Masahiro Akita
 
インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法
インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法
インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法
SmartNews, Inc.
 
Building a Sustainable Data Platform on AWS
Building a Sustainable Data Platform on AWSBuilding a Sustainable Data Platform on AWS
Building a Sustainable Data Platform on AWS
SmartNews, Inc.
 
AWS Mobile SDK利用時のテスト手法
AWS Mobile SDK利用時のテスト手法AWS Mobile SDK利用時のテスト手法
AWS Mobile SDK利用時のテスト手法
yuki0211s
 
Spring で実現する SmartNews のニュース配信基盤
Spring で実現する SmartNews のニュース配信基盤Spring で実現する SmartNews のニュース配信基盤
Spring で実現する SmartNews のニュース配信基盤
SmartNews, Inc.
 
Hypermedia: The Missing Element to Building Adaptable Web APIs in Rails
Hypermedia: The Missing Element to Building Adaptable Web APIs in RailsHypermedia: The Missing Element to Building Adaptable Web APIs in Rails
Hypermedia: The Missing Element to Building Adaptable Web APIs in Rails
Toru Kawamura
 
AWSの進化とSmartNewsの裏側
AWSの進化とSmartNewsの裏側AWSの進化とSmartNewsの裏側
AWSの進化とSmartNewsの裏側
SmartNews, Inc.
 
SmartNews TechNight vol5 SmartNews Ads大図解
SmartNews TechNight vol5 SmartNews Ads大図解SmartNews TechNight vol5 SmartNews Ads大図解
SmartNews TechNight vol5 SmartNews Ads大図解
SmartNews, Inc.
 
SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...
SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...
SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...
SmartNews, Inc.
 
SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...
SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...
SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...
SmartNews, Inc.
 
NLP in SmartNews
NLP in SmartNewsNLP in SmartNews
NLP in SmartNews
SmartNews, Inc.
 
SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.
SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.
SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.
SmartNews, Inc.
 
SmartNews's journey into microservices
SmartNews's journey into microservicesSmartNews's journey into microservices
SmartNews's journey into microservices
SmartNews, Inc.
 
短期間で大規模なシンクラ環境を用意した話
短期間で大規模なシンクラ環境を用意した話短期間で大規模なシンクラ環境を用意した話
短期間で大規模なシンクラ環境を用意した話
淳 千葉
 
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
SmartNews, Inc.
 
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_cccSmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNews, Inc.
 
iOSアプリ開発者から見たMobile Hub
iOSアプリ開発者から見たMobile HubiOSアプリ開発者から見たMobile Hub
iOSアプリ開発者から見たMobile Hub
Jun Kato
 
BrainWarsを支えるAWSサービスたち
BrainWarsを支えるAWSサービスたちBrainWarsを支えるAWSサービスたち
BrainWarsを支えるAWSサービスたち
Masakazu Matsushita
 
東急ハンズを支える技術
東急ハンズを支える技術東急ハンズを支える技術
東急ハンズを支える技術
Tomoaki Imai
 
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
Masahiro Akita
 
インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法
インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法
インフラ専任エンジニアが一人もいないSmartNewsにおけるクラウド活用法
SmartNews, Inc.
 
Building a Sustainable Data Platform on AWS
Building a Sustainable Data Platform on AWSBuilding a Sustainable Data Platform on AWS
Building a Sustainable Data Platform on AWS
SmartNews, Inc.
 
AWS Mobile SDK利用時のテスト手法
AWS Mobile SDK利用時のテスト手法AWS Mobile SDK利用時のテスト手法
AWS Mobile SDK利用時のテスト手法
yuki0211s
 
Spring で実現する SmartNews のニュース配信基盤
Spring で実現する SmartNews のニュース配信基盤Spring で実現する SmartNews のニュース配信基盤
Spring で実現する SmartNews のニュース配信基盤
SmartNews, Inc.
 
Hypermedia: The Missing Element to Building Adaptable Web APIs in Rails
Hypermedia: The Missing Element to Building Adaptable Web APIs in RailsHypermedia: The Missing Element to Building Adaptable Web APIs in Rails
Hypermedia: The Missing Element to Building Adaptable Web APIs in Rails
Toru Kawamura
 
AWSの進化とSmartNewsの裏側
AWSの進化とSmartNewsの裏側AWSの進化とSmartNewsの裏側
AWSの進化とSmartNewsの裏側
SmartNews, Inc.
 
SmartNews TechNight vol5 SmartNews Ads大図解
SmartNews TechNight vol5 SmartNews Ads大図解SmartNews TechNight vol5 SmartNews Ads大図解
SmartNews TechNight vol5 SmartNews Ads大図解
SmartNews, Inc.
 
SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...
SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...
SmartNews TechNight Vol.5 : AD Data Engineering in practice: SmartNews Ads裏のデ...
SmartNews, Inc.
 
SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...
SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...
SmartNews TechNight Vol.5 : SmartNews Ads の配信最適化の仕組みはどうなってるの? (エンジニア / SmartN...
SmartNews, Inc.
 
SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.
SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.
SpringOne Platform 2016 報告会「A Lite Rx API for the JVM」/ 井口 貝 @ SmartNews, Inc.
SmartNews, Inc.
 
SmartNews's journey into microservices
SmartNews's journey into microservicesSmartNews's journey into microservices
SmartNews's journey into microservices
SmartNews, Inc.
 
短期間で大規模なシンクラ環境を用意した話
短期間で大規模なシンクラ環境を用意した話短期間で大規模なシンクラ環境を用意した話
短期間で大規模なシンクラ環境を用意した話
淳 千葉
 
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
Strem処理(Spark Streaming + Kinesis)とOffline処理(Hive)の統合
SmartNews, Inc.
 
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_cccSmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNews, Inc.
 
iOSアプリ開発者から見たMobile Hub
iOSアプリ開発者から見たMobile HubiOSアプリ開発者から見たMobile Hub
iOSアプリ開発者から見たMobile Hub
Jun Kato
 

Similar to SmartNews Ads System - AWS Summit Tokyo 2015 (20)

SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォームSmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
SmartNews, Inc.
 
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Boss4434
 
如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側
如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側
如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側
Keiji Muraishi
 
AWS初心者向けWebinar AWSでBig Data活用
AWS初心者向けWebinar AWSでBig Data活用AWS初心者向けWebinar AWSでBig Data活用
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
 
スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤
Takumi Sakamoto
 
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Game Architecture Trends in Tokyo  Kansai Social Game Study#5Game Architecture Trends in Tokyo  Kansai Social Game Study#5
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Yasuhiro Matsuo
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Atsushi Tsuchiya
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
kurikiyo
 
AWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデート
AWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデートAWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデート
AWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデート
Amazon Web Services Japan
 
20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料
オラクルエンジニア通信
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
 
Qlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリック
Qlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリックQlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリック
Qlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリック
QlikPresalesJapan
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
Google Cloud Platform - Japan
 
Deep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance TuningDeep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance Tuning
Takuya UESHIN
 
データからビジネス変革をもたらすマイクロソフトの AI とは
データからビジネス変革をもたらすマイクロソフトの AI とはデータからビジネス変革をもたらすマイクロソフトの AI とは
データからビジネス変革をもたらすマイクロソフトの AI とは
Miho Yamamoto
 
ビッグデータはバズワードか? (Cloudian Summit 2012)
ビッグデータはバズワードか? (Cloudian Summit 2012)ビッグデータはバズワードか? (Cloudian Summit 2012)
ビッグデータはバズワードか? (Cloudian Summit 2012)
CLOUDIAN KK
 
Digital marketing on AWS
Digital marketing on AWSDigital marketing on AWS
Digital marketing on AWS
Yuta Imai
 
ビッグデータエコシステムとデータサイエンスのススメ
ビッグデータエコシステムとデータサイエンスのススメビッグデータエコシステムとデータサイエンスのススメ
ビッグデータエコシステムとデータサイエンスのススメ
Yuki Asano
 
Smart data integration to hybrid data analysis infrastructure
Smart data integration to hybrid data analysis infrastructureSmart data integration to hybrid data analysis infrastructure
Smart data integration to hybrid data analysis infrastructure
DataWorks Summit
 
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォームSmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
SmartNews, Inc.
 
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Boss4434
 
如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側
如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側
如何に “データが壊れない” 管理画面を作るか - 管理画面開発の裏側
Keiji Muraishi
 
AWS初心者向けWebinar AWSでBig Data活用
AWS初心者向けWebinar AWSでBig Data活用AWS初心者向けWebinar AWSでBig Data活用
AWS初心者向けWebinar AWSでBig Data活用
Amazon Web Services Japan
 
スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤
Takumi Sakamoto
 
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Game Architecture Trends in Tokyo  Kansai Social Game Study#5Game Architecture Trends in Tokyo  Kansai Social Game Study#5
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Yasuhiro Matsuo
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Atsushi Tsuchiya
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
kurikiyo
 
AWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデート
AWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデートAWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデート
AWS Blackbelt 2015シリーズ AWS Summit Tokyo 2015 ふりかえり&最新アップデート
Amazon Web Services Japan
 
20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料20160916 ビッグデータシンポジウム オラクル公開資料
20160916 ビッグデータシンポジウム オラクル公開資料
オラクルエンジニア通信
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
 
Qlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリック
Qlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリックQlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリック
Qlik Talend Cloud概要:リアルタイムデータ統合とデータ品質を実現するデータファブリック
QlikPresalesJapan
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
Google Cloud Platform - Japan
 
Deep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance TuningDeep Dive into Spark SQL with Advanced Performance Tuning
Deep Dive into Spark SQL with Advanced Performance Tuning
Takuya UESHIN
 
データからビジネス変革をもたらすマイクロソフトの AI とは
データからビジネス変革をもたらすマイクロソフトの AI とはデータからビジネス変革をもたらすマイクロソフトの AI とは
データからビジネス変革をもたらすマイクロソフトの AI とは
Miho Yamamoto
 
ビッグデータはバズワードか? (Cloudian Summit 2012)
ビッグデータはバズワードか? (Cloudian Summit 2012)ビッグデータはバズワードか? (Cloudian Summit 2012)
ビッグデータはバズワードか? (Cloudian Summit 2012)
CLOUDIAN KK
 
Digital marketing on AWS
Digital marketing on AWSDigital marketing on AWS
Digital marketing on AWS
Yuta Imai
 
ビッグデータエコシステムとデータサイエンスのススメ
ビッグデータエコシステムとデータサイエンスのススメビッグデータエコシステムとデータサイエンスのススメ
ビッグデータエコシステムとデータサイエンスのススメ
Yuki Asano
 
Smart data integration to hybrid data analysis infrastructure
Smart data integration to hybrid data analysis infrastructureSmart data integration to hybrid data analysis infrastructure
Smart data integration to hybrid data analysis infrastructure
DataWorks Summit
 

More from SmartNews, Inc. (6)

SmartNewsを支えるデータパイプラインとその運用
SmartNewsを支えるデータパイプラインとその運用SmartNewsを支えるデータパイプラインとその運用
SmartNewsを支えるデータパイプラインとその運用
SmartNews, Inc.
 
エンジニアからプロダクトマネージャーへ
エンジニアからプロダクトマネージャーへエンジニアからプロダクトマネージャーへ
エンジニアからプロダクトマネージャーへ
SmartNews, Inc.
 
Stream Processing in SmartNews #jawsdays
Stream Processing in SmartNews #jawsdaysStream Processing in SmartNews #jawsdays
Stream Processing in SmartNews #jawsdays
SmartNews, Inc.
 
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテムSmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews, Inc.
 
AWS meetup「Apache Spark on EMR」
AWS meetup「Apache Spark on EMR」AWS meetup「Apache Spark on EMR」
AWS meetup「Apache Spark on EMR」
SmartNews, Inc.
 
Smartnews Product Manager Night
Smartnews Product Manager NightSmartnews Product Manager Night
Smartnews Product Manager Night
SmartNews, Inc.
 
SmartNewsを支えるデータパイプラインとその運用
SmartNewsを支えるデータパイプラインとその運用SmartNewsを支えるデータパイプラインとその運用
SmartNewsを支えるデータパイプラインとその運用
SmartNews, Inc.
 
エンジニアからプロダクトマネージャーへ
エンジニアからプロダクトマネージャーへエンジニアからプロダクトマネージャーへ
エンジニアからプロダクトマネージャーへ
SmartNews, Inc.
 
Stream Processing in SmartNews #jawsdays
Stream Processing in SmartNews #jawsdaysStream Processing in SmartNews #jawsdays
Stream Processing in SmartNews #jawsdays
SmartNews, Inc.
 
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテムSmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews TechNight Vol5 : SmartNews AdServer 解体新書 / ポストモーテム
SmartNews, Inc.
 
AWS meetup「Apache Spark on EMR」
AWS meetup「Apache Spark on EMR」AWS meetup「Apache Spark on EMR」
AWS meetup「Apache Spark on EMR」
SmartNews, Inc.
 
Smartnews Product Manager Night
Smartnews Product Manager NightSmartnews Product Manager Night
Smartnews Product Manager Night
SmartNews, Inc.
 

SmartNews Ads System - AWS Summit Tokyo 2015