Copyright(C) tritrue Inc. All rights Reserved.
(ベンチャー企業における)課題
1.お⾦金金が無い
2.時間がない
3.リソースが無い
→インフラにかけられるコストは⽉月数万
→オンプレ無料料で貸して頂ける!
→検索索精度度やサービスのUI/UXに注⼒力力
→インフラ構築・整備は、後回しに
→頑張る!
→そもしもインフラエンジニア不不在
→解決不不可能!⾃自分で何とかする!
・最低限のパフォーマンス → (優先度度:⾼高)NoSQL
・⼿手間がかからない → (優先度度:中)構築や管理理が容易易
・問題発⽣生時に容易易に対応 → (優先度度:⾼高)マニュアルが潤沢
オンプレ Hbase + Hadoop+
17.
Copyright(C) tritrue Inc. All rights Reserved.
Hbaseの採⽤用
運⽤用フェーズからインフラに異異変が!!
■システム構築
→マニュアルやコミュニティーが豊富なため、容易易に稼働開始
■サービス運⽤用
→⾼高速レスポンス(数msec)
■サービスインまでの時間短縮
→ThriftAPIの利利⽤用
開発からデモそしてサービスインまで順調
18.
Copyright(C) tritrue Inc. All rights Reserved.
Hbaseの運⽤用フェーズにおける問題
■情報収集速度度を向上による問題発⽣生
→Read/Writeが⼤大量量発⽣生
→負荷だけでなく、コンパクションが終わらないなどの問題
■レスポンスの低下
→データの偏りや負荷増加のため
■パッケージのアップデート失敗
→パッケージのバージョン不不⼀一致の問題(CDHなどありますが)
→Hadoop、Zookeeper、RegionServerなどなど
■実験不不⾜足による想定外の管理理コスト
→余剰マシンが無く、テストが不不⼗十分に
→マスターノード多重化
→ダウンテスト不不可
データ量量の増加とデータアクセス数の増加
19.
Copyright(C) tritrue Inc. All rights Reserved.
Hbaseの運⽤用フェーズにおける問題
■コンポーネントが多いため、切切り分けが困難
・障害発⽣生
・バージョンアップ
・実験環境構築
・レスポンス低下
■オンプレ問題
・実験環境の構築困難
■オンプレ問題
・実験・運⽤用コストが⾼高い(ハードの故障も発⽣生)
パッケージの多さによるが問題
システム構成の問題
オンプレ管理理の⾼高コストの問題
20.
Copyright(C) tritrue Inc. All rights Reserved.
Cassandraの検討から採⽤用
MSAzure DataStax
Cassandra
・スタートアップ⽀支援
・スケールアップ/スケールアウトの容易易性
・スタートアップ⽀支援
・アクセスの容易易性
・構築運⽤用管理理の容易易性
・
Copyright(C) tritrue Inc. All rights Reserved.
システム構成図(Hbase利利⽤用時)
情報収集
インデックサー
検索API
NoSQL
検索索エンジン
…
・・・
Hbase
Master
RegionServer
HadoopDB
24.
Copyright(C) tritrue Inc. All rights Reserved.
システム構成図(Cassandra利利⽤用時)
情報収集
インデックサー
検索API
NoSQL
検索索エンジン
…
テーブル毎に細かくクラスタを構築
25.
Copyright(C) tritrue Inc. All rights Reserved.
Cassandraを利利⽤用してから思ったこと
■スケールアウトが容易易
・Azureを利利⽤用することでスケールアップも容易易
・ノードを増やすと安定
→⼿手間が掛からない
■レプリケーション
・データの反映まで時間が掛かる
・整合性の調整
→サービス的に問題なし
■P2P型
・マスタスレイブが無いため、ダウンタイム無し
→⼿手間が掛からない
■スキャンが出来ない
→現在苦戦中
26.
Copyright(C) tritrue Inc. All rights Reserved.
実験・ユーザテスト環境構築
データ格納⽤用
分析結果格納⽤用
ユーザアクセス⽤用
ユーザテストアクセス⽤用
実験⽤用
Snapshot
Snapshot
Data
Data
Data
本番環境を容易易に複製可能
27.
Copyright(C) tritrue Inc. All rights Reserved.
まとめ
■サービス開発から初期稼働時に⼤大量量データを扱いたい
→クラウド上でCassandra運⽤用
■課題
→コミュニティが少ない
→国内にCassandra運⽤用経験者が少ない
■今後の期待
→海外サービス事業社では利利⽤用拡⼤大中
■今後の展望
・ファイル・システムをHDFSからHadoopに変更更
・Spark導⼊入検討
・パフォーマンス向上(チューニングやテーブル再設計)
28.
Copyright(C) tritrue Inc. All rights Reserved.
Confidential
検索索エンジンPatheeがMSAzureと
Cassandraをどう利利⽤用しているのか
To Be The Next Big Thing