9. 9
Data science ≒ Applied statistics
Data scientist ≒ Applied statistician
海外での定義
応⽤用 統計
応⽤用 統計家
10. Data science: 英語Wikipediaにおける定義
l Data science: 複合領領域
l データ⼯工学、科学的思考、数学、
統計学、先端コンピューティング、
可視化技術、ハッカー精神、
特定ドメインでの経験
l Data scientist: practitioner
l Data scienceの実務家
l 複雑なデータの問題を解決する⼈人
l 通常は上記のうち2-3の専⾨門家
l 残りのうち2-3に熟練している
l ⼀一⼈人では全領領域でエキスパートにはなれない
l Data scienceはチームで補い合って実践すべき
10
http://en.wikibooks.org/wiki/Data_Science:_An_Introduction/
11. ,"
20%
,"
20%
,"15%
,"5%
,"
25%
,"15%
Data scienceの起源:
統計学の範囲を広げるための新カリキュラムとして
l William S. Cleveland, “Data Science: An Action Plan for Expanding
the Technical Areas of the Field of Statistics”, 2001.
l 重視すべきこと
l (統計の)アルゴリズム研究だけに没頭しない
l 実問題に当たって実データに触れる
l 発達した計算機のデータ処理理能⼒力力をフル活⽤用する
11
http://cm.bell-labs.com/cm/ms/departments/sia/doc/datascience.pdf
12. Data scientist: math and statistics
l “For Today’s Graduate, Just One Word: Statistics”, NYT, 2009
l GoogleのHal Varian「次の10年年で最もセクシーな職業は統計」
l データ活⽤用「能⼒力力」がいろんなビジネスでボトルネックに
l 新世代の統計家が豊富なコンピュータ処理理能⼒力力と⾼高度度なモデリング
⼿手法を使ってそれらを解決しようとしている
l 例例:Web, Netfilx Challenge, IBMのBAOサービス
l “What is data science?”, O’Reilly, 2010
l Data products and Data-driven apps
l CDDBが最も初期のData product
l その後はGoogle周辺を中⼼心に爆発的に増加
l 「データサイエンティストに向いてるのは
コンピュータサイエンスでなく物理理の⼈人」
12http://radar.oreilly.com/2010/06/what-is-data-science.html
http://www.nytimes.com/2009/08/06/technology/06stats.html
13. “The ability to take data — to be able to understand it,
to process it, to extract value from it, to visualize it, to
communicate it — that’s going to be a hugely
important skill in the next decades.”
— Hal Varian, Google
13
Data scientist: for “data jiujitsu”
14. データサイエンス ≒ Data science
国内での定義
データサイエンティスト ≒ Data scientist
or Rによるデータ分析
or ビッグデータ分析者
27. 働くデータサイエンティスト:
Twitterプロフィールから
l 海外
l Data Scientist @ Twitter x 3
l Principal Data Scientist @LinkedIn
l Data Scientist @Cloudera, creator of Crunch
l Data scientist, blogger, and R evangelist at Revolution Analytics
l 国内
l DeNA
l J!NS
l Albert
l ( チーフデータマエショリスト @ Treasure Data )