やはりこれからの時代はデータサイエンスですよね。
ギズモード編集部員として忙しい日々を送る吉岡。毎日新鮮な情報に触れているためサイエンスやテクノロジーに関する知識は相当なもの。
「でも何か足りない」
彼は、もう1ランク上のレベルに到達したいと考えていました。
「僕に足りないものはなんだろう…?」。そう考えながらネットを徘徊していると、1つの特集記事を発見しました。
<いまパイソン男子がアツい>「なにパイソンって!? マイク・タイソンなら知ってるけど、パイソンってなんなの!?」
記事を読むと、「パイソン男子」とは「データサイエンティスト」と呼ばれる肩書きを持つ人たちに多いことがわかりました。
「データサイエンティストか、最近よく見るワードだな。ふむふむ…注目度の高い職種で需要が急増しているゆえに厚待遇であると。なるほど」
さらに調べていくとその筋のキーマンらしき人物に行き当たりました。彼の名は辻真吾さん。しかも辻さんは、以前、吉岡が活用したことのあるオンライン講座「Udemy」の講師を務めていることも判明。
「これは有益な話が聞けるに違いない」。編集者魂に火のついた吉岡、さっそく辻さんに取材すべくコンタクトをとったのでした。
パイソンパイセンに会ってきた
Dropboxにも使われている「Python」のスゴさ
辻さん:Pythonはオープンな環境でだれでも使え、非常に覚えやすく使いやすいことから人気があります。いわゆる軽量言語と呼ばれるカテゴリーに入るものです。通常、軽量言語といえば日常のちょっとした作業を自動化するような用途に使われるのですが、PythonはWeb開発や本格的なプログラミングにも使われています。例えばDropbox。ユーザーのローカル環境で動いている部分はすべてPythonで書かれています。吉岡:Dropbox! そうなんですね。辻さん:私はかつてJavaを使っていたのですが、同じようなアプリを作るのにJavaでは5行以上コードが必要だったものがPythonでは1行で書けたりして、その使いやすさに一気にハマってしまいました。しかもPythonはライブラリが充実していて、データを解析したり、可視化したり、ディープラーニングなど最新の機械学習が使えるAPIも豊富に用意されているんですよ。あらゆる仕事はデータサイエンスだ
吉岡:いまデータ解析の話が出ましたが、Pythonはやはりデータサイエンス分野にも向いているのですか?辻さん:向いています。というか本命です。もう1つ、データサイエンス分野でよく使われるオープン環境のプログラミング言語に『R』というものがあるのですが、PythonとRが双璧と言われています。昨今、Pythonが頭1つ抜けてきた感じですね。吉岡:辻さんはPythonをどのように活用しているのですか?辻さん:私は東京大学で遺伝子研究の仕事をしているのですが、そこでがんに侵された細胞の分析を行なっています。30億の遺伝子配列の中に2万種類ほどたんぱく質をコードする遺伝子容器がありますから、例えば100人の大腸がん患者さんについて調べると2万✕100の表ができます。それを、変数を使って分類すると、同じ大腸がんの患者さんでもいくつかのグループに分けられることなどが見えてくる。そういったデータをもとに、薬の効きを予測するモデルを作ったりしています。吉岡:おぉ、まさしくデータサイエンスですね! ところで辻さんは、このデータサイエンスという言葉をどうとらえていますか?辻さん:実は、あらゆる仕事はデータサイエンスではないか?という気がしています。研究室でデータを分析することもそうですし、どこかの企業の取締役会で月に1回、営業成績を検討するようなものも、いわばデータサイエンスですよね。吉岡:確かに。辻さん:そのうえで、最近その言葉が注目されてきたのは、コンピュータなどのデバイスが安価になって数が増えたことによりデータも増えてきた。データが膨大になると整理するのが大変だし、どう活用するかを考える必要がある。いわゆるデータサイエンスというのは、そうした膨大なデータを整理してなにかの判断に使えるものにすることなのではないかと思います。吉岡:企業でも求められている人材でしょうね。辻さん:求人サイトで「データサイエンティスト」と検索してみると、多くの企業がその肩書きで募集しているのがわかりますよ。どうやったらデータサイエンティストになれる?
吉岡:応募する人は、どういうアピールをするのがよいでしょうか?辻さん:1つはPythonが使えることですね。あとは数学や統計の基礎能力、そしてその業務に対する知識、この3つがそろえばデータサイエンティストを名乗れるのではないでしょうか。吉岡:辻さんがUdemyで担当されている「【世界で2万人が受講】実践 Python データサイエンス」は、まさにデータサイエンティストを目指す人のための講座だと思うのですが、どんな特徴があるのですか?辻さん:これはJose Portillaさんというアメリカの方が作った講座を翻訳したものですが、NumPyやPandasといったPythonで使用するライブラリの解説から、データ解析の基礎、データの可視化、機械学習まで入っていて、Pythonでデータサイエンスをやるために必要なことがすべて学べると思います。全部で17時間半あるので大変だと思いますが、やりきれば次の日からデータサイエンス的な仕事はできるようになると思いますよ。吉岡:まじですか! がぜん興味が湧いてきました! さっそく始めてみます!データサイエンスを学ぶならUdemy
編集部に戻ってきた吉岡は、「【世界で2万人が受講】実践 Python データサイエンス」を受講開始。
「Udemyは空いた時間を利用して学べるのがいいよね。しかもわからないところを質問すると講師が答えてくれるんだけど、それが辻さんだと思うと頼もしすぎるよなぁ。よーし、データサイエンティストが名乗れるレベルまで頑張って学ぶぞ!」
なお、Udemyでは、辻さんのPython講座のほかにも「データサイエンティスト養成講座」として複数の講座を展開しています。今後も続々と増えていく予定とのこと。
独立や転職を目指して「手に職をつけよう」と考えているあなた。いま最も有望な職種の1つ、データサイエンティストを目指してみるのも、アリではないですか?
ギズモード読者のための特別価格(すべて20%オフで4,800円)も用意していただきました。有効期限は2016年5月31日です。興味がある人は下のリンクからどうぞ!
source: Udemy
(奥旅男)