ネガティブにデータサイエンティストでもないブログ

経済統計屋。気分悪くなったらごめんなさい (´・д・`) ゴメンネ データサイエンティストという呼称が好きじゃないんです https://twitter.com/dscax

ビッグデータを取り扱う人間が、ビッグデータなんかに操られて一体どうするのという警告3つ

あけましておめでとうございます。ようやく今頃になって休暇とれたので、新たな計画の祈願に初詣してきました。しつこくも去年のまとめと、立ち位置を確認させてください。

 

まず、このブログで書こうとしている中身は、テーマはなんであれ、基本的に、この世を見通して、防御力や回避性能をあげていきましょうよという主旨です。攻撃力をあげていこうぜ!という話ではありません。そもそもモチベーション低い人間ですから、その目的は、生存であって成功ではありません。10回に1回、大勝利することよりも、10回に9回、負けても平気であることが大事なのです。基本ベクトルは成長ではなく持続です。(←本業に限ります。ブログはいつ燃え尽きるかわかりません。)

 

しかしながら、現状維持では劣化という名の重力により危ういので、それに逆らう程度には上向いております。キャリアポルノというよりは、惑わされずに落ち着きましょうという類のエナジードレイン、キャリア鎮静剤的として、お読みいただければと思います。それゆえに、前向きに捉えようとする方や、成功を求めている方からして、気分の悪いことが多々あるかと思います。そのへんはほんとにごめんなさいね。後ろ向いて後退しているだけなんで前進はしているはずなんですけども。

 

今年も新たな目標を掲げて世に挑みます。

 

ちなみに昨年の計画はご存じのとおり、「ビッグデータやデータサイエンティストの万能セクシー感に文句ばっかり言ってみる」でした。

 

冗談です。

 

昨年、言いたかったことをおさらいしておきますと、

 

セクシー職業とかバカ言ってないで、知識労働なんて、もっと地道なもんでしょ。地に足つけて頭つかってデータを扱う者が、いちいち吹けば飛ぶようなトレンドに煽られてどうするの。そういうのって煽られてるものじゃなくて、本物だったら、こっちが予測して操作するものでしょうよ。他人の尻を追いかけてないで、その前を歩く者なはずでしょう。作らされた万能感と期待感に踊らされてる時点でもう遅いんですよ。ついでにいっておくと、人間にとって変化はたしかに必要だけれども、変化ばかりしていても何もスキル身につかないよ。メディアみたくポリシー捨てて、コロコロ意見を変えていく人間って(戦略的に必要かもしれないけど)地に足じゃなくて、足に血がついていると思うよ。

 

です。若干、関係ない部分もあえて混ぜてますが気にしないでください。もちろん本物な方も少なからずいるでしょうが、データサイエンティストやビッグデータを連呼してトレンドやブームに操られてる方なんかを市況で見ると、ミイラ取りがミイラになってんじゃねーよ、とムズムズすんだよという主張でした。

 

これは計画じゃなくて愚痴でしたので、訂正いたしますと、昨年の計画は「自分に近しい職業や業界の未来を予測して、向こう3年間くらいに備えた計画を立てるためのデータと調査報告書を作る」でした。そのへんは達成しましたし、それらの成果物を差し上げた歴々らが材料にして、適当な本書いて出版するかもしれません。だけど、もうブームも過ぎてるし売れるかな。もう私のものじゃないので口出しませんが。私としては副産物で経済予測が少しスキルアップしたくらいです。その方面はもうそろそろやめにして、次の時代に備えて粛々と準備していきましょう。

 

で、

 

ビッグデータ専門誌が発刊されるそうですね。そこで、この方面のメディアに対して警鐘を鳴らしたいことが二つあります。

 

一昨年あたりからの変化として、いつのまにかビッグデータが、伝統的な情報システムと同義になってしまっているように見えて、なんとも微妙な感じがしています。ただし、情報システムをなめんなという意味で、です。主客転倒してませんか。システムでもコンピュータでもITプロでもいいのではないかと思います。

 

一つめは、

「なんとか会社が、なんとか級のビッグデータに挑む!」的な内容の煽りテーマと記事は不要であるということです。キャッチっぽく見えるけど、実務している人間からすると、そういうのは、まったく重要じゃないです。経営者だってそう簡単に焚き付けられませんよ。なぜなら、そんなの今までもたくさん起きては散っていったからです。もちろん、挑む権利を外野の誰が止めるものではありません。

そうじゃなくて、ビッグデータというからには、その先が重要です。その挑戦した後、どうなったのか、結果の追検証がほしいわけです。ぜひメディアには検証もセットにしてトレースした誌面づくりをお願いしたい。ビッグデータなんだから試行回数と検証こそが大事なはずですよね。

あれって、結局なんだったの?という言いっぱなし投げっぱなしがメディアの基本習性でしょうけれど、ビッグデータというからにはデータがあるわけですから、しっかり後日検証をやってほしいという願いです。そうすることで失敗だって意味が出てきます。それなら史上もっとも価値あるメディアとして絶対買うのですけども。構造上、無理ですかね。せめてビッグデータと言うのなら、誌面と反応くらいはしっかりと分析くらいしてくれますよね。

 

 

二つめは、

オラの村には、処理しきれないほどのビッグなデータあって困っているズラ自慢

と、

ビッグデータだって余裕でさばけますシステム作った俺SUGEEEE自慢

は、頼むからやめてくれ、ということです。一体、誰の得なんでしょうか。

 

それ、語っている本人のためですよね。言い方悪くて誠に申し訳ないんですが、愚か者自慢なんですか?だって裏を返せば、前者は機会損失のことだし、後者は遊休設備の嘆きですよ。

 

だから、どうしても言いたいのです。

 

そのデータはあなたの顧客のことであって、自己満足しちゃいけないものですよ。

 

データを食料に置き換えてみれば理解できると思います。データも食料も飯の種ならば同じことです。食料を、データを、設備を、無駄にして、それを誇ってはいけません。ですから、せめてデータを超えて、その先にいる血肉、人間を意識して向き合ってほしいと願います。ただのデータだと軽んじずに。

 

だから

 

3つめ、

「気持ち悪い」では新たな可能性を探れない

とかメディアがいってちゃダメなんですよ。ほんと何もわかっていないですね。気持ち悪いと思っている輩に、食料を、データを差し出す人がいるわけないでしょう。対立を煽って一体どうするの。双方に利益と信用を得られるよう、メディアがトレンド作れなくて一体なんのための存在理由なんですか。発展を阻害することですか。

 

f:id:dsca:20090705220652j:plain

敬意を払え。データと人に。さらなる段階へ進め。

 

 

EUやUSがどうであれ、誰かに作られたトレンドに踊らされずに、業界の中身ある持続的な発展を希望しています。

 

新年から、文句ばっかりいってごめんなさいね。

 

 

 

知識労働者であり続けるために、必要そうだけれど実は必要のない10の行動

f:id:dsca:20131227223318j:plain

 

風邪ひきダウンで、だいぶ遅れに遅れましたが、年末総括その3 組織、労働編です。

 

年末ということで自分のいる営利組織、非営利コミュニティなんか振り返ることもある方が多いのではないかと思います。そこで今回は、知識労働型の組織で錯覚しがちで、間違っていると思われる行動について指摘します。主に分析屋の視点ですが、技術職、専門職の方は自分に置き換えても、共通するところがあるかと思います。

 

文中には知識労働者という呼称を用いてますが、これは単に労働によって賃金を稼ぐ事を目的とはせずに、仕事の成果そのものを目的とする労働者を指します。主に高度な技術者や職人、専門職などであり、分析屋もその範疇とします。

 

私も比較的、いろんな組織を見てきた者ですが、転職回数が多すぎるからではありません。仕事柄、人事や組織データにも触れてきまして、組織というものも、洞察の対象でした。その中でも知的労働者のコントロールはもっとも難しいテーマです。私の観点でいうなれば、自分より賢く強い者をどうマネジメントするのか。私(あなた)はどうしていけばいいのか。知識労働者の現場で、よくある知的労働者の陥りがちな点を実務者視点で指摘します。もちろん異論はみとめまくります。毎度毎度、やたら長くてごめんなさいね。これ、自分への備忘録と戒めでもあるんで。

 

#1: ロックスターなエンジニアになる (たとえば、著名なデータサイエンティストになる)

 

有名無実です。

 

こういうのって、テクノロジー系ベンチャーの経営者が、プログラミングもできないのに英語だけバリバリなような、成功本書いているわりに著者はあんまり成功していない感じの、悪くないけど微妙です。誤解してほしくないのですが、有名になってはいけないとか偏屈なことを言っているのでありません。有名になりたい方、なれる実力ある方はぜひどうぞ。ここで話したいのは、有名への道を歩むとき、あなたの実務にとっての終焉を、理解して割りきれていますかという話です。

 

ロックスターエンジニア問題は米国でちょこっと話題になりましたが、本記事での範囲は、実力か運か、あるいはソーシャルな努力かなにかで有名さ(+演技上の、見せかけの自由)を獲得した者とします。

 

誰もがわかっているけど言いにくい事実として、知識労働は、あるレベルに達すると、有名さと実力が反比例します。実績を示してテンポラリに話題になる程度なら問題ではありませんが、一挙一投足まで注目される=どうでもいい話題にまでコメント求められる、ようになったら知識労働者としてはオシマイです。全盛期に女子大生に囲まれて恋愛作法の演説ぶっていた某ネットベンチャー社長の会社は風前の灯です。もちろん例外はいますが、そういった方々は1%以下の希少種なので、95%の一般人には参考になりません。

 

ようするに、有名になるとは、名声という無形で正体ないものに一定のコストを支払ってくれということです。ソーシャルキャピタル(社会関係資本)と言われて久しいですが、負債(liabilities)が無視されすぎています。その証拠に、Twitterで店の冷蔵庫を晒してみれば、相応の負債が振りかかってきます。名声の質がなんであれ、さらなる名声獲得と維持のため、あなたの知名度は、あなた本人と分離して次々にゲットモア(get more)を叫び、あなたの時間とお金と精神力を要求してきます。ですから、そのコントロールとして、一定のコストを超えてきたら、それ自体を仕事にしなくてはなりません。こういった性質上、名声の獲得、それ自体を仕事とする芸能人や、それに近い一部のロックスター経営者とは相性が良いものでもあります。

 

ですが、知識労働者とは、やはり相性が悪いです。有名人であるほど、同じような業界で同じような体験をするため、表明している考えも似てくる傾向があります。一般人からは、途方もない考え方に見えても、業界エグゼクティブ内では普通にアーリーアダプター、二次流用者でしかないことも多いのです。上位の知識労働者ならば、彼らへの一次情報提供者だったりするのでそれがよくわかりますよね。ビッグデータやクラウドに限らず、昔からIT系のバズワードって、ぶっちゃけ、このバイアスが強いだけだと思います。例えば、米国に行った日本の知識層が影響受けて(←たいていは危機感)国内ブームが仕掛けられる。そういう模倣も悪くありませんが、そのままではオリジナルの無さから二流以上になれませんから、競争においては致命的です。また有名さとは、あなたをよく知らない外野な人達の期待値の大きさでもあります。よく知っている関係者の期待値ではないことに注意ください。外野の期待に応え続ける道化も一興でしょうが、手から技術もこぼれ落ちていくでしょう。

  

#2: やたらと透明性を強調し、透明性のあるデータや、情報の開示を求める

 

ないものねだりはやめましょう。

 

最近は国の立法やゴシップの影響で、責任などのトレードオフが無視されてて嫌な感じです。さておき、ビジネスにおける普通の取引では、求めるならば与えることを確約する必要があります。もう当然にギブアンドテイクです。あなたが相手にたくさんデータや情報開示を求めるのならば、あなたは相手に負担を押し付けているのです。ならば相応の利得を相手に与えなければなりません。慈善事業はありません。最初は共通の趣味や提携なんて上辺だけのやりとりでも良いでしょう。しかし、裸になってくれと要求するからにはこちらもリスクを負わねばならないのです。

 

もう一つ、ニート論や失業率に関する統計の危うさ、経済や年金の計算根拠の脆弱さを見てもそうであるように、すべてのデータも情報も、アルゴリズムや分析も目的にしたがって恣意的なものでもあります。有限が無限を網羅できません。本来、数学や技術は中立でしょうが、すべては恣意的なのですから、その出力も何かしら偏っています。大学のように偏りを解きほぐす作業に時間を費やしてばかりもいられません。ですから一生懸命に、透明性を叫んでも空回りです。特に、分析屋ならば、自分の仕事を放棄しているようにしか聞きとってもらえません。

 

また、開示できない情報に、開示要求するほど、あなたは疎んじられ、煙たがられます。開示できるがコストの高い情報なら、相手の期待値を無駄に押し上げる行為でしかありません。つまり、要求すればするほど戦いは不利になります。

  

#3: ブログ/ソーシャルメディアなどでテクノロジーについて発信する

 

愚かです。

 

異論は認めまくりますが、寒いからと自分の家の柱を壊して焚き火にくべる行為に見えてしまいます。その場しのぎの暖かさはありますが、最終的には家(拠り所)がなくなるでしょう。研究者や意識の高い方なら、こんな意見は間違っていると思って当然です。しかし、わかってほしいのは、これは単にスコープの問題だということです。グローバル全体の推進と向上を目的にしていれば、私の言うことは明らかに間違いです。しかしながら、ビジネスとは極論、ローカル(縄張り)なのです。サービスや商品、会社や組織、あるいは個人の差別化が必要なのですから、共有すべきものとすべきでないものがあって当然です。そして、共有してもよいものであったとしてもテクノロジーには別の問題もあります。例えば陳腐化の速度です。テクノロジーといっても、ほんの一部を除いて、大半はブームにすぎないので早々に顕れては消えていきます。長年、コストを支払って、それについていくことができるでしょうか。そして発信を辞めた後はコンテンツも陳腐化していくのでさらに微妙です。できる方こそ偉大と思いますが、ほとんどの方には無理でしょう。私もまったく根気ないので10年ほど前に諦めています。

  

#4: カンファレンスで事例について話す

 

かなりズレてます。

 

スピーカーはその問題のスペシャリストでもあったりしますが、ゆえに視聴者と問題意識に天地の差があります。そしてイノベーション性が高いほど、再利用できる汎用性ある事例というのも、なかなか存在しません。そこで技術職にとってのスピーチは二択になります。凡庸なテーマをわかりやすく語るか、特殊なテーマをわかりにくいけど語ってみるか、です。時間は有限である以上、そこがトレードオフです。実際のところ、簡単に伝わらないものにこそ他人が見つけていない価値が残っています。

 

クライマックス法のように最初に耳障りの良いことを言ったとしても、高度であるほど、たいして価値は伝わらないでしょう。レベルが同じと仮定するならば、皆がつまらなそうにしているスピーチほど価値が潜むはずですが、そうなるとそれは伝統的な学会活動と同じです。退屈と真面目を許容する以上、集客が望めなくなって本末転倒です。また、その手の教育産業にも似たようなことが言えます。初心者に1時間でデータベース構築や、多変量解析を教えますなんて、わかった気にさせるだけで、ほんとに教える気ないですよね。

  

#5: 余力をなくす あるいは 余力がありすぎる

 

最悪です。

 

世の中には余裕をなくして戦わせることを常とさせる仕事のほうが多いでしょう。その多くは時間内にどれだけ労働できるかを競う=最適化された仕事です。しかし知識労働は、有限リソース内で、どれだけ成果を出せるかを競う仕事です。目先の仕事だけに奪われているようでは高度な成果は出せません。イノベーションとは新しい組み合わせ、だというのなら、常に組み合わせを試す必要があります。それは一部の例外の除き、余力から来る思考と体験の産物です。知的に暇な人間(怠惰ではありません)ほど独特な視点を持っており、価値を産みやすいのは事実です。その点からも、革新には変人が必要なのは事実です。一方、余力がありすぎるというのは論外です。その余力とは単にサボることによるモラトリアムのことです。止まっていると景色が変わらないように、新しい景色を見ることができずに何事もつまらなくなります。

 

#6: 専門職を大勢雇う (分析者を大勢雇う)

 

実はそんなに仕事はありません。

 

今年はブームに乗っかって多くの組織にも実感あるかもしれません。誤解なきよう言い直すと、雑多な仕事はたくさんあふれていますが、専門的な仕事しか選べない人が多くいても、用事がないということです。データがなければ分析できません(代わりに高度な分析技術が使えます)という方は、実社会での出番は少ないのです。専門性の高さと汎用性の低さから、不遇を感じて転職しても、そういう人は、やはり出番は少ないです。

 

はっきり言いますと、ほとんどのケースで、準備:実測:分析(調整)といったPDCAがあるならば、5:3:2です。にもかかわらず、経営の都合からなのか、組織構成比で2:2:6など歪な組織が増えました。ぶっちゃけると、データがあるから分析してみてというケースはビジネスではたいして重要ではないです。いかにしてデータを作りだすのか、という事前で次善を考えたシステムの設計が、実際の分析よりも断然に競争にとっては重要なのです。

  

#7: 内容について話せなくなる

 

困ります。

 

それなりの知識労働者であれば、その性質上、会社や個人の人生を激変させる情報や機密の一つや二つ、ひょっとすると数えきれないほど握っているものです。だからといって情報を隠してばかりでは消耗してしまいます。ストレスもたまります。あいつに聞かなきゃわからなくて困るという属人問題は、わからない側の理屈だけでなく、わかっている側の理屈でもあります。教えまわって制限なく時間を奪われていては、組織の養分になって干からびるでしょう。しかしながら共有も難しい大人の事情があるからこそ、重要な情報だったりするわけなのですから、日頃から少しずつでも話せるようにしておきましょう。95%の一般人にとっては秘密はほどほどに。開示もほどほどに。です。

  

#8: ステークホルダーを無視して、何かに目覚める

 

冷静になりましょう。

 

顧客も会社も神様ではありませんが、これは天に向かって唾吐く自爆行為です。そもそも誰に何を応えるつもりで始めたのか再確認してください。データや希少な情報を眺めていれば、面白い一次情報の発見もあるかもしれません。それは夢見た技術かもしれません。しかし、あなたがいじっているデータや情報に所有権がないのなら、やはり公表してはならないのです。そのように現在の日本の社会制度は設計されています。

 

ある日、こんな会社に自分はいるべきではないと覚醒するかもしれません。そう思うのなら、なおさら、その仕事はきっちりと完遂させましょう。その後ゆっくり、今後も、飯が食っていけるかどうか再考しましょう。たいていは思ったほどでもなくなっています。飯を食べ続けていく観点では、スキルや名声よりも遥かに、信用が大事なのです。

  

#9: 儲かっているフリをする 頭の良いフリをする

 

無駄です。

 

本当に儲かっていたり、賢い方なら、それをするわけがありません。「無料で儲かる方法を教えます」という宣伝がただの愚者であるように、同じレベルの残念です。そういうもったいない方がよく出現していますが、まったく無駄な行為です。人間は社交において、例えば会社だけでなく、交流会や勉強会ですごい人と思われたい気持ちもあるでしょう。時には、賢者のように振る舞いたくもなるでしょう。しかし、目的から遠ざかる行動です。頭は悪く見えるほうが情報は引き出せるし、儲かっていないように見えたほうが、交渉の余地が広がります。賢さをウリにしてゲットしてくる案件は売上のわりに要求が高いものです。「もっと私を儲けさせてください!」という経営者や、「私は賢いですからおまかせください」と得意顔している分析者が、良い仕事に恵まれることは、まずありません。エリートっぽいのに使ってみたらボンクラだとバレるよりも、昼行燈でも、やるときはやる奴だと思われたほうが、断然、お得なのです。

 

 #10: 別の会社にいってしまう

 

あなたの実力は半分以下に落ちてしまいます。

 

新天地での実力の回復には1~3年を要するでしょう。それでいいのなら問題ありません。なぜ実力が落ちるのかと言えば、もういい加減に真実を言いますが、どこにでも通用する汎用的で高度なスキル(あるいはセクシーな職業)だとかいうのはすべてファンタジーだからです。ほとんどの人間にとって実力とは、環境と地位に根差したものであり、今現在、それを武器にして働いているのです。したがって武器の半分は置いていくのだから、実力は減って当然です。懸念しているのは、転職するなということではなくて、この統計的にも明らかな事実を、あらかじめ許容できていないと、転職先でも長続きしないということです。この程度は知識労働者なら当たり前に、試算して覚悟を持って臨むべきでしょう。逆に言えば、転職して実力が発揮できないのは当然です。地道な成長を期待して、とりあえずは暖かい目で見守るしかありません。

 

 

 

以上、長々と今年納めとしてまとめてみました。文句ばっかりいってきてごめんなさいね。このブログでは、だいたい、やることも達成したんですが、来年も、もう少しだけ続く予定です。

 

来る年のあなたのご活躍をお祈りしております。 

 

 

 

 

よろしければこちらもどうぞ。

  

ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例

http://negative.hateblo.jp/entry/2013/12/17/180022

年末進行その1。ビジネスやっているとほんと書きにくいですけど、なんとかまとめ。

  

(実務者向け)日本の、データ基盤系エンジニア人数と年収の推定してみた 2014予想

http://negative.hateblo.jp/entry/2013/12/18/180537

年末進行その2。わけあって、この手の情報を蒐集したくて、このブログやってみました。

 

 

参考文献

 

GitHubの組織が成長する過程で変えたことと変えなかったこと

http://wazanova.jp/items/675


How GitHub (no longer) Works

http://zachholman.com/talk/how-github-no-longer-works/

 

中身はまったく違いますが、すばらしい記事です。感動して一部のフレームをリスペクトしました。

(実務者向け)日本の、データ基盤系エンジニア人数と年収の推定してみた 2014予想

※表が崩れていますが、修正が面倒大人の事情により、そのままにします。ごめんなさい。

 

年末進行その2。データ編です。どうせ正月ないから今のうちに。前回の「ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例」の続きでしたが、書くと無駄に長くなりすぎる癖がありまして。そろそネタバレ気味に逝きます。

 

このブログのモチベーションは、データサイエンティストネタ以前に、データ蒐集と社会の可視化が目的でした。重いモノを動かすには体力ですが、軽いモノを動かしてみるには知力が必要です。好奇心と探究心の一環なわけなので暖かい目でお許しください。

 

すでにわかっている方もいると思いますけども、私の微妙に一貫性のないコンテンツや時勢を無視した唐突な感じは、そうした蒐集と検証目的に沿って8割方、事前に計画してきたものなわけです。といっても計画8割、実行5割で、進捗率4割という、まるで計画通りじゃないのがダメな感じで今後の反省材料です。またいくつかのソーシャルメディアでの無軌道ぶりも、私というより軽めのボットを作って観測した仕業です。

 

ということで、この1年、私が知りたかったことは、ビッグデータ関連でいえば、

 

  • 各メディアの持つインパクトの実体感
  • 潜在マーケット需要(ビッグデータ業界や、データ分析人材需要)
  • その手を担ぐ会社の存在の偏り
  • データ分析者の存在マップ 分析屋がどこに潜んでいるのか社会ネットワーク
  • 関連技術と経済効果
  • データ分析要員の待遇改善効果

 

などです。私のブログは微妙ですけど、その周辺調査などからも、このあたりはよくわかったので目的達成はしたところです。そこで今回は

 

  • 潜在マーケット需要(ビッグデータ業界や、データ分析人材需要)

 

の亜種として、データ基盤系スキルの使い手人数と大事な待遇=年収帯の推定を行った結果を共有したいと思います。ビッグデータと騒いでいても、実際のエンジニアにとって今後、年収高くなりそうなスキルとはなにか!と米国の需要ベースで推定してみました。調査や導出方法などはかつての記事を参考ください。前回と違うのは、ブログなどによるフィードバックデータを加味したことです。例えば前回より、特定の人間の所属する会社の年収帯を推定するのは容易ですし、そのデータ蒐集と学習により、推定精度を少しは向上させています。選挙予想と似たようなもんですかね。そっちより簡単ですけど世にない感じなったのはいい具合かなと。年収帯の分布を出すことで、ざっくりとスキル熟練度の分布も想像できますが、一人が複数の領域にまたがることは当然ありえます。では共有します。

 

データベース系 

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
Oracle 45768 550 251,749 24232 12349 6444 1869 874
SQL Server 39618 529 209,668 22630 10550 4755 1194 490
MySQL 13742 542 74,428 7476 3698 1858 526 185
MongoDB 4302 748 32,194 0 2161 1395 443 304
PostgreSQL 2295 528 12,111 1348 561 283 76 28
NoSQL 6453 754 48,640 0 3160 2105 706 482

 

なんだかんだで商用的には2大巨頭のOracle、SQLserverの需要があるので人数も多めです。MongoDBやNoSQLみたいな新技術っぽいのは使い手の人数が少なく短期需要的には高めになりがちです。ただ、このへんは流行らない技術認定されると、急速に消えるので、ヘッジとして普通にRDBもやっておく必要があるでしょうね。それはMySQL、PostgreSQLどれもそんなに大差ありません。年収が高いDBエンジニアは重要なデータ扱う管理者的なポジションでもあるのでオープンソース系よりは、やはり商用DBの比率が高くなるようです。

 

 大量処理界系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
Hadoop 8081 759 61,342 0 3860 2667 900 654
mahout 431 630 2,715 104 218 69 20 20
Hive 2645 690 18,236 552 962 698 259 173

 

ビッグデータの申し子な感じのスキルであるHadoopスキル使いは年収高めの傾向ありです。今後もビッグデータブームを経て使い手も増えてくるでしょう。マニアックにmahoutなんか探ってみましたがほとんど使い手いないようです。HiveはDWHの一種ですがHadoop派生なんでHadoopの内数と見てよいでしょう。

 

分析ソフトウェア系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
matlab 4104 542 22,228 2317 1019 506 172 89
SPSS 3994 587 23,466 1788 1173 669 226 139

 

分析ソフトウェアの使い手たちですが人数はそこそこ。あまり年収高くありません。RやSASは?というのは大人の事情で割愛いたします。この手は類義語も多くてデータ的に蒐集と推定が難しくて。年収低めは学術関係者も使うのでその補正かもしれません。使いこなすと便利なんですがこれもまたブームにより消えがちなスキルなのでMSOFFICE系を使いこなせる必要もあるでしょうね。

 

マイクロソフトオフィス系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
microsoft Excel 182112 381 694,599 133902 28678 12982 3746 0
microsoft Access 37509 343 128,747 29159 4773 1993 545 0

 

MS系だけ区別しました。もっとも使われる分析ソフトウェア?ことEXCELはやはり使い手数は最大です。年収はポピュラーすぎて差別化難しいので低めになってしまいます。Accessも同様です。能力の差別化要素にはなりづらくても英語より重要な汎用スキルなのでやらざるをえませんけどもね。

 

クラウドサービス専門系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
Amazon EC2 1536 555 851,915 766 463 222 60 25
microsoft Azure 1161 520 603,612 707 266 144 32 11

 

 AmazonEC2やAzureのスキル(に特化した)使い手はまだまだ少ないようです。他のエンジニアスキルが応用が効くので特化する必要はないかもしれません。また登場した時期からしてエンジニア自体の年齢が低めと予想できることから年収は低めに見えます。

 

おまけ スマホ開発系

        推定年収帯(万円)と推定人数    
従事スキル 総使い手
(人数)
平均年収
(万円)
総給与
(百万円)
~399 400~599 600~799 800~999 1000~
iOS 19817 597 11,825,062 7899 6396 3938 1115 469
iOS developer 4572 552 2,521,651 2367 1263 685 196 61
Android 19662 602 11,846,094 7742 6268 3891 1190 572
Android developer 4864 551 2,681,452 2519 1354 714 208 68

 

iOSとAndroidのエンジニア延べ数も調べてみました。またdeveloperと付くのは内数で専用の開発者達です。これはこれで独特の開発スタイルと言語なので平均的には若いはずですが、ソーシャルゲームが下火になっても年収の高さから今後ますます需要はありそうです。

 

 

 

細かいことは言えばきりないですので、データと数値で感じて、参考にいただければと思います。ということでデータ系スキルの年収ランキング(需要ベース予想)では

 

1位 Hadoop

2位 MongoDB

3位 NoSQL

 

となりました。もろに昨今の流行を反映していますね。といっても人数少ないスキルは水物ですので、ヘッジの意味では、しっかりとポピュラーなRDBMSやEXCELなんかをきっちりやっておく必要があるでしょう。すみません。MongDBってNoSQLの内数ですね。ご指摘ありがとうございました。

年末ですから、余計なお世話な感じですが、あなたのいる場所と存在の希少確率なんかを振り返ってみたりと、お役に立てれば幸いです。

 

どうもありがとうございました。

 

 

次は組織編の予定です。

 

 

こちらもどうぞ。

 

ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例

http://negative.hateblo.jp/entry/2013/12/17/180022

年末進行その1。ビジネスやっているとなかなか書きたいことが書けないけどなんとか。

 

 

類似調査 調査方法や考え方はこちら

 

データ分析人材の年収分布を推定してみる (ビッグデータ人材の推定その2)

http://negative.hateblo.jp/entry/2013/08/20/154139

日本のビッグデータ関連の技術者数を推定してみる

http://negative.hateblo.jp/entry/2013/08/15/154627

 

当時よりもデータ蒐集できてレベルアップして、見えないところも見えるようになりました。もっと書きたいところだけれど、そうすると本業にしている領域がどんどん近づいてくるのが悩ましいです。

 

 

 

 

 

 

 

 

 

ビジネスやってる分析屋なのでブログからこれくらいわかりましたよという1実例

f:id:dsca:20131217182717j:plain

 

師走ですから軽く総括気味に。ブログやってみてわかったことをまとめておきます。もちろん話せる範囲ということでご勘弁ください。

 

データサイエンティスト界隈といってもほとんどソーシャルゲームとネット広告あたりの人っぽい

 

私の記事に反応してくれた人の傾向を常に調べています。というと気持ち悪くてごめんなさいね。別に何もしていませんけれど、職業などが分かる場合は、どういう人かくらいは見させてもらっています。といっても人力ではありません。私のソーシャルでの動きは無軌道のように見えてごめんなさいね。そのとおり。ボット作ってデータ集めています。で、それらの肩書傾向をまとめるとおおまかには

 

18.67% 情報サービス、システム開発やってるっぽい人

14.77% ネット広告やってるっぽい人

12.35% ソーシャルゲーム作ってるっぽい人

11.22% 学生

 9.64%  教育関係者

 7.58%  プログラマーっぽい人

・・・

 

になります。データサイエンティスト釣り堀として見ても、だいぶ業種が固定化されていますね。特定の連中だけが熱くて周囲は冷えている日本の業界事情に近しい感じです。やはりサイエンティストとか普遍的な称号いらなくて、言い方微妙だけどソーシャルゲームハッカーとか言ってたほうが差別化できるんじゃないの。そこを差別化できない方向であわせる必要ないと思うんですけども。

 

 

それなりに読まれる記事は配信される記事全体の3%程度。

 

これは私のブログに限らず、はてなやアメーバなど各種のブログ、各人の立ち上げるネットメディア全体で、です。paper.liやgunosyなどの業者の傾向を見てもそうであるように、その日に世に出たコンテンツ蒐集には限界があります。彼らはブックマークや、ツイート、いいね、特定のコンテンツ、などから辿っているだけであり、まったく網羅できていません。その結果、バズるかバズらないかの二極化が発生します。なので、かなり運の要素も強いです。運の要素を排除するにはやはり人的ネットワークなんですけど、一般人にはなかなか使えないワザでもあり。

 

で、今回の統計的には、読まれる記事は3%くらいです。なんとも悲しいですね。自分のことはさておいて、良質かどうよりも、タイミングやタイトルというだけでバズるかどうか決まるなんて実社会と同じですね。これはソーシャルから辿れる1000メディア強(含個人ブログ)、万単位記事を適当に巡回してだいたいわかったことです。1年かけてぼんやりやったので迷惑かけてなさそうということでお許しください。コンテンツの97%は何の話題にもならずに死蔵されるコンテンツです。0ツイート0いいね0ブクマがほとんどです。

 

 

各ソーシャルメディアの指標はもはやデフレに突入している

 

1ブックマーク、1いいね、1ツイート、いずれの価値も下落しています。調査の仕方は簡単です。ある程度のボリュームで年代別記事で総合計とって比較すれば良いだけです。なんのことはなくて、2011年度より2012年度が、2012年度より2013年度が、1ブックマーク、1いいね、1ツイート、を獲得しづらくなっているということです。相対的に価値が下落していると言ってよいでしょう。例えば、はてブでは、かつては1000overがザラでしたが、今ではあまり出現しません。ユーザーの減少と固定化が大きいと思います。このへんはもっと丁寧に言いたいテーマですが、私は提言までにしておきますのでどなたかぜひ。

 

 

検索エンジンに期待してはいけない けれどネガティブワードは長期的な効果あり

 

あいかわらず不平等すぎまして、キーワードによる補正ロジックが入っているようです。私のようにネガティブなんて言葉をタイトルに冠しているとペナルティで下がりまくります。SEO的に見ると「データサイエンティスト」では圏外ですが、「データサイエンティスト 消える」「データサイエンティスト 年収」なんかでは高いです。ようするに、これでどういう方にリーチできそうかだいたい予想できますね。統計的有意レベルで観測できていますが、このへんは別の成果物なので割愛します。ようするにポジティブワードだともはや検索順位が上がりづらいやりつくされた感ある世界ですが、ネガティブワードだと比較的簡単に上がるので長期的なアクセスが見込めます。ただし、ネガティブワードの持つラベリングに、当然ながらサイトの訪問者も引きづられているという制約があります。ニッチ戦略は王道ではありません。ネガティブだと陽のあたる道には出にくいです。

 

 

記事のアクセス増要因は、特定の誰が反応してくれるかが、ほぼすべて

 

私は制作ではないのでコンテンツ論しませんが、質や量や独自性やメッセージ性といったコンテンツの中身を語る以前に、ヒットするかどうかでもっと重要なことがあります。それが「誰に届くかどうかが圧倒的に重要」だということです。すでによくある結論かもしれません。そして今や、これがほぼすべてであり、アクセス数の増減に対する最大の寄与率を誇っています。例えばマスメディアの間違いにイチャモンをつけると、彼らは大変敏感なので動いてくれやすいとか、Twitterならばインフルエンサーとしてある人がリツイートすると確変してアクセス数が増えるとかです。あるいは界隈の有識者、例えば、このブログにとってならid:tjoさん(銀座で働くデータサイエンティストのブログ)です。同じような世界を見ていないと同じような問題意識にはなりません。そうではない多くのマジョリティと感覚がズレていたとしても、そういうことはあまり重要にならないです。そうしたマイノリティがどう思ってくれるかどうかが重要というのが、やはりマスメディアとネットメディアの全然違うところですね。

 

 

(一般的に)社会的立場の高めな人は情報共有しにくい

 

またソーシャル的には、社会的立場が高い人(必然的にマイノリティ)に向けて記事を書いても、それはまったくヒットしません。もちろん「おまえはどこの馬の骨だ」補正もありますけども。なぜかといえば、立場表明したくないからです。社会的立場の高い人は前向きな発言しかできないバイアスがあります。経営者が「ブラック企業はけしからん」というテーマの記事に「いいね」できるわけがありません。ブラック企業の経営者ではなくても明日は我が身的がありえるので、心理的にできません。これが実名の特徴です。このように「言いたいけれど言えない世界」というのは需要が見込めるので新しいフロンティアでしょうね。事実、私のように分析に対して皮肉の多い立場は、前向きに業界をアジテートしたい方々からは賛同されるわけがありません。しかし、それなりに需要はあるようです。役職がらみの誰得みたいな話や、データサイエンティスト名乗りたくない系の話は根強くアクセスがありますが、あまりソーシャルではバズりません。この発見は私にとっては一番の収穫でした。

 

 

 

以上、簡単に抽出したものを語りまして、世知辛さが伝わったかと思います。私がここで言いたいのは

 

分析屋なら、ブログを分析に使わないなんて、もったいなさすぎじゃないの

 

ということです。自分のだけじゃなくて他人のでもいいくらいで。データなんてものは、もちろん完全ではないですけど、ビジネスやってる分析屋ならば、マーケッターが主観で語るところを、少しは客観的に言うためのデータは採っておこうよということです。HDD1つに収まる程度のデータ量でした。

 

近年は、いつも手に入らないデータを、指くわえて見ている分析者を多くみかけます。スキルあるのにもったいないことです。そんなこと言ってないで、だったら自分でデータ蒐集しようぜ的な意思を持ったほうが良いです。ビジネスに限るならば、与えてくれるまで待っているスタンスには良いことありません。だから分析の参考書なんて読むくらいなら、まずは実戦してみようよ、と。

 

いいじゃないか、三流で・・・・速い三流なら上等よ!(参考 アカギ)

 

という暴論を吐いて勝手にハードル上げて、私も自滅しつつありますけども、それもいいでしょう。自滅します。ほんと蒐集1年は短いようで長かったです。

 

いつも文句ばっかりいってきてごめんなさいね。

 

 

続きもどうぞ

 

 (実務者向け)日本の、データ基盤系エンジニア人数と年収の推定してみた 2014予想

http://negative.hateblo.jp/entry/2013/12/18/180537

データ編です。年末進行その2。それなりに手間かけてます。

 

シネマアナリティクス2 : 過酷なソリッドシチュエーション、密室系マイナー映画の佳作5つ(洋画編)

前回 シネマアナリティクス : ゼロから分析力を磨きたい人に観てほしいマニアック映画5つ(洋画編)

http://negative.hateblo.jp/entry/2013/09/11/153406

 

お隣さんがウィルコクソンの順位和検定とマンホイットニーの順位和検定の違いについて熱く議論していたので、横からWilcoxon-Mann-Whitney検定は?と聞いたら、あっちへいけと言われました。なんとも過酷な職場です。世知辛い職場事情さておき、そこで今回は、こんな過酷な場所は嫌だという感じのソリッドシチュエーションな映画を紹介します。

 

映画ネタは別でやっとけよという話なんですけども、一応、このブログでそれをやる目的もあるのです。いずれ明らかにします。前回は、まとめ系ネットワークの勧誘だったり、無料で寄稿をお願いされたりと。でもそれはもう通過した道なんで、その節は、やる気がなくてごめんなさいね。私は店長がおごってくれる程度で十分です。アフィリエイトとか広告とかどうでもいいです。というほど達観しているわけではもちろんないので、本ブログに限ります。

 

分析が大好きなんて言う若気ないたりな方でも、もう10年以上も常態化したら、誰でもイヤになります。短期では「好きを仕事にする」のはやぶさかではありませんけど、長期では、好きごときの力だけでは仕事を続けることはできません。

 

そこで

気力はある。余力がない。それでも前を向く。

という名キャッチを拝借すれば

 

 

余力はある。気力がない。それで後ろを向く。(で、映画を見る、ゲームする)

 

 

仕事疲れにとって、映画とはカロリーの伴わない心身の回復手段というわけです。

これは経験談ですけども、そんなときポジティブな前向き映画はオススメできません。「俺もがんばらなきゃ」「あいつのようになってやる」「今度試してみよう」・・・すべて、さらなる、やる気と気力を要求されることウケアイです。スティーブ・ジョブスの成り上がり伝説を見て、返ってどんよりしてしまう感じ。「いや無理だよ」「どうせ俺なんてさ」と反動がやってきて、現状の解決できない不満や不安が増幅して、不貞寝や自棄食いして後悔するくらいなら、そんな前向きなの見ないほうがいいんですよ。

 

で、そこで登場するのがネガティブな気持ちになれる映画です。ざっくりいえば過酷な問題をつきつけられてアタフタする系の密室ドラマ、SF、サスペンス、ホラーあたりですね。その酷い状況やプレッシャー、不可解な状況にさらされる登場人物を見て、「あれよりはマシだな」「どうしようもねえ世界だな」「それに比べたら俺の苦労は幸せなほうさ」(←会社の思うツボさ)って思えることって大事なんですよ。

 

そういう意味で今回は、決められた状況設定というソリッドシチュエーションという映画をご紹介します。密室モノ、限定空間、箱庭劇です。その多くは、低予算のアイデア一発勝負という趣もあって新進気鋭の監督の登竜門で企画をひねったものが多いです。

 

こういう映画で、こういう問題設定があったとき、自分ならどうする?を考えるのも頭の体操とリラックスに良いと思います。ありえない展開すぎて登場人物にがっかりしたり、自分ならすぐゲームオーバーだったわとか、その展開はやっぱり予算の都合なの?とか脚本家は風呂敷を畳めなかったんだとか、映画という世相と離れたことを、あれこれ邪推するのもストレス発散になったりしてね。

 

このジャンルには大御所というか定番映画にはCUBE(2、0は微妙)やSAW(2以降は好きな人だけ見ればよし)とかがあるんですが、それをオススメしても普通すぎるので(他にESとかリミットとかフォーン・ブースなども)広く劇場公開された有名作品は除外しました。それ系の好きな方、冬の夜長にまったりハラハラ息詰まった感じになってみたい大人向けに、ソリッドシチュエーションの佳作(名作というほどではないけれども)映画5つほど、余計なお世話な感じで、ご紹介させていただければと思います。

  

 

f:id:dsca:20131204194901j:plain

 

第1位 アリス・クリードの失踪

錯綜する心理戦 

 

解説: 『ディセント2』などで脚本家としても活躍する新鋭、J・ブレイクソンが初監督を務めたクライムサスペンス。ある誘拐事件の犯人たちとその被害者が繰り広げる、人生を懸けた究極の心理劇を映し出す。タフなヒロインを、『007/慰めの報酬』のジェマ・アータートンが熱演。誘拐犯役の『シャーロック・ホームズ』のエディ・マーサン、『SWEET SIXTEEN』のマーティン・コムストンらと真っ向からぶつかり合う衝撃のドラマに目がくぎ付け。

 

あらすじ: 刑務所仲間のヴィック(エディ・マーサン)とダニー(マーティン・コムストン)は、着々と誘拐の準備を進めていく。新聞でダーゲットを富豪の娘アリス(ジェマ・アータートン)に決めた2人は、白昼堂々彼女を路上で連れ去る。アリスは準備されたアパートの一室に運び込まれ、ベッドに両手両足を縛り付けられ身動きが取れなくなる。

 http://info.movies.yahoo.co.jp/detail/tydt/id339380/

 

三者三様の人間模様。個人的にも好きな映画の一つです。途中から密室劇でもなくなっていますが、登場人物が3人しかいないのでとても箱庭感あります。特に、この映画の抱える問題というか、問題が問題を呼びおこすネガティブスパイラルな脚本が秀逸でして、人間の抱える上っ面と、内に秘めた思惑の違いといいますか、隠されたものを明らかにせざるをえない状況を作り出せています。実社会では利害対立は茶飯事ですが、あれこれ振り向いてばかりいると、どうなってしまうのか、折り合いはつくのか、そういう振る舞いをする劇中の登場人物への好感度は大人の合わせ鏡のようにも思えます。百聞は一件に如かず、でオススメです。

 

 

f:id:dsca:20101010183339j:plain

 

第2位 YES/NO イエス・ノー

結婚に関する仮想実験

 

解説: 『[リミット]』『ATM』などを手掛けたプロデューサー、ピーター・サフランが名を連ねたシチュエーション・スリラー。別々に密室へと監禁された夫婦が、見知らぬ者からの異様で不条理な詰問を受けていくうちに、隠されていた本性が暴かれ、お互いへの思いが試されていく。監督はイタリア出身の新鋭、エンリコ・クレリコ・ナジーノ。テレビドラマ「デクスター ~警察官は殺人鬼」のジョン・ブラザートンらが出演。謎が謎を呼ぶ先読み不可能な展開もさることながら、極限状況下に置かれた夫婦の愛と絆をめぐるドラマにも手に汗握る。

 

あらすじ: ドアも窓もない不気味な密室で目を覚ましたジャック(ジョン・ブラザートン)。自ら部屋に入ったのか、誰かに連れられてきたのかもわからずに混乱する中、彼は壁にイエスとノーを意味するYとNが記されたボタンを発見。さらに、壁一面に自分と同じような部屋に閉じ込められている妻ケイト(エレン・ホルマン)の姿を捉えた映像が映し出される。やがて、夫婦それぞれに見知らぬ人物から「ジャックを愛していますか?」「ケイトは浮気をしましたか?」などという質問がぶつけられ、ボタンでの回答を迫られる。

http://info.movies.yahoo.co.jp/detail/tymv/id345251/

  

上辺だけのつきあいで結婚してしまった男と女に真実を問う過酷な質問が繰り返されます。監督の前作ATMより熟れて安定しています。偉大な師の含蓄ある意見ですが「能力とは、期待値の話であって、成功確率の話ではない。仕事をうまく運びたいのなら、良い家庭を築いている男を選べ。」というのがあります。なので、この映画の登場人物には仕事頼めないと思いました。登場人物が良い家庭を築けそうに思えません。夫婦だからといってお互いの秘密を完全に共有する必要があるのかどうか。この映画はそういう実験映画です。映画より自分ならどうだろうという視点でどうぞ。

 

 

f:id:dsca:20131204195357j:plain

 

第3位 エグザム

ひねりすぎの入社試験

 

解説: 合格すれば死ぬまで年俸1億円という大企業の最終就職試験に残った8人の男女が、壮絶な頭脳戦を繰り広げるサバイバル・サスペンス。密室で80分の制限時間の中、超難関試験に挑む受験者たちを『28日後…』のルーク・マブリー、『ジャンパー』のナタリー・コックスらが熱演する。監督は、本作で長編監督デビューを果たすイギリスの新鋭脚本家スチュアート・ヘイゼルダイン。たった一つの雇用枠を賭けた究極のサバイバルの行方から目が離せない。

 

あらすじ: 合格すれば死ぬまで年俸1億円という大手企業の最終就職試験に残った8人の男女。武装した警備員が監視する密室で、試験監督から3つのルールを告げられ問題に取り掛かろうと用紙を裏返すと、問題用紙は白紙だった。80分という制限時間の中、受験者たちは手を組んだりだまし合ったりして、試験の問題と答えを見つけ出そうとするが……。

http://info.movies.yahoo.co.jp/detail/tymv/id336878/

 

過酷すぎる入社試験に学費かかっていそうなエリート君達が翻弄されます。我こそは超一流の人材だという自己アピールするくせに、使命と待遇が分離しているあたりが二流っぽくて、自己中心的で魅力がまるでないキャラクターに逆にリアリティを感じさせます。プロフェッショナルであるべきところ、口先ばかりの偽エリートを多くみかける私の偏見はさておきまして、人間は口じゃなくて頭と手を動かさなきゃダメですよ。というのがよくわかります。なお、こういう入社試験より、もっとエグい選考が実社会にはあったりするらしいのでご注意ください。

 

 

f:id:dsca:20131204195736j:plain

 

第4位 ブレーキ

ありえない機密保持契約

 

解説: 疾走する車のトランクの中で特殊な箱に閉じ込められ、次々と予測不能なトラップに襲われるシークレットサービスの運命を描いたシチュエーション・スリラー。主演を『ブレイド』『SOMEWHERE』のスティーヴン・ドーフが務め、『インセプション』のトム・ベレンジャーが共演。逃げ場のない密室空間、4分ごとにさまざまな攻撃が加えられる状況で主人公がどのように戦い、脱出することができるのか、スリリングな展開に最後まで目が離せない。

 

あらすじ: 何者かによって誘拐されてしまったシークレットサービスのジェレミー(スティーヴン・ドーフ)は、目覚めると、車のトランクに設置された箱の中に閉じ込められていた。箱には恐ろしいトラップが仕掛けられ、デジタル時計が4分を刻むごとにさまざまな攻撃が加えられる。執拗(しつよう)に繰り返される死の恐怖から逃れようとするジェレミーを追い詰める誘拐犯の目的とは……。

http://info.movies.yahoo.co.jp/detail/tydt/id342245/

 

棺に閉じ込められるリミットっぽい映画のようですが違います。物販を除いて会社と会社が結ぶ最初の書類。それは機密保持契約(NDA)でしょう。私はそれに懐疑的な立場です。紳士協定でしかなく効力を感じないところが特に。この主人公(ブレイドではイケメンだったS・ドーフが年を重ねてダメ人間となって好演するのもよい)も、さらに過酷な環境で奮闘します。といっても、こんなブラック企業だったり陰謀に巻き込まれたら誰でも契約なんて破棄するわという話なんですが、あれこれ無理だけどなんとかなっちゃうジョジョっぽい展開が多いので、そういうのが好きな方にオススメです。

 

 

f:id:dsca:20131204195947j:plain

 

第5位 ヘッドハント

疑われたら疑りかえす執念

 

解説: 閉鎖されたオフィスに監禁され、自由を奪われた6人の男女が体験する恐怖を描くシチュエーション・スリラー。5回ミスをするとクビ(死)が待ち受ける過酷な状況の中、オフィスを牛耳る男に罪を着せた真犯人を捜し出すという業務を、強制的に命じられた従業員たちのサバイバルが展開。自らの殺人容疑を晴らすため究極の業務を命じる男を、『アブノーマル』のニコラス・ホープが怪演し、特殊メイクをスプラッタ・ホラーの巨匠トム・サヴィーニが手掛ける。

 

あらすじ: 薄暗いオフィスに監禁され自由を奪われた6人の男女の前に、社長のトーマス・レッドマン(ニコラス・ホープ)と名乗る男が現われる。連続殺人犯として投獄されていた彼の無実を証明し、彼に罪を着せた真犯人を探し出すよう業務を言い渡す。ミスをするたびにナイフで額を傷つけられ、ミスが5回になるとクビ切り(死)という過酷な状況の中、6人はさまざまな方法で捜査を開始する。

http://info.movies.yahoo.co.jp/detail/tydt/id343832/

 

これだけ、もろにB級ホラーです。苦手な人は気をつけて!しかし、エグザムとは違ってホラーでないと表現できない隠れた佳作で、企画で投げっぱなしにしていない姿勢が評価できます。濡れ衣から始まる監禁系オフィスワーク。嫌すぎる仕事が続き、失敗したら罰ゲーム、何回かミスったらゲームオーバー、そしてその脱出の鍵はオフィス内にはない。という意図された比喩が社会の縮図です。巻き込まれる小市民にとっては迷惑すぎますが、異常な執念が結果的に実るというのもホラーにしては珍しいメッセージなのです。

 

 

おまけ 次点 +5 作品

 

 

f:id:dsca:20131204200430j:plain

 

マインドハンター

http://info.movies.yahoo.co.jp/detail/tymv/id324175/

心理分析官試験な孤島で起きるサスペンスの佳作です。頭の良い感じめな犯人との心理分析官候補のトリック合戦が好きです。バル・キルマーとスレイターはちょい役で弱すぎ。

 

f:id:dsca:20131204200833j:plain

 

タワーブロック

http://info.movies.yahoo.co.jp/detail/tymv/id343441/

 

狙撃犯がビルに閉じこもった住民を狙って脱出不能になるサバイバルゲーム。ゲーム感覚な展開が好きな方向け。主人公おばさんの覚醒っぷりが私のツボでした。

 

f:id:dsca:20131204201040j:plain

 

TEST10 テスト10

http://info.movies.yahoo.co.jp/detail/tymv/id342353/

 

隠れた佳作。精力全開のイケイケな若者達が巻き込まれる最悪のバイト。薬品試験で人間は羞恥心がなくなるとゾンビと同じ(=欲望のままだから)でしかないというテーマが映画的に深くて最高。惜しむらくは欧米では、クリント・イーストウッドの同名作品にSEO的に消されてしまったのが悲哀。

 

 

f:id:dsca:20131204201220j:plain

 

スルース

http://info.movies.yahoo.co.jp/detail/tydt/id329519/

 

密室系サスペンス。旧作のほうが好きですが、やっぱり会話劇、駆け引きだけで楽しめる心理戦は良いです。これもジョジョっぽい展開で脳内再生されてしまいます。

 

 

f:id:dsca:20120928114057j:plain

 

パーフェクト・トラップ

http://info.movies.yahoo.co.jp/detail/tymv/id346017/

 

ワナオトコの続編だけどこれだけで見れます。SAW好き(完璧な1を除いた2以降も許容できる)方向けです。なぜか後半になると予算の都合からなのか、男らしい展開も多く、ヒーローは拳で語るのも好感です。

 

 

番外 密室オカルト編

 

f:id:dsca:20131204201337j:plain

 

1408号室

http://info.movies.yahoo.co.jp/detail/tydt/id328191/

密室だけどなんでもアリです。次々起きる怪奇現象に、主人公がダメだコリャ連発している長さんに見えて仕方ないんですよね。ということでアダルト版ドリフ認定。

 

 

ということで、私がオススメしたいことは(映画に限らずですが)ようするに

 

後ろ向いて、後退すれば、前進したことになるんです。

 

でも、重苦しいのが苦手だったり、(私はいけると思うけど)そうでもなかったりしたら、ごめんなさいね。 

データ分析する人が、なぜデータサイエンティストやビッグデータのブームに乗りたくないのか(続きです)

前回は、人気のないテーマだと思うけどデータベーストンガリスト向けに・・・というテーマでしたが、思わぬ反応いただけてありがたいです。今回は懲りずに前回の続きです。もちろん異論は認めまくります。今回もかなり了見の狭い内容なのでごめんなさい。

 

データサイエンティストはセクシー職業NO1だとか、あまりに現実離れした妄想と夢想が入り混じった2013年初頭からの風潮、怒りと気持ち悪さを禁じえませんでした。何度も燃え尽きがちな私にとって、このブログは、それで「データサイエンティストがこれから10年以内に消える理由3つ」を書いたのが始まりでした。そりゃあね、「ネガティブ」だとか「消える」とか、ネガティブワードはSEO的には長期的に不利なのわかっていましたよ。今でも検索エンジンには嫌われてばかり。裏もかけますけども。

 

 で、

 

もちろん、現場の人は真面目にやってるし、インタビュー受けてる人だって昔からやっている真面目な人が多いでしょう。ただ、メディアに持ち上げられて、プロモーションの一環としてか、新興企業や大学発ベンチャーなんかの出来たてほやほやで、弊社にはたくさんのデータサイエンティストがいます!と最初から名乗られると微妙な気分です。いやまったく社会経験なくたって名乗っていいんですよ。別に称号なんてものはどうでもいいです。ただ、含意の言葉がよくないんですよ。やっぱりサイエンティストという伝統的に敷居の高い言葉に引っかかってしまってダメなんです。研究経験のない者を自称でもサイエンティストとは呼ぶのはどうなのよとなる。それだけ別な意味で理不尽なほどに要件高いのがアカデミックなんだし、そんな世界に価値感じない人にとっては、なんで自分の仕事をサイエンティスト扱いされなきゃいけないのよという話だし。

 

差別化の必要なビジネスに、純粋な意味では差別化ではなく普遍化を担うサイエンティストは貢献しにくいのも知っています。やはりビジネス現場でサイエンティストいうのも違うんじゃないのとも。だから外野から見ていると、なにこれ?名乗った者勝ち?なんにでも2.0つけちゃえば新しく見える時代の再来?かと思うようになりました。

 

もっとやばいのはメディアです。当時、持ち上げるメディアのほとんどが、ユビキタスがー、クラウドがー、にもう飽きてきたから、次の希望を焚きつけるネタにさせてくれ感ありあり、でした。そのメディアの飢餓感に、危機感を持ちました。だって言ってる言説めちゃくちゃなところが多いんです。やらないと企業は死ぬみたいな論調とか、世界を救うセクシーナンバーワンの人材だとか、そりゃあ傲慢すぎるでしょうよ。でもって、人材紹介会社はデータサイエンティストをたくさん紹介してくれます。新しい職種とか言っているわりに、もうこんなにたくさん紹介してくれるんですか、と。

 

そういったお花畑を遠くで見れば、おーい、そのせいで死にそうなのは、こっちだぞー、と乾いた目にもなるというものです。

 

当時の流れで、なんでもかんでもaasしとけばいいじゃないの?Daasとか言ってなかったっけ(←Data as a serviceじゃなくてDesktop as a serviceですが)ビッグデータならPlatform as a dataとかbigdataになるんかね。Paad。ダサそうだから言われないのかね。

 

と、スルーできなかったのは、古い話ですが、傑作である宮部みゆき「模倣犯」の映画がまったく原作と違っていたように、後から、どんどん別物に仕上がっていくかのような何かこう、ザワザワとした気持ちになったからです。いろんな人が「すでに、もともと、そうしている企業、データ扱っている企業」を例にとって、あれやこれやと騒ぎ始めました。そういうのって昔ながらのベストプラクティスであって、データサイエンスちがうでしょ。先進的な企業も言われたくないと思うんだけど。それを遅れて政府や大学が反応するという毎度の流れ。これもやばいなと思ったのは、評価されずに虐げられてきた分析屋、研究者、数学屋、統計屋、大量処理スト、インフラ屋、マーケッター、ただの分析オタクらのルサンチマンを、このビッグデータとデータサイエンティストが背負っているように見えたことです。だって「データ」と「サイエンス」ですよ。すべてを包含するかのようなビッグワードすぎて各人の投影するものが違いすぎます。

 

長々と書きましたが、これらを究極的に要約しますと、

  

カリスマ美容師ブームのときに、床屋のおじさんがアホらしいとボヤく感覚に近いもの、を感じたわけです。

 

物事には、人がよってたかって改良してしまう場合と、人がよってたかって改悪してしまう場合がありえますが、その分岐点の一つは、その当事者が少ないことです。実体を知らない外野が多いことが成否の分水嶺です。ご多分に漏れず、これは外野が多くて失敗する後者に思いました。そんなにできる人数もいないと思っているからです。有象無象が集まって、このデータ土方と言える仕事が改善されるとは思えませんでした。

 

そこで土木業を営む知人の言葉ですが、「自分の設計した家に一度も住んだこともない一級建築士さんに、現場の鉄筋コンクリートの魔術師が真実を教えてやんよ。」という気概です。

 

もっといえば

 

 【算数】夢見るデータサイエンティスト君に、1個70円のりんごと1個30円のみかんを握り潰してこう言いました。「次はお前がこうなる番だ」

 

です。

 

ITやWebの場合は、もう米国追従は基本パターンであり、日本の悲しくどうしようもない習性(日本発のこの手の概念が未だに一つもないことが証拠です)なので仕方ないとは思いますよ。でもね、夢と希望を、職業に求めて、未来の貴重な時間と資源を捧げていくのだから、少しは実体を知らしめておこうよ。それでも覚悟ある奴はいつでもいらっしゃい、というのが現場の分析屋のせいぜいできること。

 

サラバしたり養成したり書評したり必要なスキルいったり、そういう啓蒙活動する偉人である実戦派の方々のおかげで、そういったお花畑的な論調が消えつつあるのは実に喜ばしいことです。統計最強学問の方だって主旨は違うのに、編者に変なタイトルつけられた最強学問になったと知ったときは、もうほんと可哀想です。編集は著者より、ぜんぜん考えていないくせにコントロールしたがりますからね。編者のつけたタイトルで著者が叩かれるのはやめてほしいです。

 

「Sexy Little Numbers」がなんで「データ・サイエンティストに学ぶ「分析力」 ビッグデータからビジネス・チャンスをつかむ」になるんだよ。データサイエンティストとか恣意的に付け足してんじゃねーよ。それにbig じゃなくてlittleだってば。 「Super Crunchers: Why Thinking-by-Numbers Is the New Way to Be Smart」がなんで「その数学が戦略を決める」になるんだよ。どっちの著者も、そんなこと書いてないでしょ、出版社は反省してください。あんたらがヘボいタイトルつけて、歪めてどうすんの。

 

このように日本においては、データサイエンティストやビッグデータという言葉は、世知辛い現場と、お花畑メディアの認識の差が、かなり離れているのです。

 

米国や英語圏のそれと明らかに違ってきています。そこが違和感の正体なんです。大きな要因の一つは言語バリアです。なぜなら米国にはデータサイエンティストはセクシーNO1の言い出しっぺとかのロールモデルとなる企業がいますが、日本には、そういった企業がほとんどありません。その手の米国企業の日本法人を見ても、大事な開発はすべて国外(日本にあるのは事務所と倉庫くらいです)であり、日本のそれはほとんど営業拠点でしかないわけですから、その会社に入社しても学べません。あの企業を真似して学びましょうと簡単にはできないのです。今までと違うのは、それがルールでもコンテンツでもファッションでも素材や燃料でもない、システムそのものだから、輸入しにくいのです。Country別に社会インフラや法整備の事情も異なります。だから人材のルサンチマンとIT投資における閉塞感も相まって、過分な期待と妄想が入ってしまうのです。もちろん良い風に独自に変わっていけば問題ないですがね。国内企業なのに社内英語しゃべろうというのはそれの苦肉の策です。ああ、日本の企業が学ぶ先が、日本の企業にいないってことだよなと思います。トップ企業ならなおさらね。

 

会社や仕事内容、組織構造がまるでそうでない成り立ちだというのに、テクノロジーと最新の理屈だけが(海外を追いかけろと)先へ先へといこうとする。

 

それが何を生み出すのか、想像つきますよね。そう、いくらやっても終わらない(儲かりにくい)仕事のための仕事と、無駄な管理の軋轢が増えるだけ。長期的には日本の企業体力を奪ってしまいます。いくつかある世界が学びたくなる日本固有の素晴らしい会社はそんなことしてませんよ。そんなにUSを真似したいですかね。あなたの理想はあちらにもきっとありませんよ。

 

例えば、分析のわからない経営者やマネージャーは、高度な分析なんて評価できませんから、あれこれドキュメントだと叫びますよ。わかりきったことです。わからないから理解させてくれと言います。けれど、ほとんどの場合、ドキュメント読みませんし、理解させたからといって何にもなりません。逆に、高度な分析がわかりすぎる経営者とかマネージャーがいたらどうでしょう?もっと大変ですよね。本来は混沌と変動しているビジネスに、論理を炊きつけて無理解になって失敗する可能性が高くなります。だから企業はビジネス貢献で考えるしかないのだし、企業は競争力に結びつきにくい研究者養成所でもないんだから。そうした企業に翻弄された近年の基礎研究者は可哀想でしょう。

 

リモートで仕事できない組織体制(これは政府も整備がおろそかだと思いますが)なのに、チャットルームや社内SNSだけ作って、実際は同じフロアで会話したりとかするから廃れるんですよ。(←やつあたりでごめんなさい)

  

まともな会社だって、少なくとも今までは食えるシステムによって成り立ってきたわけで、そんなに簡単にビッグデータでガンガンいこうぜ組織になんて変われるわけないんです。だから、あんまりブームに惑わされず、他社と同じことなんて追いかけてないで、独自の価値を創り出す方向へ進みましょう。大量処理が、機械学習が、人材の枯渇が、本当に問題ですか。本当は見たくないところを見ないようにして、何か改善したように見える方向を模索しているだけなんじゃないですか。

 

 それを直接、個人が指摘すれば嫌われると思います。そういうときこそ「だって分析だとこうなんだから(私に言っても仕方ないんだから)なんとかしようよ」と嫌な感じだけど、指摘して、地道に修正していくことが、ビジネスのために本当に分析という行為が役立てるところだと思っています。大量のリソース投入して「そんなの知っているよ」とか言われたら未来ないですよ。実体と離れすぎてませんかね。 

 

 

いつも文句ばっかりいってごめんなさいね。

 

 

 

 

 関連記事

 

前編 データ分析する人が、なぜデータサイエンティストと呼ばれたくないのか

http://negative.hateblo.jp/entry/2013/11/15/213045

前編です。文句ばっかりでごめんなさい。 

 

データサイエンティストがこれから10年以内に消える理由3つ

http://negative.hateblo.jp/entry/2013/05/10/174047

もう隔世の感ありますが

 

 

次回は理由あって懲りずに映画ネタしたいと思います。

 

データ分析する人が、なぜデータサイエンティストと呼ばれたくないのか 

※コラ画像削除しました

 

ビッグデータ、データサイエンティスト、そろそろ過渡期ブームも終わりつつあるように見えてきたのは結構なことです。なので私はデータベース・トンガリストに鞍替えします。嘘です。行けませんでしたがマニアックなDB話を聞きたかったです。

 

どっちにしても普通に粛々とやるしかないんすから騒いでも絶望しても仕方ないんですよ。実務してない奴ほど騒ぐもの。(←非常に見識の狭いダメ発言)

 

日頃、扱っているデータ。それビッグデータでしょ、と言われるだけで、やる気がなくなる昨今。スモールデータでもいい(←それこそが重要ですよね)と思うし、何度も繰り返される、「いままで1ヶ月かかってたデータを1日にしました」とか言う話も、ビッグデータと関係ないんじゃないの、単に多段承認フローというかステークホルダー減らしただけではと思ったりしますよね。逆にそっちのほうがすごいと思うんだけども。

 

で、ビッグデータのビッグってなんなのよ?Wikipediaなどによると

 

市販されているデータベース管理ツールや従来のデータ処理アプリケーションで処理することが困難なほど巨大で複雑な データ集合の集積物を表す用語

 

らしい。

 

それなら、簡単に取り扱えるのならビッグデータじゃないのでは?という素朴な疑問がでてきます。例えば日頃、自分が扱っているデータは100TBくらいです。もちろん刺し身タンポポな大量処理も含むので一概にデータ量だけで比較してはいけませんけれども、著名なデータサイエンティストな方がいじってるデータが10GBくらいで「やべー、Rじゃ、扱えねえよ」とか言ってるくらいだったら、やっぱりビッグデータだの言ってちゃいけないんじゃないのと思うんですよ。いや、それならデータサイエンティストって名乗るほうが違うだろって話かもしれませんけども。普通にアナリスト名乗っていれば、あの人は量より質の人だからねと思われて違和感ないのにね。大量処理できる人ってイメージいらないんじゃないですかね。

 

それはエンジニアの仕事としか思えないですし。サイエンスというには力技が多すぎる感じもして。HadoopとJAVAで格闘する前に、いい感じでログ取り込めておけばいいだけなんじゃないんですかねーとかのローテク解決こそ大事だし、分散I/Oやストリーム処理って素晴らしいけれど、それだってインメモリデータベース作ってガンガン処理すれば用なしのケースも多いと思うよというハイテクの解決もありだし。そう思ってしまう根っこには、こんなの昔から、大規模システムがー、ミッションクリティカルがー、とか言ってたことだからです。

 

なので、それを扱うのが、データサイエンティストだとか言われても嬉しくないんですよね。うるせーよ、そんなの前からやっているし、新技術だって渋々だけど試しては苦労して取り込んできたんだよ、それと今の何が違うんだ、遅れてきた再ラベリングしてダサくしてどうするんだ的な感覚がどうしてもあります。(←大変度量の狭い発言ごめんなさい)

 

どうせ米国発&提唱の消えゆくバズワードなんだし、そんなのもので勝手に定義してほしくないのです。ほんと仕事しない人ほど、職掌定義が好きですからね。管理のための管理コストばっかり増やしたがる。それも決まってシステム化できない方向に増やしたがる。定量じゃなくて定性で増やしたがる。たとえ現場の人はそう思っていなくても、ネタほしさに食らいつくメディアが、御用学者が持ち上げてしまうために、時代に消費されて消え去る徒花になってしまうってのもなんだか儚いですね。 

 

ようするに

  

そんなバズワードの消費と衰退とともに、個人のキャリアやスキルの賞味期限すら尽きちゃうかのようでしょう。称号なんてものは。

  

そう呼ばれたくない人の気持ちには、そういうナイーブなところが大きいと思います。セルフブランディングとかそういうことじゃなくて、もっと自己一貫性(分析や論理には必要なことです)に基づいた、かなり業務に内在化したものです。知人によれば、リーン・スタートアップとか頻繁にピボット(方向転換)しようみたいな尻軽っぽい話って、真面目に仕事している人ほど、経営者にそう言われてアホらしいそうです。これと似たようなものです。

 

あっというまに過去の遺跡になってしまったセカンドライフ。その全盛期、その第一人者扱いされて、テレビに出るほど人気のビジネス的にはかなり剛気なおじさんがいました。残念ながらブームの終焉後、彼は体も壊してリアルライフも終わってしまいました。その彼の生前に語ってくれたこととして思い出すのですが、世の中に不必要とされる苦しみを切々と語ってくれました。大変優秀な方でしたが、もう世間は彼をセカンドライフの男としてしか見てくれなくなっていたのです。軽く男泣きして語るその姿に、たまたま居合わせた私も、なんとも居た堪れない空気だったことを覚えています。掲げた看板の不幸かもしれませんが、いろんなメディアで嬉々として語っていたのに、価値の暴落もあっという間でした。

 

そういった栄枯盛衰を見るにつけ、調子の良いときなんてどうでもよくて、調子の悪いときにどうするかを考えるようになりました。人気があるときに寄ってくる人じゃなくて、人気のないときに会ってくれる人を探すようになったり、10人に嫌われても、好きな1人に好かれるにはどうしたらいいかを考えたり。ネガティブすぎるとも言われましたけど、そうでもないのです。自分は自分の視点でデータやデータを通して社会を見ているだけなんです。分析屋ですからね。多数派と同じような視点じゃ存在意義ないんです。

 

ということで、その行く末を予想するには良い材料が落ちています。それはソフトウェアアーキテクトです。その呼び名も、マトリックス・リローデッドあたりの「アーキテクト(設計者)」に使われたりしたあたりが最高潮で、やはり称号が消費されて消えましたよね。そういや新世紀エバンジェリストって肩書はアニメと関係なさそうですね。今でも誰か名乗ってるんですかね。でも、もうアーキテクトに俺はなる!って聞かれないですよね。当時から名刺交換の遭遇率も極端に低かったですけども。

 

ITアーキテクト育成ハンドブック

 

建築業界に右ならえでアーキテクトって職種が生まれました。そして、これが策定されたのが2007。たったの6年前よ。

これら先人の遺産で、栄枯盛衰を味わってみてください。一体なんだったのかと。そして、今のデータサイエンティストの教育ビジネスだ、スキル定義だ、資格化だ、といったビジネスやコミュニティといった組織化の流れがどういう結末を迎えそうか、想いを馳せてみてください。分析屋はデータ、つまり過去に学ぶ者です。大量のサンプルがないのなら少ない事例から濃く学ぶしかないのですし。

 

私は知識労働であるほど、組織化、規格化に手をつけるべきではないと思っています。

 

そんな仕事いらないです。流動性の高い競争社会においては、型にはめて、定義するようになったら、衰退が待っているだけですよ。定義しようとするその枠ですらどんどん変動していくと気付くべきです。一部の法律がそうであって機能していないように、です。だから、優れたエンジニア、分析屋、研究者やら芸術家らを定義できる=量産できると思ったら大間違いです。実体ないのに景気改善したことになる経済と同じ轍を踏んではいけないと思います。経済より人は変わりにくいのでなおさらです。

 

とはいえ、いずれにしても世の中は止まらないでしょうから、ビッグデータもデータサイエンティストも衰退して、次はどういった再ラベル付けがされるのか世俗的には楽しみでもあります。グロース・ハッカーも微妙だし、やっぱりデータベーストンガリスト・・・は違うな。

 

分析屋も、エンジニアも、寿命の長い呼称を求めています。自分の仕事(を続けたいと思っている人なら)と同じように、です。

 

データサイエンティストなんて、データからも、サイエンスからも、どっちから見ても儚そうな呼称、好きじゃないんです。そもそも両端の定義すらないんだから、無理矢理、真ん中に座する概念なんて作って煽らないでほしいところです。データサイエンス言わんでもサイエンスはもともとデータ必須だし、データドリブンマーケティングなんつって、今まではそうじゃなかったの?という話ではないでしょうか。(←やつあたりごめんなさい)

 

文句ばっかり言ってごめんなさいね。

Â