ラベル research の投稿を表示しています。 すべての投稿を表示
ラベル research の投稿を表示しています。 すべての投稿を表示

2009年9月10日木曜日

研究者の仕事術 - 「いかに働き、いかに生きるか」

「いかに働き、いかに生きるか」

やるべきことが見えてくる研究者の仕事術―プロフェッショナル根性論

最初は「研究者」のための本かと思って購入したのですが、そんなことはありませんでした。会社や組織に縛られて不自由な思いをしていたとしても、自分の人生にとって大切なことはしっかりものにするためのエッセンスが見事に凝縮されています。
研究者として仕事をすべき10の原則
「興味を持てる得意分野を発見する」
「最初は自分で学ぶ」
「師匠を持つ」
「現場で恥をかく」
「失敗を恐れつつも、果敢に挑戦する」
「自分の世界で一番になり成功体験を得る」
「研究者としての自信をつける」
「井の中の蛙であったことに気付き、打ちのめされる」
「すべてを知ることはできないことを理解する」
「それでも、自分の新しい見識を常に世に問うていく」
一見当たり前のようでも、自らが紆余曲折を経てこの原則に辿りつくことの大切さは、研究者として共感できるところが多いです。この本のタイトルが、「研究者のための仕事術」ではなく「研究者の仕事術」となっているように、研究者の仕事の仕方を垣間見ることで、研究者以外の人にもぜひ知ってほしい考え方が詰まっています。

ネットでアメリカの有名大学の講義が視聴できるようになった今、なぜ大学や、PhDが必要なのか?こんな素朴な疑問への答えもここにあります。スキルを身につけるための設備を提供するインフラという意味もありますが、もっと大切なことは「人間的成長」の機会を与える場としての大学の役割です。サーチエンジンの力で目的の知識に辿りつくためのパスは短くなったとしても、この本にあるような、自身の「人間的成長」は、段階を踏んでひとつひとつ登っていかなければなりません。

山積みになるタスク、環境の変化に対する恐れをどう克服するか。自己表現のためのプレゼンテーション力や英語力とは何か。このエントリも、本書のブログをいかに書くかという意見に触発されて書いています。

恐らく島岡先生自身の、Cell, Nature, ScienceにPI(Principal Investigator:主任研究者)としてFirst Authorの論文を一本、指導者としてLast Authorで一本という「成功体験」があるからこそ書ける本ですが、その業績に奢ることなく、不安と闘いながらも「一番」を目指して常に勝負し続けている姿がうかがえます。僕自身も、勝負に出ようとしていたり、壁にぶちあたったり、といろいろあるのですが、この本のメッセージがとても励みになっていて、良いタイミングで読めたことに感謝しています。

最初178ページで2,940円という設定に驚きましたが、内容をみると至極納得。このテーマの自己啓発本としては、本当に大事なことが集約されている一冊です。

関連

2009年8月3日月曜日

ゲノムひろば2009 in アキバ


ゲノムひろば2009 in アキバ」に家族で遊びに行ってきました。写真はたまねぎをすりおろしてゲノムを採取する実験の様子。きらきらの糸状のものがゲノム(の束)らしいです。肉眼で見えるくらいまとまるとは。すごいすごい。

2009年7月31日金曜日

あなたのやる気を引きだす3つのレンズ

(昔、Harvard Business Reviewに乗っていた記事の引用。Manage Your Energy Instead of Time and Rejuvenate。仕事に対する見方をスイッチし、やる気をコントロールするのに便利。あとで訳します)

Emotional Energy
  • Defuse negative emotions— irritability, impatience, anxiety, insecurity— through deep abdominal breathing.
  • Fuel positive emotions in yourself and others by regularly expressing appreciation to others in detailed, specific terms through notes, emails, calls, or conversations
  • Look at upsetting situations through new lenses. For example ...
  1. Adopt a “reverse lens” to ask, “What would the other person in this conflict say, and how might he be right?”
  2. Use a “long lens” to ask, “How will I likely view this situation in six months?”
  3. Employ a “wide lens” to ask, “How can I grow and learn from this situation?”

2009年6月25日木曜日

ウェブ時代に成果をあげるための心得

ウェブ時代において、質の高い仕事をし、大きな成果をあげようとする人のための心得:
  • 面白いからといってやみくもに読むのはやめなさい。ウェブでは、あなたが読むよりも速く情報が増殖していく
  • 人の目を介して編集された 質の高い文章を読むようにしなさい
  • 人生は短い。多くの意見を聞くのではなく、少数の、物事を深く考えよく洗練された人と議論すること

(1996年にチューリング賞を受賞した、Amir Pnueliの言葉だそうです)

2009年4月1日水曜日

論文の先にあるもの

研究が論文を書いて終わりでないなら、こんな心配をする必要はないはず。
自明なことを述べた論文は掲載されない(中略)「原理が複雑であまり便利でないシステム」の方が論文として 発表されやすくなってしまう
論文査読のシステムでは、確かに、査読者のめぐりあわせ次第で、重要な技術でも適切に評価されないことがある。けれど、もし本当に便利でないのならば、将来的に引用されることもなく、実用化もされず、論文の海の中に埋没するだけではないだろうか。

本当に便利なものだけを学会・論文誌に載せたい心情は理解できるが、実際、技術の本当の便利さがわかるのは、研究の結果が世に出てからのこと。つまり、便利さや将来的な世の中へのインパクトというのは、未来に起こる話であって、研究成果を発表する時点でそれを実証せよというはなんとも酷なように感じる。
(査読で便利なシステムを取り上げられない)問題を解決するのは簡単で、 論文の発表とその評価を分けてしまえば良い。 論文を書いたらすぐそれをWebにアップし、読者に評価をまかせてしまうわけである。
Google Scholarで調べられるような論文の引用数や、ビジネスなどへの実用化という観点からみると、現行の査読システムでも、既にこの機能はうまく働いているように思う。最近では論文のダウンロード数なんて指標も使える。けれど、査読なしでオープン評価の方式を採った場合、著者自身が既にある程度注目を集めている人でないと、Webに公開しただけで読んでもらえたり、重要さを理解してもらうのは相当難しい。これでは、Webで目立つ人の論文ばかりが取り上げられ、「本当に便利な研究」を拾い上げる方向にはつながりそうもない。

増井さんのエントリには、おそらく無意識のうちに、研究のゴールを「論文を学会・論文誌で発表すること」に据えている様子が見え隠れする。(増井さんは、本棚.orgなどのサービスを動かしていたりと、論文を書いた後の実用性までちゃんと意識していることはよくわかるのだけれど)

世の中への貢献を意識せず、「論文を書けば、誰かが読んでくれるだろう」という姿勢でいることは、研究者、特に、これから研究の道を志す博士課程の学生にとって、とても不幸なことに思う。世の中との接点をないがしろにしたまま研究をしてるいると、いつしか研究に注ぎ込んだ時間の意味を見失い、もし論文が採録されなければ、自分の仕事への自信、価値判断が崩壊しかねない。

研究の「便利さ」が見出されるのは、近い未来かもしれないし、もっと長くて何十年後かもしれない。それでも、自分の研究の成果が、どのように世の中にインパクトを与えることができるかを考え、そしてそれを一番理解してくれる、あるいは実用化につなげてくれる環境に身を置くことが、研究へのモチベーションの維持するためにも、さらには研究を埋没させないために最も大事なことだと思う。

もちろん、研究成果を論文にすることにはとても価値があるのだけれど、それが考えられる「最高」の価値ではないことも知っておくべき。論文を発表するより、実際に起業して研究成果をサービスにして世に送り出す方が、世の中にはるかに大きなインパクトを与える可能性があるから。

(研究に関するこの話題については、実例を含めたよい話があるので、後日紹介します。追記:この記事です Leo's Chronicle: Ullman先生からのアドバイス)

関連

しかし、現実問題として、研究の実用化には時間がかかるものなので、コミュニティによって質が保たれた論文を発表する学会や論文誌というのは、世間での注目度を高め、研究者にとっても、世の中にインパクトを与えるために非常に効率の良いステージとなっていることはお忘れなく。良い研究があぶれてしまうのは、どんどん広がっていく研究分野の割に、質が維持されたコミュニティの絶対数が足りないだけなのかもしれません。

2009年3月13日金曜日

子どもはどこにいるの?

(最初に)長文です。そして、このエントリ、特に後半部分は、むしろ今「親」になっていない人、あるいは、子供に手がかからなくなってきた人に読んで欲しいと思っています。

「研究している間、子どもはどこにいるの?」研究に限らず、夫婦共働きなどでも気になるこの話。ボストンに留学中のtsugo-tsugoさんに、アメリカでの様子を教えてもらいました。(アメリカは州によってぜんぜん法律が違うことは念頭に置いて読んでください。)
マサチューセッツ州の場合、14才以下の子供だけを家においておくのは幼児虐待とみなされ、それに気づいた周囲の人には通報義務があります。ということで、周囲の話を聞いてる限りでは、子供の保育園、学校がない時間帯はベビーシッターを雇うか、常に家に両親どちらかがいるはずです。ベビーシッターは、教会や大学、近所のコミュニティ等で近所の学生等を紹介してもらう無認可のサービスが多いです。

法律の縛りが社会に与える影響は大きい。需要が生まれ、供給体制もできてくる。今の日本だと、子育てのためにどちらか片方(9割以上母親)が仕事・キャリアをあきらめてる、という状況ではないでしょうか。そしてそれが当然という風潮がある(3歳までは母親が~云々、とか)。ちなみに学童保育は学年の途中までということも多いので、両親共働きの家庭では、まだ小学生の子どもが一人で誰もいない家に帰ることになります。これを国(州)として是とするかどうか。この法律には、明確にNOというメッセージが表れています。
大学の先生の場合、わりあい自分のスケジュールを自由に調節できるのと、アメリカは家族の用事で休むのは当然、という文化があるので、結構フレキシブルにやっている印象。子供が病気になったので、東海岸に単身赴任している旦那さんが育休をとって西海岸まで飛んでいく(!)、という話も聞いたことはあります。わりあい男女関係なく育児にかかわっている、というよりもそうしないとやっていけない印象があります。

アメリカでも研究者同士で夫婦別居せざるを得ない場合も多いようなので、必ずしもアメリカが理想郷というわけでもありません。一方、日本にいる僕の周りでは、子どもの保育園や小学校関係の保護者会などで、お父さんが参加しているのを目にすることはほとんどありません。周りはお母さんばかりで、参加している男性は僕一人というケースがほとんど。紅一点ならぬ青一点(?)。仕事が終わって(終わらせて)から、スーツ姿で駆けつけるお母さん達はほんとうに偉いと思います。

あとは中国出身の研究者の場合、出身地によっては子供は2、3歳ぐらいまで母親方の両親が育てる風習があります。その場合、母親方の祖母がビザを取ってアメリカまで出向いてきたりします。

これだと保育園に入れなかったとしても、なんとかやっていけそうです。おじいちゃん、おばあちゃんが家にいて面倒を見てくれる。それがたとえ週に1日とか、子どもが病気のときだけだとしても大変ありがたいことです。けれど、改めて考えみてほしいのは、昼間の子どもをちゃんと見てもらえるというのは、実は既に相当の「溜め」がある状況なのです。

「溜め」のある社会へ

この「溜め」という言葉は湯浅誠さんが、お金の多寡だけではない「貧困」の様子を表現するために使っている言葉です。(「生きづらさ」の臨界―“溜め”のある社会へを読むと、今の日本では、本当に紙一重の差で「溜め」がなくなってしまうことがよくわかります。)
子どもを育てながら研究や仕事を続けられるのも、なんらかの「溜め」があるから。この「溜め」に自覚がなく、仕事がない人に「高校、大学などに行って手に職をつけなかったのが悪い」「私は頑張ったからできた」という類の発言を無邪気にしてしまうと、「溜め」を持たない人にどうしようもない絶望感を与えてしまいます。「自己責任」で済ませるにはあまりにも重い話です。例えば、「勉強する環境があった」、そして、「無事に大学に通うことができた」というのも立派な「溜め」です。経済的、家庭の事情で諦めざるをえなかった人もいるし、勉強に必要な「親の理解」「心の余裕」があるかどうかも「溜め」になることがわかってきています(後述する「子どもの貧困」に関連)

中国での、祖父母が孫の面倒を見るという慣習は、キャリアを確立する20代~30代の大事なときに「溜め」を作るのに有効に働いているように思います。女性研究者なら、ちょうど子育てと、テニュアトラックに入る時期が重なります。tsugo-tsugoさんのエントリで紹介されている出産後すぐに研究を始める女性研究者たちの気持ちは、十分察してあげるべきでしょう。

残念ながら今の日本に、子供を持つ人のキャリア形成を支援する「溜め」が十分あるようには思いません。 核家族化が進んでいるのは、僕が小学生のころ(20年以上前)から社会科で教わっているような話です。昼間こどもを見てくれる親や祖父母は後から作れないし、自分でいきなり保育園を作るわけにもいかない。既存の保育園は、既にキャリアや仕事がある人でないと、定員がいっぱいで入れず、手に職をつけるための勉強や、就職活動すらできなくなります。不況でパートナーの稼ぎが減少し、いざ自分が新たに仕事を見つけようとしても、資格やキャリアがないために仕事を見つけるのが難しく、この「溜め」のなさを痛感している人はさらに多くなったことと思います。

子育て支援は保育園だけでは全然足りない

子どもが幼いときは、一週間ずっと高熱をだして保育園では預かってもらえないなど、仕事を休まざるを得なくなるときがかなりの頻度であります。(病気のときは基本的にベビーシッターさんも使えません)。核家族、共働き、病児保育もないという環境で、頻繁に仕事を休んで、果たして仕事を失わない、キャリアを傷つけずに済むと断言できるでしょうか?

「溜め」を作るには、会社側の子育てへの理解も必要です。先に述べた母親ばかりの保護者会。これはお父さんがさぼっているから?(というのもけっこうあると思います。そんなお父さん達は要反省。)それだけでなく、こどもの面倒をみられる時間に仕事を終わらせること、そしてそれが、「溜め」を作るのに必要なのだという意識が会社や上司の中にも必要です。それがないと、お父さんが職場にとられてしまいます。東大でも、会議は5時までと決めたようですが、これは評価すべきことだと思います。
東京大学は3日、新年度から、原則、午後5時以降の公的な会議を行わないことを決めた。この日定めた「男女共同参画加速のための宣言」の中の一項で、教員に、仕事と生活のバランスを考えてもらい、特に女性研究者の活躍を促すのが狙いだ。・・・

ただし、この目的を「女性がいるから」とするのは大きな間違い。お父さん方も早く自宅に帰れるようにしないと、子供の面倒を見る余裕という「溜め」がない人はさらに「溜め」を失い、社会から取り残されていく。そして、その影響は世代をまたがって固定化していきます。子どもの貧困―日本の不公平を考える、では、親のそういった心の余裕という「溜め」や、さらには学歴までもが、子供の将来における収入に影響を及ぼすというデータを示しています。子どもの「貧困」とはなにか、そしていかに多くの日本の子供が、まさに今「貧困」状態にありながら、そこから抜け出せなくなっているかが、詳細な分析結果とともに述べられています。

子どもを助けようとするなら、親を助けよ

この「溜め」の問題で隠れているのは、「溜め」がないことで、大学や仕事などのキャリアをあきらめてしまった人は、もう「溜め」がない人とすらカウントされないという事実。キャリアを目指せる環境が整うなら目指したい(これが需要になる)のに、到底かなわないと最初から諦めてしまっている人は、需要としては決してカウントされない。小泉政権下で、保育園の待機児童の定義の分母をすり替えて、待機児童の割合を少なく見せるトリックをしたのと同じです。
2002年(平成14年)4月から国は、待機児童の定義を変えた。認可外の保育所に入っている児童の内、自治体が助成金を出している保育所にいる児童は、待機児童から外すことにしたのである。つまり今後は、認可保育所に入所を希望していても、自治体独自の保育の取り組みや、幼稚園の預かりシステムなどで、一時的にお世話になっている児童は、待機児童としてカウントされなくなったわけだ。
http://www.sensenfukoku.net/policy/ninsyo/index.html

保育園に預けて働きたい、大学に通いたいのにそれができない人は、待機児童数が示すよりもたくさんいるのです。日本では、「溜め」をつくるために親がキャリアを身につけようとすれば、親(特に母親)はこどもを優先すべきだからキャリアはあきらめろ、とでもいわんばかりの雰囲気があります。現に既に仕事(あるいは仕事に就く見込み)がないと保育園には入れません。仕事があっても年度途中から入るのは、かなり絶望的です。

教育や将来の収入などを見越した上で、本当の意味でこどもを大事にする、というのは、実はその親のキャリア形成を支援することに他ならないことを「子どもの貧困」という本は示唆しています。子どもを持つことがキャリア形成に不利に働く今の日本の現状では、本当に子供を大事にしていないのは、「親」ではなく、むしろこの日本という「国」や「社会」の方だと言わざるを得ません。それゆえ、病気のときにまで誰かしらに子どもを見てもらえるような、既に「溜め」のある人と、そうでない人との差は広がるばかりになります。これは月数万の補助で埋められるような「差」ではありません。

そして、この問題に気付くのは、たいていこどもが生まれた後です。そのときにはもう当事者であり、今の生活、仕事を守るのに必死なため、政治活動に一番参加しにくい立場になってしまいます。まずは、この問題意識を共有してくれる人を、政界だけでなく、学校や企業などの社会の中に生み出さないといけない。もはや「貧困」はホームレスだけの問題でないし、「子育て」も「親」になった人だけの問題ではない。「親」になってからでは遅いのです。

2009年3月10日火曜日

イラストで知る研究の世界とその醍醐味

研究の世界の雰囲気や、その面白さがどこにあるかご存じな方はとても少ないことと思います。

例えば大学4年で卒業し就職してしまうと(法学部や経済学部に多い)全くといっていいほど研究の世界を知らないまま社会に出ることになります。日本では、報道などのメディアに就職する方も学部卒ということが多いため、テレビ・新聞などで研究の世界について深く書かれた記事を目にする機会はほとんどありません。

NHKのサイエンス・ゼロなどの番組で、研究者の様子を垣間見ることもできます。しかし、番組は研究の世界の一側面を見せているだけであり(取材時間に比べてカットが多く、内容も製作者の主観に左右される)、研究の世界で活躍していて評判の高い人は、実はほとんどメディアにでてこない事情もあります(「21歳からのハローワーク(研究者編)」を参照)。そのような研究者は、論文という形で一生懸命アウトプットを出しているのですが、論文は学部教育や大学院、博士での研究トレーニングを経ないと読みこなせない(研究の内容だけでなく、意義すら理解できない)ため、学者間にとっては非常に価値のあることでも、一般の人にとっては無用の長物に見えてしまうことも少なくないのです。

そのように謎に包まれた研究の世界の様子を、tsugo-tsugoさんが、イラストを通して伝えてくれています。研究の面白さや、研究の進め方の本質をしっかりとらえていて、一部に根強いファンがつく人気ぶりです。僕もtsugo-tsugo劇場と勝手に名付けて、連載を楽しんで読んでいます。以下のリンク先からどうぞ。
2009022711394420090301003316
こんな感じのかわいいイラストで、研究の世界に流れる感動や空気、驚きや醍醐味などをよく伝えてくれています。

ただし、一つだけ注意。tsugo-tsugoさん本人もおっしゃっているとおり、実際の研究は、かわいいばかりでなく結構殺伐としていることが多いです。博士課程では論文という形で成果が出せないと鬱になりがちです(学生相談所には博士課程の学生の相談が多いとか)。それに、日本では、ポスドク以外のアカデミアのポストにつける博士の割合は3割以下でもあります(H20年度の統計で、1万人の博士課程修了者のうち大学教員になった割合は23%、その他の研究者になったのは26%です)。研究の世界に飛び込むときは、実際の雰囲気に加え、社会の現状を知った上で入るのが望ましいと思います。
参考:
テレビなどのメディアで紹介されていて分野に興味を持ったから、というのも悪くはありませんが、実際の研究現場と想像していた雰囲気のギャップに苦しむことがあります。例えば、一時期、精神鑑定がはやって精神科医を志す人が増えたけれど、プロファイリングなどの言葉でテレビで華々しく紹介されているのとは違い、現実はかなり地道な調査が要求される分野だそうです。(そもそも疾患者数が少なく、統計的に有意な結果が見出しにくいため、健常者にまで外挿した質問肢調査から病気の傾向を見出すSchizotypyのような研究が必要だったり)

参考:
  • 教授からのメッセージ (研究者という道について厳しく書かれています。しかし、実際これくらいの心づもりで闘争心を持って研究に臨んでいかないと、とても大成できないので、実は愛情たっぷりのお話)

研究の世界を知るには、実際に研究室を覗いてみたり、中に入って話を聞いたり、扱っているテーマに関して勉強して手を動かしてみるのが一番だと思います。僕自身、そうやって志望する研究室を変えた経験がありますし、自分が勉強したい分野と、実際にその研究が肌にあうかどうかは意外に異なるので、例えさわりだけだとしても、経験してみることが大事です。

研究テーマをベースに選ぶとしても、例えば生物学なら、対象が生物ではあることは常に変わらないけれども、実際に用いる研究手法は、測定機械、実験設備の有無、さらには特定の分野に強い人がいるかどうか、などという様々な事情で変わってきます。人の入れ替わりも激しい世界なので、5年、10年以上と同じテーマの研究を続けているラボは珍しいくらいです。ただ、研究の軸が一本通っていれば、それを元にいろいろな理論、手法、解析に手を出していける強みもあります。僕の場合は「データベースシステムを作ること」が研究の軸にあります。今現在は、ちょうど生物情報という融合分野にいますが、生物でも、情報系でも、そのアプリケーションは違えど、研究の目的自体にあまり違いはありません。

これからの研究の世界に飛び込む人には、酸いも甘いも知った上で臨んでほしい、という思いをこめて。

2009年1月16日金曜日

Top 5 Database Research Topics in 2008

岡野原君が自然言語処理関連で2008年に読んだ論文のベスト5を紹介しています。それに倣って、僕も個人的にインパクトのあった2008年のデータベース研究のベスト5を集めてみました。

  • Michael J. Cahill, Uwe Röhm and Alan D. Fekete. Serializable Isolation for Snapshot Databases. SIGMOD 2008. (ACM DOI)
真っ先に思い浮かんできたのがこの論文。SIGMOD2008のベストペーパーでもあります。僕自身、トランザクション処理を長く研究していた経験から、Serializability(ディスクのread/writeの順番をあるプロトコルに従って入れ替えても、データベースの検索・更新結果に影響を与えない)を保障しつつ、一秒間あたりに処理できるトランザクションの数(つまりスループット)を上げるのは、ものすごく難しいことを実感していました。ロックの粒度、デッドロックの回避、インデックスのconcurrency(同時読み書き)管理などなど、同時に考えないといけない要素が多すぎるのです。

では、現在の商用DBMSではどう高速化しているかというと、snapshot isolationと言って、データベースのある時点での状態(これをsnapshotと呼ぶ)を保持し、readerはsnapshotを参照し、writerは新しいsnapshotを作るようにして、読み書きが衝突しないようにしています。これは確かに性能が出るのですが、特定のread-writeパターンで、serializabilityが崩れてしまい、トランザクションをやり直す(rollbackする) か、あるいは、rollbackが起こらないように検索・更新のworkloadを設計するのが大変でした。

この論文は、そんなsnapshot isolationを、性能をほとんど落とさずserializableにする話で、実装も簡単にできるという素晴らしさ。著者に会ったときにソースコードが欲しいと話したらBerkeleyDB上での実装を公開してくれました。(この話は「PFIに行きました」のエントリでも言及しています)。First AuthorのCahillさんは、Sleepycat (BerkeleyDBの開発元、現在はOracleに買収)で七年働いていたBerkeleyDBの開発者で、こんな改良を施すのもお手のものだとか。どうりでこんな研究ができるわけだと納得。

今後、トランザクションの教科書に一節が追加されるような非常にインパクトのある研究です。各種DBベンダーもこの方式を実装し始めているのではないかな、と思っています。(複雑なトランザクションの処理で新たなボトルネックが出てくる可能性はありますが)

参考文献:Alan Fekete , Dimitrios Liarokapis , Elizabeth O'Neil , Patrick O'Neil , Dennis Shasha, Making snapshot isolation serializable. ACM Transactions on Database Systems (TODS), June 2005 (なぜsnapshot isolationをserializableにできるか、という証明部分。こちらも面白い)


もう一つもトランザクション関連。MITのStonebraker教授(PostgreSQLを作った先生)のお弟子さんたちの研究ですが、現在主流のrow-oriented storage(テーブル行単位でディスクに配置していくもの)で、ロックマネージャーを外し、ログを外し、、、とやっても、トランザクションで100倍の性能を上げるのは難しい、ということを示した論文。近年、彼らの研究は面白くて、C-Store (列ごとにテーブルを分割して圧縮。性能抜群)や、 H-Store(トランザクションの意味を考えて、仕事の単位を分割、sequentialに処理して速度を稼ぐもの)など、One-size doesn't fit all (DBMSも用途に応じたものが必要)という時代の流れをリードしていく存在で、要注目です。

  • Taro L. Saito and Shinichi Morishita. Relational-Style XML Query. SIGMOD 2008. (ACM DOI)

手前味噌で申し訳ないのですが、XMLで表現されるデータ構造を「そのまま保持することに価値がある」と錯覚していた時代に区切りをつけるために、どうしてもこの研究が必要でした。ポイントは、XMLの構造そのものが重要なのではなく、XMLが含んでいるデータモデル(スキーマ)の方が大事で、「XMLの木構造はそのデータモデルの一表現にすぎない」、と示したことです。(参考:「Leo's Chronicle: XML時代の終焉 ~ XMLから再びCoddへ」)木をそのまま維持しなくてもよいようになると、XPath, XQueryなどの問い合わせ言語、インデックス、ストレージなど、従来のXML研究を見直していくことができ、木構造に捕らわれていては難しかったもの(例えば、木構造を保持した索引で、サイズが小さくかつ、更新しやすいものは、未だに作られていません)でも、木構造を捨てることで様々な最適化が期待できるようになりました。


Yahoo!のグループによる、分散計算と、構造化データを意識した新しい問い合わせ言語の設計、実装です。GoogleのMap-Reduceでは、分散計算を手軽に書けるのが特徴ですが、key, valueのペアでデータを出力するという枠組みは低レベルすぎで、構造を持ったデータをどんどん組み立てて処理を続けていくプログラムを書くには大変でした。

Yahoo!のPig Latinでは、データをグループ化したり、ネストさせたりする処理を導入して、プログラマの負担を軽減することを狙っています。似たような例として、フラットなSQLでは書きにくいのだけれど、XQueryだと階層をたどってデータを出力するプログラムが書きやすいという話があります。言語の能力的にはどちらが上ということもないのですが、「書きやすさ」は歴然と違う。SQLやkey->valueだけでは不便だったことを改善していく試みは、Relational-Style XML Query(XQueryでも不便だった階層を持ったデータの扱いを簡単にする)にも通じるところがあって、非常に関心を持ってウォッチしています。

最後は論文ではなく、雑誌記事の紹介です。1998年にTuring Award(コンピュータ系での言わばノーベル賞)を受賞し、 2007年にボートに乗って遭難してしまったJim Gray。トランザクション処理で大きな功績を残した、そんな彼に寄せられた記事を集めた特集号です。一人の研究者にこれほどのtributeが集まるのはすごいことです。Jim Grayは、ロックの粒度(テーブル単位、レコード単位のロックなど)を織り交ぜて使う手法を開発するなど、今なおその技術はDBMSの実装に使われています。トランザクション処理は非常に身近な存在です。銀行しかり、駅の改札もしかり。現代社会でJim Grayの恩恵を受けていない人はいないと断言しても良いです。

僕自身、Jim Grayとは巨大な生物データの扱いについてメールで議論したこともあり(駆け出しの研究者の僕にも、丁寧に返事をしてくれるような優しい人でした)、そんな彼が遭難したと聞いたときは、心にぽっかり穴があいたような、そんな気持ちになりました。僕だけでなく、やはり、これだけ多くの研究者に慕われているこの人の話題は外せない、ということで。2008年は彼の功績を振り返ってみるよい機会になった年でした。

以上、僕個人としてのトップ5研究でした。データベースは領域が広いので、興味が違えば、まったく別のランキングになるとは思います。SIGMOD, VLDB, ICDEなど国際会議もいくつかあるのですが、実際に会議に参加して雰囲気を肌で感じることができたのはSIGMODだけなので、とても偏ってますね。他の研究者による別の切り口での紹介も欲しいな、と思います。

関連エントリー

2009年1月7日水曜日

ぜひ押さえておきたいデータベースの教科書

先日のエントリで少し話したのですが、僕が在学していたときの東大にはデータベースを学ぶためのコースというものがありませんでした(DB関係の授業は年に1つか2つある程度。現在はどうなんだろう?)。そんなときに役だったのは、やはり教科書。読みやすいものから順に紹介していきます。(とはいってもすべて英語の本です。あしからず)

一番のお薦めは、Raghu Ramakrishnan先生 (現在は、Yahoo! Research) の「Database Management Systems (3rd Edition)」。初学者から研究者まで幅広く使えます。データベース管理システム(DBMS)の基本概念から、問い合わせ最適化、トランザクション管理など、これらを実装・評価するために必要な、「DBの世界での常識」が、丁寧な語り口でふんだんに盛り込まれています。この1冊を読んでおけば、DBの世界で議論するための土台が十二分に身に付きます。



2つ目は、StanfordからDB界を引っ張っている3人の先生、Hector Garcia-Molina、Jeffrey D. Ullman(Ullman先生は昨年に引退したのですが、まだラボに顔を出しているようです)、Jennifer D. Widom (世界1周旅行に出かけているらしい…)による「Database Systems: The Complete Book」。これもRaghu本と同じように、DBがどのように作られているかを知るのに良い教科書。問い合わせ最適化などに関しては、こちらの方が詳しいです。Raghu本では、データベースの知識を広く扱い、それぞれに大事な視点を紹介しているのですが、こちらの本ではその定式化、アルゴリズムの詳細にまで踏み込んでいたり、と充実しています。



次はトランザクション管理の本を紹介。データベースにおけるトランザクション管理の実装には、これでもか、というくらい非常に多くの知識を要します。まず、データベース上で多数の検索・更新処理(トランザクション)を並列に実行したときに、安全にデータを保存するとはどういうことか、そして、更新に失敗したときに、どうやってもとの状態にデータベースを復元するか。さらには、並列化しトランザクションのスループット(1秒あたりに処理できるトランザクションの数)を向上させるために重要な、ロック管理(どの部分のデータを保護し、どの部分にアクセスを許すか)についてなど。これらについて把握していなければ安全・かつ高速なDBなどはとても実装できないでしょう。


Gerhard Weikum先生による「Transactional Information Systems: Theory, Algorithms, and the Practice of Concurrency Control and Recovery」は、トランザクション処理に関する古典的な話題から新しい話題までを理論・実践の両面から初めて整理した画期的な本です。この一冊があれば、過去のトランザクション理論の本は読まなくても良いくらい内容が充実しています。
ここで導入される階層化ロックという概念により、1993年にトランザクション処理の大御所であるJim Gray(一昨年にボートで遭難。いまだ消息不明…)が書いた「Transaction Processing: Concepts and Techniques(こちらは詳細な実装に興味がある人にお薦めです)」にあるような従来のロックの管理方式の正当性が、綺麗な形で裏付けされていくのは圧巻です。Jim Gray本人が「自分が書きたかった本」と称賛するのもうなずける内容。特に関連文献の項が充実していて、この一冊があれば、過去から現在までの研究の流れが非常によくわかり、詳しい情報へのアクセスが容易になります。

ロック理論だけではなく、実装上の問題、障害回復、分散トランザクションと、トランザクションに関する話題は網羅されています。B+-tree以外のindexがなぜトランザクション処理にはうまく使えていないのか、など、トランザクションを極めようとするなら、ぜひ手元に欲しい1冊です。


最後は、データベースの歴史を知る上でとても大切な一冊。PostgreSQLを開発したMITのStonebraker先生らによる「Readings in Database Systems」(通称 red book)です。この本は、過去30年に渡り重要な功績となった論文を集めたものです。30年の間に蓄積された論文の数は膨大で、どこから読み始めればいいかわからないものなのですが、この論文集のおかげで、重要なものから順に読んでいくことができます。論文以外の解説記事も面白く、1979年にCoddがRelational modelを提唱した前後、どのようなデータベースシステムが良いかという議論が活発になされて、結局どのような顛末になったかまで書かれてあります。XMLのような階層型データも当時から話題であったし、データの意味・モデルに基づいたsemanticデータベースや、最近よく話題になるような、プログラムで扱うオブジェクトの保存に特化したオブジェクトデータベースなども昔、一度市場から消滅している過去があるのです。




実装に特化した話も秀逸で、なぜDBMSではトランザクション管理、インデックスなどをモジュール化した実装ができないのか、分散(クラウド)データベースでは、どのようなシステム構成が考えられてきて、落ち着きどころはどこか。さらには、なぜXMLデータベースは成功しないか、など一刀両断していて、長い歴史をみてきたからこそ書ける切り口がとても面白い本です。Stonebraker先生も、5年10年も立てば、昔に熱心に議論されたことが忘れられて、また同じような研究が盛り上がるような現状を危惧してこれをまとめたとか。「歴史は繰り返す」というのは本当ですね。(はてな界隈でもこの「歴史は繰り返す」現象をよく見かけるのですが、大人げないので敢えて突っ込みを入れるようなことはしていません)


他に、これらの本がお勧めな理由としては、世界中の大学でデータベースの講義用の教科書として使われていて、Googleで検索するだけで講義資料が手に入る、というのも特徴です。さっと内容を調べたいときには、講義資料を検索するとよいでしょう。

研究寄りの話ばかりしてないで、もっと実用的なOracleとかMicrosoft SQLServer、DB2などの商用データベースや、オープンソースのPostgreSQL, MySQL, SQLiteなどを紹介したらどうしたって? そんなに欲張らなくても大丈夫。最初に紹介したRaghuの本でも読んでおけば、それぞれの製品で、SQLで検索・更新がどのように実行され、indexがどう使われるのかなんて、すぐわかるようになります。他に必要な知識は、SQLの方言や、それぞれのシステムでデータがディスク上にどのように配置されるかという情報くらい。それがわかれば、検索の種類やテーブル設計の違いで、パフォーマンスにどのような影響がでるか、より正確に把握できるようになることでしょう。オープンソースのシステムなら、このようなDBの知識を持った上でソースコードを読んでみると、素早く全体の構造から実装の詳細までを把握することができます。


関連情報

2009年1月3日土曜日

東大で学んだ「勉強」の意味-「教わる」から「学ぶ」へ

以下の記事を読んで、これは大学としての文化が違うのだなと感じました。

大学ってもっとすごいところだと思っていた。
なんかこう、毎日が発見に溢れていて大学じゃなきゃ知り得ないことがたくさんあって・・・
そんな素晴らしい世界だと思っていたのに・・・。

大学で秘伝を習うたった1つの方法
対価を支払っていないから秘伝を知り得ていないのだ。そこにいる人たちの中で、賢い人たちは全員秘伝を知っているし、その取得方法もわかっている。
とりあえず自分が、秘伝を教えてもらえるのにふさわしい対価を払えるようになろう。さすれば、自然と大学にある知の秘伝があなたのものになる。

どうやら大学には「秘伝」なるものがあって、それは「対価」を払って「教わる」か「引き出す」ものらしいです。「対価」として考えられるのは、学生さんのポテンシャルであったり、議論していてわくわくさせてくれるような「きらりと光る何か」だと思います。そういった教えることへのやりがいを感じれば、教員の方も喜んで「秘伝」を伝授する(とは思います。少なくとも僕自身に関しては)

しかし、いざ「秘伝」とも言うべき知見の集大成である論文や、コンピューター系ならソースコードが目の前に差し出されていても、内容を自分で読もうとしない(あるいは読み切れない)人が多く見受けられるようになりました。

近年、大学院での教育に重点が置かれるようになって、東大の大学院にも、東大の学部を経ずに、他の大学からの学生が多く入ってくるようになっています。もちろん、そこらの東大生より優秀な人もいるので驚かされることもありますが、どちらかというと、カルチャーショックを感じることの方が多いです。それは、彼らに共通して、
勉強は「教わる」ものだ
という意識が非常に強いこと。知人の助教(こちらも東大上がり)と話していても、やはりそう感じるそうです。

実は、東大に伝わる「秘伝」は、この正反対。
勉強は自ら「学ぶ」ものだ
「勉強」は人様から教えてもらうものではなく、自ら学んでいくもの。この意識が染みついてていたから、「勉強ができる=なにがいい? (404 Blog Not Found)」などで述べられている人から押し付けられるという「勉強」の定義の仕方には非常に違和感を覚えます。

また、東大で講義を受けていると、
「わからないところは自分で学ぶのが、大学院ですからね」
と言われることが多くあったし、大学時代の研究室の教授に、
「私は私の研究をします。みなさんも、自分で好きな研究をしてくださいね」
と、まったく教授から研究指導を受けなかったにもかかわらず、その研究室にいたメンバーのほとんどが、いまや旧帝大の教授にまでなっている、という実話もあります。


僕が卒業した東京大学理学部 情報科学科なんてところは、C言語の授業がカリキュラム上に全くないにもかかわらず、C言語でプログラミングする課題が出たり、「Javaくらい自分で学んでくださいね」とか言われたり、そういうのが当たり前に要求されるので、学生の方も自分で本を買ってきて1週間で新しい言語を学んで課題を仕上げてくる、というのが日常茶飯事になっています。

それに、僕の専門はデータベースなのですが、それに関連した講義は、在学中にたったの1コマ、さわり程度の授業しかありませんでした。DBのことは本当に論文と教科書だけで学んでいます。データベースの学科があって懇切丁寧なカリキュラムがある大学がうらやましくて仕方がないです。


教えてもらわなくても人が育つのが東大というところ。ただ、先にも述べたように、学生さんの方の意識が「教えてもらう」側に傾いてきているので、最近は、教える側もより丁寧にと力を入れています。従来のように、「残りは自分で勉強してきてね」、と放り出すだけだと、「勉強」しきれずに、試験・レポートで大半がさんざんな成績になってしまったり…。それでも、どんなに難しい試験だったとしても、満点はいつもいて、自ら「学べる」人がちゃんといることがわかります。


東大生が「学歴」を気にしないというのは、それはもちろん少なくとも日本の中ではトップクラスの大学だから引け目を感じなくて済むというのもあるけれど、「自ら学ぶ力を持った人」の強さを知っている、というのも大きい。「学ぶ力」は「学歴」を問わないから。だから、先のエントリで大学に失望している人には、もっと多くを自ら学べるように「頑張れ」とエールを送りたいと思います。

(追記)

誤解のないように断っておきますが、東大の前期教養課程(1~2年時)の必修科目の講義(特に実験など)は教材・教育方法に力を入れていて非常に丁寧です。実験データの整理の仕方など、論文を書くときに必要な力を叩き込んでくれます。だから、グラフには単位までしっかり記入するなどといった基本が身についてない他大学の学生さんをみると、逆に、ちょっとがっかりするものです。。。


(さらに追記)

誤解を招きそうだったので補足。東大の授業が手抜きなわけでは決してありません。ただ要求するレベルが総じて高いものになるため、授業が「手取り足取り」というわけにはいかず、必ず自分で学ばないといけない部分が出てくるのです。プログラミングなら、オブジェクト指向の考え方などはほとんど教わりませんが、オブジェクト指向で組まれたコードを読み書きする必要はあったりします。または、最新のCPUのアーキテクチャについて書かれた論文をぽんと渡されて、それを読んで発表する授業など、習った知識だけではこなせない課題が出されることも往々にしてあります。


(補足:2009年1月18日)

こう書くと、学生が皆自ら「学ぶ」のなら、大学の存在意義はないと思われるかもしれません。けれど、それだけでは「学ぶ」ことを続けていくには十分ではありません。なぜなら、周りに何もないところで、勉強を続けていくのは至難の業でからです(教育機関が整っていない国や地域のことを想像してみてください)。「学ぶ」ための題材、施設、そして学ぶ意欲を刺激する教師や仲間が集まってくることに、大学の本当の価値があると思います。

2008年12月22日月曜日

XML時代の終焉 ~ XMLから再びCoddへ

先日、ACM SIGMODの日本支部大会に招いていただいて、「Relational-Style XML Query (ACM Portal http://doi.acm.org/10.1145/1376616.1376650)」について講演をしてきました。Relational-Style XML Queryは、XMLという複雑な構造をもったデータに対して、SQLのようなテーブルデータへの検索に使われる言語で問い合わせする手法です。

この研究の肝は、木構造データといわれるXMLでも、実はそのほとんどがリレーション(Microsoft Excelのようなテーブル形式のデータ)の組み合わせと考えることができ、そのテーブル構造の情報(スキーマ)を使うと、検索が非常に簡単に書けるという点です。

この応用例は広く、僕が日常的に構造を持ったデータを扱うプログラムを書くときに欠かせないツールになっています。例えば、
  • XMLデータからObject へのマッピング (O-X Mapping) 。この際に、DTD, XML Schemaなどは必要ありません。Objectのクラス定義が、そのまま自動的にXMLクエリ(スライド中のrelation + FD) に対応するからです。
  • RDBのようなテーブルデータも木構造データのサブセットなので、検索のアルゴリズムは同一のまま、直接O-R Mappingにも使っています
  • 他にも、コンパイラを自作したときにでてくる構文木を、オブジェクトに手軽にmappingするときにも使います。これも、O-X Mappingの一部。
  • JSON, YAML, CSV, Tab-separated dataなども、木構造データとしてXMLと同一に扱えます。これらのフォーマットへの対応はadapterを1つ書くだけで済んでしまいます
これらの技術は、日常的にデータベースの扱いが欠かせないバイオインフォマティクスの分野で活用しています。他にも現在研究中で、ここに紹介できるほどまとまってはいないのですが、それでも十分有用な応用というのも多数あります。今後、それらのC++/Javaなどによる実装は xerial.org (エクセリアルのサイト)を通して、追々公開してきたいと思います。僕自身、このおかげでSAX/DOMなどのプログラミングから解放されています。

XML・DB研究者の間では、XMLについて巷で言われているような「XMLがすべてを解決する」的な、XMLの利用価値についてはとても懐疑的です(ある日のTwitterでのTimelineより)。実際、XMLはXPath, XQuery, XSLT, DTD, XML Schemaなど関連技術の仕様が膨大で、学ぶのに非常に時間がかかるものでした。Relational-Style XML Queryが示す世界は、XMLをテーブル構造の組み合わせと考えることで、複雑そうに見えていたXMLが、実はとても簡単に扱えようになるというもの。

必要なのはちょっとした発想の転換です。XMLというデータありき、ではなく、最終的に扱いたいデータが、オブジェクトの形や、テーブル形式であるなら、それはもう巷で言われるようななんでも屋さんのXMLではなく、1970年代にCoddが提唱したrelational modelと同じ世界です。 そこでのXMLにはportableで便利なテキストフォーマットとしての価値しかありません(データを表現するための共通テキストフォーマットが確立したという意義は非常に大きいですが)。

1997年にXMLが登場して早10年。皆こぞって、Coddが提唱したrelational modelからXMLへの転換を試みてきました。けれど、そのようにもてはやされたXMLも再びCoddに帰って行くのです。
参考:A Web Odyssey:  from Codd to XML. Victor Vianu (PODS 2001)

XML、relational modelのどちらが技術的に優位か、という話ではありません。大事なのは、そのデータを扱うのは「人間」という視点です。その「人間」にとって結局、どちらが扱いやすいデータ構造なのか? 僕自身は、この境目は非常に微妙なところだと考えています。Excelのように単一のテーブルだけだと心もとない、けれど構造が入り組みすぎても、扱いきれない。そして、このもどかしさと真正面に向き合うのが、データベース研究の世界なのです。

2008年12月15日月曜日

[講演案内] Relational-Style XML Query

講演の案内です。
第3回 先端的データベースと Web 技術動向講演会
(ACM SIGMOD日本支部第40回支部大会)
2008年12月20日(土)に、「Relational-Style XML Query」の話題で、SIGMOD日本支部大会において講演を行います。申込期限は過ぎておりますが、まだ若干席が残っているようです。
Relational-Style XML Query
XMLのような階層構造を持ったデータに対して、フラットなSQLを用いて問い合わせを行う手法であるRelational-Style XML Query (SIGMOD2008で発表) について紹介します。

この内容を日本(語)で紹介するのは初めてですし、横田先生の案内によると、「どうしたらSIGMODに通るような論文を書けるか」についても期待されているご様子なので、その当たりの話も織り交ぜようかと考えています。乞うご期待。


2008年12月3日水曜日

Googleで論文が書けるか?

Googleに入って論文が書けるか? 中の人が答えています。

A common question I get is "How hard is it to publish at Google?" I want to dispel the myth that it is hard. It is easy to publish, easy to put code into open source, easy to give talks, etc. But it is also easy for great research to become great engineering, and that is an incredible lure. (よく受ける質問が、「Googleで論文を書くのは難しい?」というもの。実際難しくはないし、コードをオープンソースにしたり、発表したりするのも問題ない。それに、いい研究をいい製品にもしやすい。それがGoogleの魅力だ。)
察するに、論文を書くことができるか?という文字通りの意味ではYes。でも、論文を書くためのincentive(きっかけ、強い動機)が生まれるか、インパクトのある論文を書けるようになるか、という点では、ちょっとわからない。ここで解答している人も、Googleに入ってから筆頭著者(first author)で論文を書いているわけではないし、Papers written by Googlers に紹介されている論文も、僕が知っている分野に関しては、Googler(グーグルの社員)単独のものではなく、もとから論文を書ける力のある人がGoogleの中の人と共著になっていたりする。あるいは、論文を書いてからGooglerになった、という傾向。

同じようなコメントが日本のGooglerからも欲しいものです。少なくともPapers written by Googlersの日本版が。というのも、大学関係の人の間では、論文を書く力がつく前の人材(学部・修士課程を終えたばかり)が、プログラミングができるという理由で、日本のGoogleに青田買いされている現状を非常に懸念しています。「論文を書ける」人材が本当に欲しい場合、僕が人事担当なら、PhDを持った学生、あるいは自力でそこそこの論文誌・学会に採録される論文を書いた経験のある人しか採用しません。

大学のように入ってから中で鍛えるのならそれで良いですが、鍛える力を持った人、論文を書くことに強い意識を持った人が中にいないのなら絶望的です。青田買いされた人材が、論文に関しては青田のまま終わってしまいます。Google以外の会社や大学の研究室でも同じことが言えて、研究志向を持っていない(過去にあまり論文を書いていない)人が上司になるだけで、論文を書くことは相当難しくなると思います。

論文が自身のキャリアにおいて大事なら、「書ける」かどうかだけではなく、「書くために必要な要素(論文へのincentive、経験を持った師匠となるべき人)」が揃っているかどうかも、ぜひ確認しておきたいところです。

2008年11月26日水曜日

論文を書く前に知ってほしい「言葉」の大切さ

「言葉」で「知性」のすべてが伝わるわけではない。そんなことは百も承知しています。
以前のエントリ「知性が失われてはじめて言語が「亡びる」」では敢えて「知性」とは何かを定義しないで話をしています。「丁寧な文体」が「知性」と同一だとは言っておりませんので、あしからず。それゆえ、リンク先での「知性」とは何かという議論に反論する理由はなくて、実際、そのとおりだと思います。

少なくとも、僕ら研究者は「知性」を育て「知性」を見出す仕事をしています。つまりは現場の人間です。言葉がつたなくても、対話的にその人の持っている可能性などの「知性」を見出すのが大学という場であり教師の仕事なら、「知性」を持っていることを自らが外に伝えるのが論文です。論文の場合、表現やプレゼンテーションなど、「知性」を伝える力も含めて「知性」と考えます。

もちろん、中身がからっぽでいいかげんなら、きれいな文章でいくら取り繕ってもだめです。

論文を書くということは、自分の知性を他に認めてもらう行為です。but, but, butと続く論文は決して読みやすいものとは言えません。しかも、言葉を疎かにして、他人(しかも学生なら、目上の教師)に馴れ馴れしく話しておきながら、「自分は賢い」と認めてもらおうとは、非常におこがましい態度と言わざるを得ません。査読する側としては、読みにくい文章・要点を得ない下手なプレゼンテーションから「知性」を見出すことを強いられるために、意味が伝わりさえすればいいという書き方は迷惑極まりなく、「論文」という媒体でやるべきことではないと強く思います。

研究の世界の査読システムは、人の善意で成り立っています。お金がもらえるわけではないし、年間に何十本と読むものなので、自分の研究時間が削がれていくばかりなものです。それなのに、肝心の論文を書く側に、言葉を洗練し、内容わかりやすく伝えるための努力、読んでもらう人への敬意がない。そんな論文ばかりが集まってくるようだと、査読する側も疲弊し「知性」を見出す努力が続けられなくなります。結果として、重要な学問への貢献が見い出せなくなる、学会・論文誌の質が下がる、と悪循環に陥いるのです。

論文の査読の評価項目には、「プレゼンテーションの良し悪し」というものがあります。評価が高い論文はきまってプレゼンテーションが良いもので、そのような評価を得た論文が全体の中でも常に上位を占めています。技術的に秀逸でも、プレゼンテーションが悪い論文を救出するには、査読者がshephered(指導者)の役を買って出て、論文をbrush upさせる仕事をしなくてはなりません。しかし、査読者は匿名が基本です。論文を世に出すのを手伝っても、お金も名声も得られないため、拾い上げてくれるかどうかは完全に査読者の善意に依存しています。ですから、論文からプレゼンテーションを練り直せるだけの「知性」を見出せないようなら、単に論文をrejectすることになるでしょう。

僕が本当に伝えたかったのは、書き手の方こそ、良い文章・洗練された表現を書くために頑張って欲しい、ということです。 特にそれが学問という、善意や熱意で成り立っている場所ならなおさらです。

この努力を怠った結果は、既に今の日本で見ることができます。頑張って書かれた論文でも、返ってくる査読結果が数行で適当に書かれたものであったりと、査読者側が最初からやる気をなくしている場合があるのです(これは日本に限らないですが…)。投稿する側も、いまや研究の世界の普遍語となった英語で書くことが大事なので、手軽に業績を増やすために、英語で書いたものを日本語に直して出してしまおう、と、日本語としての文章を練り直す努力を怠ります。当然、査読者はさらにやる気を失います。極端なことには、論文を日本語では書かないという方向にもつながっていきます。そうしているうちに、「知性」を伝えることも、また「知性」を見出す仕事へのやりがいも日本語からは失われ、英語の世界に奪われる方向に傾いてしまいました。「知性」が失われたのが先か、「言葉」への思いが失われたのが先か。

「知性」は「言葉」だけでは伝わらないかもしれない。でも、「知性」を守り得るのも「言葉」なのです。

2008年11月22日土曜日

知性が失われて初めて言語が「亡びる」

これは「逃げ」でしかない。特に研究の世界においては。
むしろこれから起こるのはネイティブイングリッシュの破壊であるとか
ネイティブの英語論文より非ネイティブの英語論文の方が読みやすい場合がないか?
論文が読みやすいとしたら、それは良く練られているからだ。そもそも、わかりやすい表現が良いというのは、日本語、英語の区別がない。文章を吟味することから「逃げ」て済むなら良いが、それでは投稿してもろくに読まれないから身を滅ぼす。安易にこのような考えに同調する人がいるのがとても心配だ。

日本人が書いた日本語論文であっても読みにくい例の枚挙には暇がない。口語の方がわかりやすい?口語中心のブログでも読みにくい文章はうんざりするほどある。(例えば、「日本語が亡びるとき」の書評を批難したり、あるいは水村美苗本人を攻撃するときに、読みやすく、かつ、知性をうかがわせる文章で応えた人はほとんど見受けられない)

もし世界の標準が「日本語」で、皆が日本語で論文を書くようになったとしたらどうだろう。段落ごとに「てにをは」や「漢字」の間違いが出てくるような論文は、すぐに読む気がなくなってしまうのではないだろうか。

崩れた日本語を見たとき、まず、その言葉を操る人の知性が疑われることを肝に銘じてほしい。それが英語であろうと、ブログのような媒体であろうと同じだ。投稿される論文の中には、方言や崩れた言葉が多く混じったものもあるだろうが、競争の世界の中で消え去って日の目を見ることはない。もし表に出てくるのであれば、その論文誌・学会で査読が機能しておらず、「知性」が失われつつある兆候だ。

先の意見は「日本語が亡びるとき」を「英語が亡びるとき」に置き換えてみたのだろうが、間違った用法がはびこるから「亡びる」というのは、大きな読み違いと言わざるを得ない。

言語が「亡びる」のは、その言語を使う人の知性が失われた時だ。


(追記)
日本人特有の英語の書き方に興味があるなら、「日本人の英語 (岩波新書)」を手に取って読んでみることをお勧めする。文法ミスとまではいかなくても、意味の通じない日本人英語の例がいくつか紹介されている。The Elements of Style (Elements of Style)を読むと、英語のネィティブであろうと、「必要なことだけを書く」ために文章を練りなおさなければいけないことを教えられる。日本人の英語、論文が受け入れられないのは、日本人特有の不自然な英語が出てくることで、まず「知性」が疑われ、次に、文章で伝えるべきことをsuccinct(簡潔)に書けていないために、査読者に苦痛を与えているという事情が大きいと思われる。英語が不得手なほど、簡潔に書くための努力が必要となる。今後、多くの日本人が、「良い論文を書くために」内容ともども、文章も十分練り直して欲しいという思いを込めて。

2008年11月15日土曜日

21歳からのハローワーク (研究者編)

これから研究を志す人のために、「13歳のハローワーク」よりもう一段深く分類してみました。

研究者
研究をする人。

良い研究者   
他の研究者から評価を得ている人。

著名な研究者
他の研究者にではなく、メディアや書籍を通じて一般の人にわかりやすく伝えて評価を得る人。架け橋としての役割を担い、他の研究者からの評価は問われない。

本棚公開

VOXにアカウントを作ったところ、本のリストを作成できたので、調子に乗ってどんどん追加してしまいました。

まだまだあると思うけれど、とりあえず今思い出せた洋書77冊。けっこうあるなぁ。



2008年11月13日木曜日

これから研究をはじめる人へのアドバイス

まずは、この記事を書くきっかけとなった文章を紹介。リンク先を読んでみてください。
 
「彼氏が和文雑誌に載ってた。別れたい・・・」

研究の世界 上の文章はもちろんネタですが、研究を続けていくと本当にここに書かれたような、トップジャーナルに通ってなければ…、という世界が待っています。実際、僕自身もいつもこのような心づもりで研究しています。ただ、ひとつ気になったのは、自分自身の経験や、周りの様子を見る限り、Cell, Nature, Science (CNSと俗に言われます)などは、自分一人の実力だけで採録されるわけではありません。この人がいなかったらここまでの成果は出なかった、という貢献は確実にあるけれど、大抵は多くの人の長年の努力の積み重ねの結果acceptされています。

研究のインパクトの大きさ だから結果として、団体で金メダル!くらいには誇れますが、これを個人の功績と考えるのはあまりに決まりが悪いものです。僕が情報と生物の融合分野にいながら、情報系でかつ腕一本でできる研究も続けているのは、この決まりの悪さを避けたいという事情もあります。

でも、世の中へのインパクトから言うと、小人数でできる程度の仕事が中心の情報系トップクラスの会議(情報系はジャーナルより、会議の論文の方が主要です)と、Natureに載るのとでは雲泥の差がありますし、研究は常に後者を目指すべきものだと思います。なぜなら、情報系の小さなアイデアは、Googleのようにサービス化してはじめて世の中に大きなインパクトを与えられるもので、そのインパクトは論文を書くだけでは作り出せません。けれど、Natureなどの記事は、既に多くの研究者、テクニシャンを駆使しているという意味で、実際にサービスを作りだすのに近いものが多く、それゆえ大きなインパクトを残せるのだと考えています。

本当に目指すべきはPI グループや周りの研究者が優秀だと、それほど苦もなくCNSの論文が出ることもあるでしょう。ただ、そういうことが続くと、いざ自分がPI (Principal Investigator. 研究を率いる人・主任研究者) になるときに、途方に暮れてしまうのではないでしょうか。それでは、いくらCNSがあっても見かけ倒しでしかありません。さらに高みを目指して、自分で研究すべき対象を見定め、研究プランを立て、インパクトのある論文を仕上げるところまでできる力を持った人になってほしい。そのトレーニングとして、低予算、腕一本でできる研究に挑戦するのは悪くない選択肢だと思います。研究者にならず、ビジネスの世界に飛び込んでいったとしても、論文の代わりに、売れるもの・サービスを生み出すという違いだけで、PIとしての役割はそれほど大きく違わないでしょう。

研究テーマを探す 自分には才能がない? そんなこと言わないで。同じ分野、研究室という狭い範囲の中で競争しなくたって、広く見渡せば、世の中にはまだわからないこと、うまく解けていない問題が溢れてます。どんな問題が、今手元にある「知識」「経験」という道具で解明できるのか、嗅覚を働かせてみましょう。どうも解けそうにないと感じたら、いったん手を休めて、問題を温めておくのも手です。数年後によいアプローチが閃くことだってあります。知見や設備が整って初めて取り組めるようになる問題だってあります。同じ問題をしつこく考え続けられるくらい愚直な人の方が、案外研究に向いていることもあります。
「科学者になるには『あたま』がよくなくてはいけない」(中略)しかし、一方でまた「科学者はあたまが悪くなくてはいけない」
世の中の偉い研究者達がこれが大事だ、と盛んに取り組んでいる問題が、5年10年したら廃れていることなんて本当によくあります。情報系には、数学的に面白いという理由で盛んになったけれど、実際には誰も使わない、アプリケーションがないという論文の屍が多くころがっています。ですから、実際に研究成果を使うユーザーの視点から問題を見詰めると、今まで優秀な研究者達が気づいていなかった、まったく斬新な切り口を見出せることがあります。でも、本当にそれが新しいアプローチかどうかは、よく勉強していないと判断できないことです。そのために、普段から自分で教科書、論文を探してきて勉強を続ける習慣が必要です。あるいは、先進の研究者に意見を聞くのも早道だと思います。

サーベイする いったん取り組むべき問題を見つけたら、似たような問題がないか、この問題は過去にどのように考えられていたのか、を念頭に置いて、PubMed, Google Scholarなどで過去の論文を漁ります。ポイントを絞ってするサーベイ(研究調査)は、論文を一本一本丁寧に読むよりは素早く終えることができます。


問題と向き合う ひととおり調べ終わったら、他の論文も読みたい、まだ勉強が足りないという、邪念を排除して問題に取り組みましょう。最初は、コンピュータやインターネットから離れて、ノートと鉛筆だけで考えた方が集中できて良いと思います。今まで学校で習った知識などを総動員して研究計画、解法を練っていくうちに、あの授業は大切だった、と思うこともあるでしょう。大学の授業のありがたみがわかるのは、たいてい後で必要なことに気付いてからです。(話を少しそらすと、例えば、高校・大学受験の段階で、国数英理社の勉強が大切だと、勉強をしたくない子に説得するのはとても難しいことのように思います。)

勉強する意欲が一番高まるのは、この必要に迫られた段階です。意欲が十分高まったら、教科書や論文に戻って、今度は詳細に読み込んでみるのが良いと思います。読むだけではなく、実際に手を動かす(プログラムを書く、実験するなど)を交えるとさらに効率が良くなります。

論文を書く とにかく根気が勝負です。英語で8000 wordsのfull paperを書くには、書き慣れた研究者でも2週間をフルに使うようです。時間がかかるものだということを、覚えておいてください。でも、最初から上手にかけなくても心配しないで。上手になるまで書き直し、ロジックが飛ばないように修正していけばいいのです。それと同時に、問題と向き合いつつ、論文、あるいは研究テーマそのものを練っていくのが大事なことです。


論文を投稿する 投稿する場所の選択は、自分が今後どのような研究者として生きていくかを選ぶに等しいです。CNSや情報系のトップ会議のように競争率が高いところでは、投稿数も多く、査読者の巡り合わせや、いい成果だったとしても研究の重要性がうまく伝わらず落とされてしまうなど、ギャンブル的な要素が多分にあります。いったん査読に入った後の待ち時間も長いので、長い間待って結局rejectということになると、特に将来が不透明で早く業績が欲しい院生・ポスドクの段階では末恐ろしいものです。ただし、acceptされれば、その喜び・達成感には計り知れないものがありますし、アカデミアの世界でポストを見つけやすくもなるでしょう。まさに、Publish or Perish (採択か死か)の世界です。

熾烈な競争を避け、手頃な発表場所を狙うのも良いですが、その場合、世の中へのインパクトは相当低いものになります。まず、研究を引用してくれる人が極端に少なくなることを覚悟してください。そのため、研究成果を実用化してくれる人を見つけるのも難しくなります。もっと深刻なのが、注目されなかった研究・論文の作成に費やした膨大な時間の意義を、自分の中でどう解決するか、ということ。学んだことを活かして、本を書く、ビジネスに還元するなど、自分の生きた足跡を残す方法は、トップジャーナルの論文を書くだけに留まりません。人生の選択ですので、ここは慎重に考えてください。自分の今のレベルはこうだから。。。と安易に通しやすい学会ばかりを選んでいると、PIになる訓練を怠りがちなり、かえって将来の道を閉ざすことにもなりかねません。

最後に 研究は学者たちだけのものではありません。サーベイでは、データや過去の知見を集めて検証する力が身に付きますし、ゴールをしっかりと見据えて問題解決に取り組む力は、大学を出て企業に勤めたり、ビジネスを起こすにしても重要な能力です。論文を書くことを通して学んだ、わかりやすく自分のアイデアを伝えるための能力は、プレゼンテーションにも活きてきます。たとえ在学中の短い間だったとしても、研究に取り組んで得た経験は、今後の人生において大きな糧になることでしょう。

ちなみにアメリカでは、Ph.D を取って出た学生の方が、教授より稼ぎが多くなる、なんてことはざらにあるようですね。一方、今の日本は研究する能力への評価が世界と比べて極端に低い社会になっていることには注意してください。深く研究した人の話をろくに聞かないで、あれこれ騒ぐというのはとても悪い兆候です。専門家不在の有識者会議が開かれるなど、まるで研究なんて必要ないという風潮がいたるところで感じられます。

この記事を読んでくれた人が今後大きく活躍し、様々な分野で今の日本を変える力になってくれることを期待しています。

2008年11月9日日曜日

たった一つの準備で勉強会は変わる

この記事で伝えたいことは一つ。

建設的な議論を始めるには、準備が必要だ。

本について語るなら、まず本を読む。輪講なら、自分が発表者でなくても、ざっと本に目を通してわからない点をチェックしておくこと。

たったこれだけの準備で、グループでの議論は実りあるものになります。本に書かれている以上の話ができるからです。その段階までいかなくても、わからなかった点を周りの人に確認し、本の内容をより深く理解することができます。

準備をしてないとこうはいきません。まず、なぜこの本を読んでいるかわからない参加者が出ます。さらに、本の紹介者の話がわからなくなると、その段階で思考が停止する。あるいは明後日の方向の議論が始まってしまいます。輪講や勉強会のようにその場で内容を尋ねられるならまだ救いようがありますが、ブログのように対話的(interactive)な議論が難しいメディアでは、理解を深める術がありません。本を読んでないから教えて、というのが通用するのは、その人が教えるに値する場合だけだと考えてください。(知見のある先達であったり、内容に詳しくなくて当然の他分野の研究者など)

大学での研究生活を通して輪講をする機会は幾度となくありましたが、参加者が本を読まなかったときの不毛さには目も当てられませんでした。本の知識は読んできた人だけのもので、読まなかった人には見せかけの充実感だけが残ります。発表側には、自分で本を読み解く以上のものは得られず、プレゼンという参加者へのサービスの重荷が増えるだけです。ですから、今では、受け身の参加者しか集まらなさそうなときは輪講を開いていません。

このような話をしているのは、梅田望夫氏がTwitterでした以下の発言に対するネットでの炎上の様子があまりにも幼稚であるから。
はてな取締役であるという立場を離れて言う。はてぶのコメントには、バカなものが本当に多すぎる。本を紹介しているだけのエントリーに対して、どうして対象となっている本を読まずに、批判コメントや自分の意見を書く気が起きるのだろう。そこがまったく理解不明だ
梅田氏は「ウェブ進化論」などの著書で、ネットをとりまく急速な変化と、そのまっただなかに放り込まれてしまった現代の若者にエールを送り続けています。著書への感想をブログに書いてトラックバックを送信した人には、賛否両論含めてブックマークしているし、内容にも目を通しているそうです。この行動を見ていると、自分と異なる意見も含めて、彼が建設的な議論を欲しているのが伺えます。初対面の人と対談するときも、その人のブログなどをあらかじめ読んでいくから、昔からの知り合いのように話が弾むといいます。

準備をした上で議論することがいかに面白いか。その面白さを知ってしまうと、その準備をしてこない人への興味が途端に失せてしまうのでしょう。何も難しいことを要求しているわけではありません。準備はとても簡単。

同じ土俵で議論をするためには、何よりもまず、本を読むこと

本の内容をすべて理解することを要求しているわけではないし、言葉で書かれたものの解釈は、聞く人のバックグラウンドによって変わるのが普通です。むしろ、その違いが面白く、新しい発見につながることもあるのです。違う観点からの解釈で、内容の理解を深めることあります。

今回話題になっている本は、「日本語が亡びるとき」という書籍。Amazonで注文してからまだ届いていないので、議論に参加できないのが残念ですが、英語でしか本当の意味で活躍できる道が残されていない研究者として、思うところがふんだんにあります。本を読んだあと、またブログで感想を書きたいと思います。

(追記)このあと、「日本語が亡びるとき」についてはいくつか雑多な記事を書きましたが、以下のエントリが、一番僕の伝えたいことをまとめているかと思います。

2008年11月7日金曜日

近況

論文・実験・講演資料作成・発表資料・ポスター作成

全部同時期に集中してしまって泣けてきます。

License

Creative Commons LicenseLeo's Chronicle by Taro L. Saito is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 2.1 Japan License.