機械学習エンジニアの学会での論文発表のススメ。応募から査読通過までの流れ

機械学習エンジニアとして働く際、「巨人の肩の上に立つ」という考え方を大切にしていると語る上田さん(@hurutoriya)。テクニックを伸ばすため、積極的に機械学習の応用事例が掲載された論文などを普段から読み込むうち、論文投稿の仕組みによって研究がブラッシュアップされたり、世界的に認められたり、該当分野への貢献に繋がるなど、多くのメリットを感じられたということです。ご自身でも論文を学会に提出された流れなど、詳しく解説していただきました。

そもそも機械学習の学会とは

はじめまして、株式会社メルカリにて機械学習エンジニアをしています上田(@hurutoriya)です。筑波大学修士卒業の後、フリーランスとして経験を積み、株式会社メルカリに機械学習エンジニアとして入社しました。

今回、会社の成果を論文形式でまとめて、投稿した論文がOpML’20 に採択されたので、今回の論文投稿と採択経験を通じて学んだ機械学習系の学会事情や学会に参加してよかったことについて紹介していきます。

機械学習エンジニアの学会事情

まずは、機械学習エンジニアの学会事情について説明します。機械学習に関連する学会には多岐にわたる国際学会が存在します。

代表的なものだけでも下記のような学会があります。

  • 機械学習分野: ICML, NeurIPS
  • データマイニング: KDD. WSDM, CIKM
  • コンピュータビジョン: CVPR, ICCV, ECCV
  • 自然言語処理: ACL, EMNLP

関連分野の詳細な国際会議の俯瞰図は神嶌先生のML, DM, and AI Conference Mapを御覧ください。

上記のアカデミックな研究分野でも、機械学習の実世界への応用には古くから関心があり、2014年頃からICMLやNeurIPS のワークショップとしてSoftware Engineering for Machine Learning NIPS2014 WorkshopReliable Machine Learning in the Wild - NIPS 2016 Workshopなどが開催されていました。

近年では機械学習の実応用への関心が高まりワークショップとしての開催ではなく、査読付きの国際学会も設立されています。海外ではMachine Learning Engineering (ML Engineering)や MLOps とよばれる領域となっています。

2018年に開始したConference on Machine Learning andSystems (MLSys) が実応用を重視した先駆けとなる査読付きの会議です。その後2019年にUSENIX Conference on Operational Machine Learning (以下OpML)といった国際学会も設立されこの分野の重要性が感じ取れます。

OpML’20 について

今回、OpML’20 に投稿した論文が採択されたのでOpML’20 について紹介していきます。

OpMLはUSENIXが主催するイベントとなっており、

  • 2pの論文を投稿して査読を受け、採択されたら口頭発表を行う
  • 審査ありの口頭発表

の二種類の参加方法があります。

昨年参加された方の記事によるとOpML’19では去年の参加人数は210人、投稿数62に対し、採択数が30とのことでした。

OpML’20 はCOVID-19の影響で完全オンライン開催となっており、投稿数は公開されていませんでしたが、僕の投稿が92番目でしたので2つのトラックを合わせて100件近く応募があったのではないのでしょうか。査読付き論文のトラックは20件の投稿があり、10件が採択されたとのことです。

日本からの発表では、2019年にはNTT Software Innovation Center, Preferred Networks, NTT DATAからの投稿が採択されており、2020年に採択されたのは僕たちの発表だけでした。OpML’20での印象に残った発表の紹介を僕のブログ記事にて公開しているので興味のある方は御覧ください。

実務での成果を学会に論文を出すメリット

実務の成果を論文として学会に提出することで得られるメリットはたくさんあります。

成果が論文として残り、分野への貢献ができる

論文形式で実務の成果を残すことで、長期間の記事管理が容易になったり、引用されやすくなるなどのメリットがあります。論文形式で残すことで先人たちの知識が蓄積され、該当分野への貢献することができます。

査読がつく

投稿した論文は、査読者から査読を受けることができます。その際に専門家から、どの点が面白かったかや改善点などの有用なフィードバックを得ることができます。

また投稿論文が採択される事は、査読者から「この投稿内容は世の中に公表する価値がある」と認められることです。試行錯誤して取り組んでいた自分たちのプロジェクトが認められる形になり、プレイヤーとしての自信を得ることができました。

特に査読者の中でも当該分野のエキスパートから、この投稿された内容はとてもおもしろいねと感想をいただけたときは喜びもひとしおでした。

会社、個人としてのプレゼンス向上

OpMLやMLSysでは、Google, Microsoft, FacebookやUberなど、数多くの企業が社内の機械学習プロジェクトの事例を公開しています。

この発表を通じて各企業内部の機械学習の応用事例などが外部に周知され、レベルの高さやどんな領域に取り組んでいるかがわかり、その企業・個人のML Engineering, MLOps領域でのプレゼンス向上につながります。

学会に論文を投稿するまでの流れ

ここからは、自分自身が学会に論文を提出した際の流れを順を追って説明します。

きっかけ

機械学習エンジニアとして働く際に、自分が大事にしている考え方の一つに「巨人の肩の上に立つ」があります。実務で機械学習を適用する際に重要な一つのテクニックとして、実際の問題をパターン化し効率的に解決することが求められます。そのテクニックを伸ばすために自分は積極的に機械学習の応用事例が掲載された論文などを普段から読み込んでいます。

例えば、Eコマースでの検索をテーマにしたSIGIR eCom、推薦システムを対象にした学会であるrecsys、KDDでは応用を意識したApplied Data Science Track Papers という部門などを中心に読み込み、知識を深めています。

それらの論文を読むうちに、自分が関わっているプロジェクトも論文として投稿して、プレイヤーとして世界に通じるか、またこの成果を公開してこの分野に貢献してみたいと思い論文投稿にいたりました。

論文の執筆

2020/01/28から、毎日1時間の時間を抑えて投稿締切の2020/02/25までOpML’20に投稿するメンバーで顔を合わせつつ論文の執筆をすすめていきました。

今回僕らが発表した内容は、社外での発表は今まで前例がありませんでした。そのため、論文投稿の許可を得るために執筆と並行して上長に承認をとった上で、社内のPR・知財・コンプライアンスチームと連携をとり、公開しても問題ないと合意を得ることができたので、論文投稿を行いました。

査読を通るまで

査読通過後、カメラレディを提出するために、査読者から指摘された箇所の修正をしていましたが、COVID-19の影響で急遽完全オンライン開催に移行することが決定し、オンライン開催用動画の録画提出を求められ、焦った思い出があります。

動画収録自体はUSENIX自体がZoomを使った収録方法のマニュアルを提供してくれたので助かりました。ですが英語で約20分の動画を一発で録画するのが想像以上に大変で、リテイクを重ねてなんとか締切内に提出することができました。

まとめ

今回の論文採択と口頭発表を通じて、自分が取り組んだ業務の成果は世界的に見ても価値あることを成し遂げられたのかなと再認識することができました。

OpML’20 でのオンライン発表のために提出した発表動画

もし読者の方で、実務において機械学習で面白い成果がだせたのでなにか形に残したいと思っているなら、論文投稿という形はいかがでしょうか?

これから機械学習の実務での成果を論文として投稿したい場合は、まず最初に関連分野の事例を把握した上で、自分たちの成果がどのように独自性・技術的優位性、面白さがあるのかを考え抜いて適切な学会に投稿してみることをおすすめします。

また、いきなり論文投稿はハードルが高いという方は機械学習の勉強会(例: 僕が運営しているMachine Learning Casual Talks )などで実践例などを積極的に公開してみて、それらを洗練させてOpMLに投稿するというアプローチもおすすめです。自分も勉強会での発表など(発表1, 発表2)をまとめ上げた形でOpML’20 に投稿し採択されるという流れになったのでおすすめです。


Offersエージェント」では、業界で活躍するプロフェッショナルがあなたの転職を徹底サポート。CxO経験者を含む現役エンジニア・デザイナー・プロダクトマネージャーが在籍し、職種に特化した専門的なアドバイスをご提供・非公開求人の紹介も可能です


この記事をシェア

関連記事


副業・フリーランス

プログラミング

インタビュー

デザイン

お金

採用・組織

イベントレポート

転職