tkm2261's blog

研究員(OR屋) → データ分析官 → MLエンジニア → ニート → 米国CS PhDが諸々書いてます

【社会人学生AdC '24】退職米国D進のすゝめと卒業後の米国就労ビザの話

お久しぶりです、tkmです。もう卒業してしまいましたが、昨年に続き社会人学生AdC '24の5日目の記事を書いていきたいと思います。今回は「退職して米国で博士課程に進むことのすすめ」「卒業後の米国での就労ビザについてお話しします。これまで散々このブログに書いてきたので正直ネタ切れ感はありますが、今年の9月にPhDを無事取得出来たのもあり、今回のAdvent Calendarをざっと見た限りでは、退職して留学し博士課程に進む人の記事がなさそうだったので、最近知ったビザ関連の情報を書いていこうと思います。ビザ周りはちょっとセンシティブなため情報の入手が難しいと感じており、とはいうものの誰かが書いていかないと知見が溜まらないので調べつつ書きました。ただし鵜呑みにはしないで最終的には移民弁護士と相談して決めて下さい。

adventar.org

私の留学模様については過去の記事をどうぞ

また、来年の1/13(月・祝)に海外大学院留学説明会2024冬「社会人からの留学」というセッションをオーガナイズします。今回の記事や質問がある方はぜひお越しください。YouTube Liveでの配信を予定しています!

退職米国D進のすゝめ

今回、長々と退職米国D進を勧めるつもりはありません。この記事に辿り着いた方は、自分が退職米国D進するべき理由・するべきでない理由を探していて辿り着いたと思います。社会人にとって留学に限らず退職D進を諦める理由は容易に見つけることができます。というかマトモな思考回路では退職して博士を取ろうとはならないでしょう。そんな中ある程度の狂気が必要な退職D進にさらに留学要素も付け足した狂気の沙汰である退職米国D進について、少しでもするべきでない理由を見つける手助けになればと思います。

1. 英語はマジでどうにかなる。というか現地に行かないとどうにもならない

留学を考える人は、やはり人生で英語を運用できるようになりたいというのが理由のひとつの方が多いと思います。自分はTOEIC 445点から決意して留学当初は英語で意思疎通も不可能なレベルでしたが、何とかなりました。というか死なないために何とかなります。

PhD留学では研究ミーティングで自分の考えを伝える必要があるため、修士と比べて圧倒的に早く英語に慣れます。自分の場合、自分がホストするミーティングが週3であり、これを1年やり終えたあとは何か大体こなせるようになりました。あと英語で生活すると英語という言語のリズムが体にインストールされるので、論文の執筆も英語のリズムで書くことができるようになります。(逆に日本語のリズムでの論文用の日本語を直訳するとかなり不自然というか何かやましいことを隠しているみたいな文になるので注意が必要です。)

これを読んでいる大多数は英語がキツいと思っていると想定していますが、皆さん中高大と10年とか英語を学んでも話せるようになっていないわけで、このまま日本にいても劇的改善することは基本ないです。結局見切り発車で飛び込むしかないです。

それに有名ラボに入りたいとかだと話は違うんですが、こちらの教授は元留学生が多く、英語がヤバい同級生が意外とすぐ英語が話せるようになっているのを多く目の当たりにしています。そのため我々が思うより能力や人柄重視です。さらに米国のPhDは学部卒業から直接出願できる関係上、社会人経験がある場合は大体周りよりはスキル面は強いはずです。日本人は従順でハードワークすると見られているので、学生のマネジメントに不安のある若手の先生には英語が多少アレでも刺さる可能性があります。遠慮なく飛び込んで行きましょう。

2. 教授は知っている人しか採らない。今すぐTwitterで「PhD position」とググろう

米国の場合は一部のラボローテのある所を除いて、各教授がPhD学生を取るかどうかを決めます。最低5年はラボにいて給料も払うわけで、遠くの経歴が華々しい人より近くで計算できるよく働く学生を取る傾向があります。そのため出願の前に教授とある程度話がついていないと基本的に落ちます。行きたいラボがある場合は、コネを総動員してどんな手段を使ってもその教授と連絡を取ってください。

コネもなく行きたいラボも定まっていない場合は、Twitterで「PhD position」とググるのをおすすめします。

https://x.com/search?q=PhD%20position&src=typed_query

米国の場合、学生に給料を払うため予算の関係上そもそも採らない年があります。その点、Twitterで募集している教授は確実に枠があるので良いです。あとTwitterで探している教授は若手が多く、論文をアクティブに出版できるのが良いです。指導教員が大御所vs若手は永遠のテーマですが、大御所の良いところは人脈づくりで、インターンや卒業後にスタートアップをやりたい場合は良いです。ただ英語が駄目だとこれを活用しきれないので、個人的には論文量産できる若手が良いと思います。その点でもTwitterで探すのはおすすめです。

3. 米国PhDの給料は悪くはない。ただ配偶者を連れて行くとキツイかも

PhDの今の給料は大体月$3k~3.5kとかもらえます。これに夏のインターンをすると会社によっては年収で1000万円は超えたりします(CSに限った話かもですが)。散々物価が高いと言われますが、食料輸出国のため食材は日本と同程度です。高いのは外食と家賃で、外食は控えればいいし、家賃は大学寮でルームシェアすれば$1k以下で抑えられると思います。日本にいるときより下手すると貯金ができます。

ただし配偶者を連れて行くと話が違っていて、家賃はルームシェアできないため基本的に倍になり、さらに配偶者の保険は別途払う必要があり、基本的に毎月足が出ると思います。インターンすれば大丈夫と思いますが、食費とか通信費もあってかつ配偶者はビザ的に働けないため、留学中の家計については予めよく話し合っておいた方が良いです。

卒業後の米国就労ビザの話

免責:自分が色々やるうちに知った知識を適当に書きます。間違ったことが書いてある可能性があります。指摘を頂いた場合は随時更新予定ですが、最終的には各自自己責任で移民弁護士と話し合って決めてください。

ようやく本題です。留学の主目的は研究なものの、米国で学位を取ることの大きい利点は米国で就労できるビザが手に入ることです。

以前の記事で「米国の修士就労ビザを金で買う制度」といったりもしましたが、それ目的の留学もかなり多いというかとても一般的です。留学以外で日本人が米国で働けるビザを取得するのは現状かなり難しいです。既に世界的な業績があるか、毎年のグリーンカード抽選で当選ぐらいしか難しいです。これを難しくしているのがホワイトカラーで一番一般的な就労ビザである特殊技能職ビザ(H-1Bビザ)に企業スポンサー(雇用主)が必要な上に抽選があり、日本人にオファー出しても米国で働ける保証がないので、基本的に企業はオファーを出さないです。これをクリアする最も簡単な方法が留学して米国の機関で学位を取ることです。米国の大学はこれを利用して良い商売してるなーと思います。

非移民ビザと移民ビザ(グリーンカード

グリーンカード抽選などを除いて、米国で合法的に暮らしていくためには、非移民ビザ(J-1, F-1, H1-B, O-1, L‐1など)から始まり移民ビザ(グリーンカード)で永住権を目指し、目指したければ米国籍を目指すという流れになります。グリーンカード自体には非移民ビザのような種類はないものの、審査の優先度からEB-1, EB-2, EB-3, ...と窓口がカテゴライズされています。下のカテゴリだと数年かかったり、国別の待ち行列のため中印の人は10年とかかかったりします。その間は何とか非移民ビザで食いつなぎグリーンカードを目指すことになります。それでも駄目な場合は比較的就労ビザの取りやすいカナダに移動になったり、あっけなくレイオフされることになります。非移民ビザの場合は仕事がない場合は60日とかで米国を退去する必要があり、この失業者は雇用統計にカウントされません。なんと美しい国米国という感じですね。

日本人のPhD留学生の場合は、そこまで悪い状況ではなくグリーンカードは下手したら在学中に取れるし、就職後もPhD持っていれば比較的すぐ雇用主がスポンサーしてくれるはずです。(会社によっては学部生の場合、昇進するまでとか1年経たないとスポンサーしないこともある。)ただしグリーンカードのプロセスは自分で主体的に動く必要があり、下手すると貴重な非移民ビザの期間を使い果たし帰国を余儀なくされる場合もあります。今回はそんな人を減らすために体験談を交えて書いて起きます。ただ簡単にまとめると、

日本人のPhD留学生の場合は、論文が出始めて被引用数が二桁行ったタイミングぐらいでEB-2 NIWを出して在学中にグリーンカード取るのがよい。

移民ビザ(グリーンカード)は取ったらずっと米国に税務申告(Tax return)しないと行けないとかあるものの、先ずは米国で生き残ることを優先したほうが良いです。

特別編:ビザ無し訪問(w/ ESTA

日本人の利点はビザ無しで米国を訪問出来ることです。ESTAに登録すれば90日以下の短期商用・観光といった一時的な訪問の場合ビザ無しで米国に来ることが出来ます。これにはトレーニングなども含まれ企業の出張でも使われます。

ESTAで夏季3ヶ月間(90日以内)に米国大のラボに無償インターン的に滞在してよいのか? 完全に安全側に倒した回答では交流訪問者ビザ(J-1)を取るべきということになりますが、インターンと言いつつちょくちょく大学の先生とミーティングしたりゼミに参加するだけならESTAで基本問題ないと思われます。このHarvardサマースクールの記事にもありますが「Only non-credit study is permissible with a B class visa or ESTA visa waiver. 」とあり単位を取得しない活動をする分にはESTAで問題ないはずです。あとJ-1ビザはフルタイム雇用(週32時間以上)が条件となっており、普通の訪問ではJ-1ビザに該当しないですし、フルタイムで働くレベルのプロジェクトがあるならしっかりJ-1ビザをとって給料も要求した方が良いです。一応、滞在中は観光も一杯して写真も残してフルタイムじゃないよ観光の一環だよと後々言い訳が聞くようにしておくと良いかもしれません。入国審査でもインターンなど労働を疑われるワードは避けてPhDを志望しているラボの見学と指導教員候補の人柄を知るための訪問など実態に則した表現にしたほうが良いです。ただし絶対の保証はないので最終決定は自分の責任で実施してください。

非移民ビザ:学生ビザ(F-1)

米国に留学で来た場合は基本このビザからスタートします。ビザ資格の維持のために毎学期12単位の履修が必須になります。F-1ビザは後述するCPTやOPTの特別な場合を除き学外での就労が認められないビザです。安価な労働力が学生の名目で流入するのを防いでいるわけですね。日本人の場合は基本的に5年のビザが貰えると思います。非移民ビザの名の通り比較的自由に帰国出来ますが、学業専念のために大学の許可が必要でTravel SignatureというのをI-20にもらう必要があります。ただしTravel Signatureは1年有効なため基本的に帰りたければいつでも帰国できます。更新もF-1ビザの場合はI-20が有効な内は簡単で、前回はコロナもあったので面接なし郵送のみで更新出来ました。

あと多くの方が勘違いされている事ですが、ビザが切れているイコール不法滞在ではないです。ビザはあくまで入国資格で滞在許可はまた話が違います。F−1ビザの場合は所属先のI-20が有効な内は滞在が許可されています。ただし再入国はビザを更新しないと出来ないため、米国から出ることが事実上出来ない中国人留学生は山のようにいます。

F-1 CPTとOPT:CPTとOPTはどちらもF-1ビザのステータスのまま学外就労するための制度です。最後のTがTrainingを表す用に学業の一環としてIndustry経験を積むための制度です。

CPTは在学中のみ使えて、基本的に留学生はこれを使ってインターンをします。ただしFull-time(週40時間)は夏季のみ許可されており、Full-time CPTはPhD課程通算で12ヶ月以内に制限されています。Part-time(週20時間)は無制限に夏季以外も許可されているのですが、指導教員にその間の授業料負担を求められたりするので(普段は指導教員が払っているが、大学で研究せずにインターンするのならば授業料払ってサポートする義理がない)、あくまで本分は学生ということになります。CPTは授業の一環ということでインターン用の授業を履修した上で働きます。そのため毎回Summer sessionに登録する必要があり$500とかかかったりします。

OPTは卒業後にも使える就労制度で、米国で学位を取ると基本的に1年間、STEM(理系)課程の場合は追加で2年間(STEM Extension)の合計3年間米国で働ける制度です。在学中もこれを行使するPre OPTという制度がありますがありますが使っている人を見てないので割愛します。基本的に貴重な非移民ビザの期間は卒業後に使いたい人が多いのだと思います。OPTは専攻に関係あるものであれば副業も含めて何してもよく企業スポンサーもいらないため非移民ビザの中では破格に制限が緩く期間が限られている以外は最強です。そのためオファーがあれば在学中に先行してH1-Bビザに応募できるのですが、直前で別オファーに移りたい時などは企業に紐づくH1-Bにすると面倒なときがあるので最初はOPTでスタートするのが良い場合があります。ただしH1-Bの抽選機会を一回逃すことになるので難しいところではあります。

OPT Premium Processing: CPTの処理は学内で完結するため数週間で終わる一方、OPTは米国移民局USCISの審査が入るため時間がかかります。この工程をお金で解決するサービスがPremium Processing(通称PP)であり大体$2kを払うと15日に短縮してくれます。PPを払わない場合、現状はここにある通り4ヶ月とかかかったりするので、最終学期に就活していると基本間に合いません。申請に企業スポンサーはいらないので見切り発車で早めに出せますが、現状大多数はPPを使います。$2kは安くないもののPPは就職する雇用主が負担するのは米国で結構一般的なため就職先に問い合わせる事を強くお勧めします。私の場合はRelocation feeの一貫として会社が負担してくれました。

非移民ビザ:交流訪問者ビザ(J-1)

J-1ビザは基本的にインターン用のビザと考えて良いです。企業でインターンする場合やPhDの前とかに大学のラボでインターンする場合に使います。上記のとおり給料が発生せずミーティングしたりゼミに参加しつつ数ヶ月訪問する場合などはESTAで問題ないはずですが、給料をもらう場合や90日を超えるフルタイム労働の場合はJ-1ビザが必須です。インターンが決まった段階で受け入れ先に聞いてみましょう。

非移民ビザ:卓越能力者ビザ(O-1)

名前が表すとおり国際的な業績が必要なものの後述するH1-Bに比べて自由度が高いビザになります。企業スポンサーは必要なものの副業も制度上可能であり延長も容易です。ただH1-Bと異なり配偶者の就労が制限される欠点はあります。申請の書類は後述するEB-1グリーンカードと同じらしく、時間のかかるグリーンカードのつなぎとしてこれに出すのも良いです。ただO-1については在学中に数百とかの被引用数や著名な受賞歴があったら考えれば良いと思います。

非移民ビザ:特殊技能職ビザ(H1-B)

日本人の留学生が就職したら学部修士博士を問わずまず応募するのがこのビザになると思います。企業スポンサーが必要で副業は出来なかったりするのですが一社で働くには十分なビザです。そのためH1-Bビザの取得がF−1 OPTで働く人の当面の目標になることが多いです。あとH1-Bでは配偶者の米国での労働が出来るのも大きいです(O-1は不可)。さらに一度取ってしまえば転職も出来ます。最大の欠点はH1-B capと呼ばれる抽選をくぐり抜けないとどれだけ優秀でもビザが降りない点です。毎年3月に抽選の登録が会社経由であり、年に1〜3回の抽選が実施されます。昔は突破率が7−8割(修士博士の場合はさらに優遇アリ)でOPTの3年間があれば大体大丈夫と言われてましたが最近の出願者の多さで3年で取れないケースも見られます。その場合カナダといった周辺国に異動できれば良い方で普通にレイオフもありえます。楽観視せずにグリーンカードの手続きも移民の意思があるなら進めた方が良いです。H1-Bについても基本的に6年有効なのでそれ以上米国に滞在する場合はどのみちグリーンカードやO-1ビザといった別のビザの考慮が必要になります。

タレコミ: 病院や大学といった非営利団体の場合はH1-B capがなく、かなりの確率でOPTからそのままH1-Bに移行できるとのことです。

非移民ビザ:駐在系ビザ(E-1やL-1など)

日本の企業の駐在や関係の深い会社で働けるビザですがPhD留学で関係ないので省きます。配偶者が働けるためE-1ビザにしてもらったという話は聞いたことがあります。

移民ビザ(グリーンカード

ここからは永住権つまりグリーンカードの話となります。上記でビザと滞在許可は違うと言いった通りビザとグリーンカードは違うのですが基本的に一体なので一緒に議論します。グリーンカードを取る最大の利点はビザで悩む必要がなくなることです。ビザサポートは企業にも負担であり1年働かないとビザサポートしないよとかそもそもグリーンカードないと採用しないよとかあります。いわゆるビッグテック企業は能力重視でこのあたりを比較的厭わないのですが数年前の好景気ならまだしも最近の景気の冷え込みでは早めにグリーンカードを取っておくと米国での就活や安心して滞在する上では重要です。

グリーンカードは一度取ってしまえば優劣はないのですが、雇用ベースのグリーンカードでは審査の優先順位の上からEB-1, EB-2, EB-3, EB-4, EB-5とあり、主にEB-3までの3つのカテゴリがターゲットになるとおもいます。EB-4やEB-5は大多数に関係ないので省きます。

このカテゴリ分けで重要なのが企業スポンサーの必要有無と永続労働証明書 (Permanent labor certification) 、通称PERMの必要有無です。これをどの程度の期間で出して貰えるかは会社により取得する場合は数年を覚悟する必要があります。

  • EB-1は企業スポンサーが必要な場合もあるがPERMは必要なく1年未満で取れる可能性が大です。その代わり国際的に顕著な業績が必要になる。
  • EB-2は基本的には企業スポンサーもPERMも必要なものの、国益免除(NIW)という制度に該当すれば免除できて在学中でも程々の業績があれば日本人は2年弱とかで取得できる。
  • EB-3は企業スポンサーもPERMも必要。ただしPhD持っていればEB-2に該当するので出すことはないかも。

そのため繰り返しになりますが、

日本人のPhD留学生の場合は、論文が出始めて被引用数が二桁行ったタイミングぐらいでEB-2 NIWを出して在学中にグリーンカード取るのがよいです。

しかも引用数があっても卒業から時間がたっているとNIWに該当しなくなるらしく、NIWなしのEB-2だと、PERMの取得で1−2年、ビザの審査で2年とかかかってしまうのでH1-Bの6年でも結構ギリギリになります。そのため業績が温かい内にEB-2 NIWの手続き進めると良いです。

EB-1 (Employment-Based Immigration: First Preference)

EB-1はExtraordinary ability(EB-1A)、Outstanding professors and researchers(EB-1B)およびMultinational managers and executives(EB-1C)のどれかに該当する、ざっくりいうと業績がすごい人が応募出来るビザです。

EB-1Aの場合は企業スポンサーもいらないためアクセス出来る移民弁護士に聞いて該当するかどうか聞いて下さい。EB-1BとEB-1Cは企業スポンサーが必要なので基本的に会社の契約している移民弁護士に問い合わせてEB-1で行けるかを聞くとよいです。私の場合はアンケートに答えると弁護士から連絡が来てEB-1Bで行けそうだから行きましょうみたいな感じでした。ただしEB-1の場合は早くグリーンカードが貰える反面、推薦状依頼の手間や書類仕事が増えるのでOPTで十分な期間がある場合はEB-2 NIWで申請した方が楽な気がしています。というかEB-1に該当する時点でO-1ビザも行ける人材なので米国での滞在は正直どうにでもなると思います。PhD課程でしっかり業績積んで頑張りましたね、という感じです。

EB-2 (Employment-Based Immigration: Second Preference)

EB-2はPhDといった上級学位がある人や優れた能力の証明が出来る人が応募できるカテゴリです。審査の待ち時間が国毎なため中国とインド人だけは話が違うのですが、それ以外の人は条件を満たすと2年未満で取れたりします。特に国益免除(NIW)が通れば企業スポンサーもPERMも必要ないため弁護士費用の$2k−3kの自己負担(ルームメイト談)は必要なものの、PhD在学中に取得が可能です。私のイラン人のルームメイトは在学中にこれでグリーンカードを取得していました。

国益免除(NIW)には自己引用を除いた被引用数が数十が必要と言われており、ただし分野に依るので詳しくは移民弁護士と相談した方がよいです。在学中にグリーンカードが取れると就活なので凄い幅が広がります。ビッグテックの場合はグリーンカードの有無で給料は変わらない問われていますが、その他では就職の難易度に直結するので早めのNIWでグリーンカードを取っておくと良いです。就職後であってもEB-2 NIWは最も現実的なグリーンカードの手段である事が多いです。就職後に出す利点は弁護士費用を会社が負担してくれる可能性が高いことです。ただし、聞いた話だと卒業して時間が経つと被引用数がある程度あっても今現在の能力と認められずNIWが出せないケースもあるとのことなので申請するなら早めが良いです。

タレコミ: NIWの場合引用数二桁というよりかはself citationを除いた引用があり、かつトピックがある程度独立している研究論文が最低3本あること、また最低2人程度の教授から推薦状をもらえること、博士取得後の就職先にある程度算段がついていて、proposed endeavorに書けることが大事とのことです。

タレコミ: 弁護士費用の$2k−3kじゃ済まない。I-140の申請費用込で100万円ぐらいはかかる。

EB-3 (Employment-Based Immigration: Third Preference)

ここまで来ると米国のPhD関係ない普通の雇用ベースのグリーンカードになるのでよく知らないので各自調べて進めるとよいです。

グリーンカードにおけるPremium Processing

OPT同様にEBにおいてもPremium Processingで$2.5kぐらい払うと審査を14日以内と劇的に早くすることができます。ただしPPで早く出来るのはI-140の審査が始まったあとの話であり、EB-1でもその後の処理で数ヶ月はかかり、EB-2ではさらにI-140提出前のPERM取得に数年、I-140の審査が始まるまでの待ちで中国人やインド人の場合は10年待ちとかになります。日本人の場合(というかその他の国)は大体2年はかからないようです。待ち時間の目安はこういったサイトで確認できます。中国、インド、フィリピン、メキシコ以外の国は大体同じ様な扱いみたいです。

番外編: グリーンカード抽選 (Diversity Immigrant Visa Program)

名前を知っている人は多いと思いますが、米国への移民が少ない日本人には多様性プログラム(DV)による移民、通称グリーンカード抽選の権利があります。顔写真や簡単な情報だけで応募出来るので出している人は多いと思います。採択率は極小ながら受かってしまえば諸々の面倒なステップを飛ばしてグリーンカードが取れるので、とりあえず出すと良いです例年10−11月に応募して5−6月に結果がわかる仕組みです。デメリットはないのでとりあえず出すと良いと思います。

最後に

米国ではペーペーのエンジニアでも日本のプロ野球一軍選手レベルの給料がもらえる恵まれた環境です。その反面外国人にとっては就労できるビザを取得し維持する努力が必要になります。米国との関係がよい日本人の場合は恵まれている面も多い反面、日本人移民が少なくビザや移民の情報を見つけるのが中々難しい状況です。多分多くの方が今回EB-2 NIWなんて初めて聞いたと思います。当たり前ですが知らないと制度は使えません。中印の人はEB-2 NIWであっても数年から数十年かかります。これは単純に米国で働きたい人が山のようにいるからです。この給料格差だと今後米国で働きたい日本人は確実に増加していくと思われます。まだ日本人志望者が少ない内に、米国でPhDを取ろう&働こうと行動を起こしてみると良いと思います。この記事が少しでも参考になったら幸いです。

Appendix: GPT-4oによるコメント

Q: この記事の中に米国ビザについて事実誤認はありましたか?

A: 記事の内容を確認しましたが、全体的に米国のビザ制度についての説明は正確であるように見受けられます。ただし、ビザや移民の手続きは非常に複雑で、法律や政策が頻繁に変更される可能性があります。そのため、最新の情報を得るために、具体的なケースについては移民弁護士や専門家に相談することを強くお勧めします。

以下にいくつかのポイントを挙げますが、これらは一般的な情報に基づくもので、必ずしもすべてのケースに当てはまるわけではありません。

  • H-1Bビザの抽選: 記事では、H-1Bビザの抽選について言及されています。実際には、抽選の当選率は毎年異なり、最近では申請者数が増加しているため、当選率が低下しています。
  • EB-2 NIWの条件: EB-2 NIW(国益免除)は、特定の条件を満たす必要があります。被引用数は一つの指標ですが、他にも様々な要素が考慮されます。移民弁護士と相談することが重要です。
  • OPTとCPTの利用: OPTとCPTに関する情報は正確に記載されていますが、具体的な利用条件や手続きは学校やプログラムによって異なる場合があります。
  • ビザの更新と滞在許可: ビザが切れても、I-20が有効であれば滞在が許可されるという点は正しいですが、再入国にはビザの更新が必要です。

ビザや移民に関する法律は複雑で、個々の状況によって異なる場合がありますので、専門家の助言を求めることをお勧めします。

【Kaggle AdC '23】米国の大学・企業でのKaggle実績の受け取られ方雑感

お久しぶりです。tkmです!

Kaggle AdC '23の6日目として「米国の大学・企業でのKaggle実績の受け取られ方雑感」についてつらつらと書いて行きたいと思います。

qiita.com

昨年Kaggledays Championship at Barcelonaでの優勝から、Kaggleとは少し離れてしまっていますが枠が空いているということで技術的ではないポエムですが投稿します!

注意:これは私が体験した極めて主観的な感想であり一般化して受け取るのは危険です。

TL;DR 実績にそれほど効果はないが、獲得賞金を交えて話すとたまに効く。

正直、実績にそれほど効果はないしGMだからってそれで超すごい!みたいになることはない。

こっちの大学でも機械学習の授業でKaggleは一応習うが特にガチる人は見たことないし、教授としてもコンペと研究は違うと認識しているのでKaggleの実績単体で超評価することはないといった感じ。

近年のML/CV/NLP研究室への出願者のスペックインフレが激しいので、基本的に「手が動く」と見られるKaggle実績は補助的な評価尺度になりがち。

多分、多くの先生方は納得頂けると思うけど、新しいPhD学生を指導する上で一番の難関はTop-tierの会議や雑誌に投稿できるクォリティの論理構成や書き方を指導するところなので、既に論文を持っている学生を取ってしまうのが一番楽。近年のスペックインフレの状態では米国大だとそれが出来てしまうという現状がある。なので、論文持っている>>>Kaggle強いという評価が多い。

(脱線すると、学部修士中に第2著者以下でも論文に関わるのが米国PhD合格にとても大事なのだが、日本の卒論修論の独立してやることをほぼ強制されるシステムは絶望的に相性が悪い。米国PhD留学生を増やしたいなら強制ラボ所属廃止と卒論修論廃止が良いと思うが、特定学生に集中して全体としては学生への教育労力の削減になるので難しそう。)

一方、MLを手法として使っている分野ではMLで手が動くのは評価されるし、そのラボの研究に関連するコンペで勝ってたらかなり効きそうではある。

ただ残念ながらKaggle GMだから米国でウハウハ!ということはなかった。

とはいえKaggleでの実績をみてLinkedinでDMくれる人もいるので全く無駄ということはない。コネ社会の米国で向こうから連絡をくれるのは全くコネなしの第一世代移民にとってはかなり価値があるものである。Kaggle実績は銀の弾丸ではないというだけ突破口にはなる。

日中韓印の人にはそこそこ刺さる。

Kaggleやるとわかるが、日中韓印の人々のKaggle熱は凄いので刺さる人にはたまにささる。ただもちろんどのコンペで何をしたかを話せる必要がある。(最近昔のコンペでやったことを忘れて来ており、これが年を取るということかと最近焦っている。)

賞金額は正義

経験談としてインターンでプロジェクトで手法を提案するときに「この問題設定は、過去のこのコンペと類似しており、有効性が示されたこの手法を使いたい。ちなみに自分はこのコンペで$30k獲得した。」というとウケが良かった。取り組む手法の妥当性と自分が取り組み意味を一緒に示せるので良い。働いたことある人は経験あると思うけど、プロジェクトは走り出したら勝ちなので雑多な議論は実績でバリアできると色々面倒が少なくなる。やり過ぎると嫌な奴なのだが、社会には変なやつが多いので面倒が減らせるなら実績は適度に使うとよい。

そもそもKaggle実績って全面に押し出すべきではないよね

Kaggleも学歴と一緒で過去の実績なので、まともな人はそれを全面に押し出したりはしない。働き始めてからも〇〇大卒やセンター(共通)試験の点数でドヤってたらTwitterでネタにされるように、過去実績は全面に押し出すと角がたつので匂わせるぐらいが一番カッコよい。

日本の上位Kaggle勢もKaggle入賞歴を全面に押し出す必要がないぐらい各分野で既に活躍しているし、客観的な成果がまだ出てない人もKaggle実績を直接押すよりはKaggleを通して得られたものを言語化して伝えた方がウケが良いはず。

個人的には、手前味噌ながらKagglerで鍛えた自分の実験管理や実装スキルやスピードは他の学生と比べて卓越しているように見えるし(自分は5年会社を経た退職D進だからそりゃそうではあるが)、Kaggleで学んだやり切る姿勢は、研究でも仕事でも活きている。

ただし客観業績を積み上げるのは自分に味方してくれる人への優しさでもある

Kaggleである必要はないが、実績という客観評価を積み上げる事は大事で、自分に味方してくれる人への優しさであるだと思っている。もし誰かが自分を何かのプロジェクトに抜擢してくれる時に「彼Kaggle GMなんすよ!」と偉い人に言えたら例え自分がプロジェクト失敗しても自分を推挙した人に責任が行きづらいし、そもそも自分を推挙してくれる人に一言で偉い人に伝えられられる言葉を客観評価は渡すことが出来る。いかに凄い人でも客観評価なしに抜擢しろは傲慢になりがちだし、自分に味方してくれる人への優しさとして客観的な実績はあったほうがよい。Kaggleである必要はないけど。

これが濫用された結果が過度な学歴フィルターとかになるんだけど、評価される側が客観業績を頑張るのは基本良いことと思う。

直接的に得るものが少なくてもKaggleに参加してしまうのがKagglerの性

何か偉そうなことを書いてしまったけど、結局みんな大体Kaggleは楽しいからやっていて何か役に立ったらラッキーぐらいの感覚と思う。プロになれないからって部活やらない理由にはならないのと一緒で「Kaggleを通して得られたのは最高の仲間です!」エンドで良いと思う。

なので百万回言われているけど、就活を目的にKaggleをやると結構ツライはず。ただ始める動機は就活でも何でもいいのでKaggle楽しいので是非挑戦して欲しい!あのLBを駆け上がる快感を是非一度堪能して欲しい。

今年はプライベートのごたごたでメンタルをやられ、卒業に向けてのインターンや論文投稿などの忙しさもあってKaggle控えていたけど(始めると止まらないので)、来年からは私も復帰します!

サンフランシスコ短期滞在の宿探しTipsみないなもの

お久しぶりです。tkmです。

Twitterにも投稿していましたがこの夏にSFのミッション・ベイにある某社で3ヶ月夏のインターンをしておりました。

その際に、宿探しに結構苦労したので後の人のために少し役立ちそうな情報を書いておきます。私はCentral Richmondというゴールデンゲートブリッジの近くに住んでいましが、治安が良い反面オフィスまで遠かったので今なら別の所にしたと思います。

マリファナと小便の臭う街・サンフランシスコ

今更強調する必要もないと思いますがSFは治安が終わっています。特にTenderloinとCity centerの周りは浮浪者だらけでヤバい雰囲気が行くだけでわかります。

その反面、ギャングとかが幅を利かせている類のヨハネスブルグみたいな治安の悪さではなく、浮浪者とかが徘徊しており時折クルマの窓を割っての窃盗といった軽犯罪が溢れているタイプの治安の悪さなので、地域を避けてしっかり自衛すればある程度は対処がしやすいのかなと言う感じです。大人が一人暮らす分にはなんとでもなるけど、子供をここでは絶対に育てたくない街という感じです。

まずサンフランシスコに住まないという選択肢を模索する

私同様にSFでのインターンが決まっていて家を探していると想定します。まずは会社に従業員用シャトルバスの停留所を確認しましょう。

ベイエリアの大きな企業なら大体通勤バスを周辺に走らせています。そのためOaklandなどのEasy bayや南のDaly cityあたりに住むのが一番コスパが良い可能性があります。

私は今ならDaly cityあたりに家を探したと思います。Daly cityからSF市街地には高速で30分ぐらい行けるので十分近いです。私のRichmondからだと下道で1時間ぐらいかかりました。(間の停留所の数にも依る。)

OaklandとDaly cityはともにBARTで市内に行けるのも良いです。(ただしOaklandも治安が悪い地域があるので要注意。)

それでもサンフランシスコに住む場合

一応上司にインターン前に家探しアドバイスを貰ったのでここに置いておきます。

  • Tenderloinは絶対避ける。
  • MissionならBART駅周辺は避けてValencia St側が良い。
  • SoMaはアパートいっぱいあるけど安全を求めるなら5th Streetより東側が良い。
  • その他Noe Valley, Cole Valley, Castro, Sunset, Richmond, Lower Haight, Hayes Valley, Marina, North Beach, South Beach, Japan Townとかは良い。

これに従って、私はRichmondにして治安の良さには満足しています。ただ会社まで10kmでチャリ通が大変だったので次あったら別の所にします。Daly cityが第一候補ですが、今思うと男単身ならMissionとかSoMaの辺りでも良かったかなと思います。

ちなみに10kmチャリ通が片道40分で会社のシャトルが1時間10分ぐらいだったのでチャリ通のほうが早く、市街地のバスの運転は乗り物酔いになるのでチャリ通のほうが快適でした。

短期ならAirbnbがやはり安牌

短期滞在で信頼出来る大家を探すのは至難の技です。当然高くはなるが(月$2.5k以上)手間暇と詐欺のことを考えるとAirbnbが一番良いです。それ以外だと個人取引になり詐欺の可能性が一気に上がります。(Redfinみたいなサービスは基本長期滞在向け)

個人取引で家を探す場合、独断と偏見ですがF◯cebook Marketplaceは絶対避けた方が良いです。あそこマジで詐欺だらけです。

こっちも危ないのですがまだCraigslist(日本のジモティーみたいなサイト)の方が良いです。一応地元民が使うサイトなのでまともな投稿も多いです。

sfbay.craigslist.org

私は最終的にCraigslistで月$1.5kの部屋を見つけました。(Private roomでバスルームはルームメイト一人と共用)

周りに聞くとかなり安い価格なのでラッキーでしたがこれが詐欺の可能性もあったので万人には勧めづらい。Security depositの$1kを先に払ったけどいざついたら鍵貰えなかったみたいな可能性は大いにあったと思います。

あとVenmoみたいな米国の個人間決済手段がないとCraigslistは使うのが厳しいかもなので日本から来る場合みたいなのは大人しくAirbnbが良いと思われます。

サンフランシスコは自転車が便利(※電動自転車に限る)

自分はLAからギアなしの自転車を持っていったのですが、坂の街の名称は伊達ではなく動力補助のない自転車でSFを走るのは相当の覚悟と体力が求められます。

電動自転車は市内至る所でこのLyftのやつが借りられるのでチャリ通するなら無理せずこれを借りてしまうのが良さそうです。

https://www.lyft.com/bikes/bay-wheels

社食完備ならホテル滞在という選択肢

Uberの運転手と話していたら最近ホテルの部屋の価格が落ちているらしく月$2.5kぐらいで住めるところもあるそうです。(ただヤク中が使ってるような安いホテルは絶対避ける)

私の場合会社で3食賄えて家には寝に帰るだけだったので今思うとホテル暮らしでも良かったなと思います。ただ外食は高いので事前に社食の情報を聞いておくのをおすすめします。

公共交通機関にはスマホのウォレット機能が便利

SFの公共交通機関は基本的にClipper cardで全部乗れるのですが、物理カードを買いに行かなくてもスマホのウォレット機能でセットアップ出来てオートチャージも出来るのでこっちの方が楽です。

サンフランシスコに駐車場がない問題

一応住宅地のストリートパーキングは基本無料で出来るのですが、かなり競争率が高く毎回探すのは面倒だし、長期間止めて置くのも窓が割られそうなのも心配です。駐車場を契約するにも市内だと月$300以上はします。

なので私は知り合いに教えて頂いた、BARTのDaly city駅の駐車場に3ヶ月間クルマを駐車していました。幸い窓も割られず無事でした。

https://www.bart.gov/stations/daly

HPにある通り、Multi Day Reservedで一日$6で駐車出来ます。土日祝は無料なので一月$120程度で停められるので許容範囲でした。さらにBARTのスマホアプリで支払いとかが出来て便利でした。

ちなみにMonthly Reserved ($105)はOvernightが許されないので停めっぱなしにする場合はMulti Day Reservedにする必要があります。

絶対に一瞬でも通信機器を車内に放置しない

こっちはクルマの窓が割られての窃盗が有名ですが、あれもランダムにやっているわけではなく車内に通信機器があるかをデバイスで探してターゲットを探しています。そのためいついかなる時も絶対に通信機器を社内に放置しないことが大事です。あと当然ながら荷物を外から見えないようにしておくのも大事です。

SFに滞在するなら夏でも寒さ対策必須

SFは例外的に夏でも寒い(15℃とか)ので、半袖短パンとかだと地獄を見ます。基本的にユニクロのウルトラライトダウンが必要なぐらいの気候なので長袖+上着ぐらいは絶対に持ってきましょう。ちなみにこれはSFに限った話なのでSan Joseといった他のベイエリア地域の場合は普通に夏は暑いです。

ゴールデンゲートブリッジもベイブリッジも今はネット支払い完備

ゴールデンゲートブリッジもベイブリッジはなんかFasTrak (日本のETCみたいなやつ)がないと面倒と思っていたのですが、今はナンバープレートでネット支払い(48時間以内)出来るので楽でした。ちなみにSFから出ていく場合は無料で来るときのみ課金されます。

サンフランシスコが避けられるなら避けた方が良いよ

長々とTips的なのを垂れ流しましたが、もしインターンで選択肢があるならSF以外がやっぱり良いですよ。チームマッチ次第ですがSunnyvaleとかSan Jose辺りのオフィスに出来ないか交渉するのもよいと思います。SFの良いところは夏でも涼しいのと日本食も含めレストランがいっぱいあるところぐらいでした(なお値段)。

【社会人学生AdC '22】日米研究室の違い: 日本の研究室で論文量産するの無理じゃね?

お久しぶりですtkmです。昨年に続き、社会人学生AdC '22の12日目として日米研究室の違いについて話して行きたいと思います。もう流石に留学生活ネタは尽きてしまったので、そこは他の方のを見られるとよいかもしれません。

adventar.org

昨年の記事はこちら

yutori-datascience.hatenablog.com

*私の詳細な留学模様については過去の記事をどうぞ

TL;DR: 日本の研究室は人が少なすぎる

煽った記事タイトルをつけましたが、別に日本の教授やその他人材や設備が著しく劣っているとかそういう次元では無く。単純に人が足りない。正確に言うと稼動が計算できる人がいない。私の日本の指導教員は「助教時代が一番研究できた。」と言っていたが、助教は講座で1, 2人でこれに少々の博士学生を加えても全く全然足りない。

論文を書くには多大な労力が必要なので今の人がいない状況で論文が出ているのは逆に凄いことのように思えてくる。(紙と鉛筆がメインの分野はわからないが。)

米国の研究室の主力は博士課程学生

周りをみると概ねPI一人に付き4-5人の博士課程の学生を持っている。これは予算によってキャップされるので大きいラボは10人とかいる。(その場合一人で見きれないのでポスドクを雇ったりする)。つまり彼らは雇用されており、PIの指示の下フルタイムコミットで研究する人員がこれだけ揃っている。

Twitterでは日本の教授や准教授は科研費といった研究費申請と学務に忙殺されて研究が出来ないというのはちらほら見受ける。ただこれは日米同じであり、PIはむしろそれが主業務で、基本的に研究指導はするが自分は手を動かさない場合が多い(というかそう期待されている)。

科研費の採択率30%が低すぎて労力を無駄にしているという話もあるが、米国のNSFの採択率は10%ぐらいで、そこで大きい差はでない。というか米国のほうが大変である。 学務においても、米国は教授のサポートが多いというが、結局教授でしか出来ない仕事(授業、学会業務、入試業務)があり日本のと比べて著しく楽になっている感じもしない。というか州立大の事務はかなり酷い。

結局、違いは博士課程学生の数である。とくにフルタイムコミットの博士課程学生の数。競争的資金という米国っぽい方式を導入してみても根本の博士課程学生がいなければこれが回るはずがない。PIがいくら忙しくても各博士課程学生に週1時間MTGができれば研究を回して行くことは可能であろう(論文投稿前を除く)。こうなると「学部修士の学生がいるではないか。」という話になるが、残念ながら彼らは戦力というよりむしろ重荷になりがちである。

学部修士の学生は基本的に戦力にならない

彼らの能力が劣っているわけではない。むしろ年々凄い学生が増えている気さえする。

ただ戦力として計算できない。これがキツイ。この増田でも指摘されているが、学生のやる気に依存している現状は研究をリスクに晒すだけで、積極的に彼らを研究に加えたいとは思わない。

anond.hatelabo.jp

正直な話、たとえ少し追加の手間がかかっても、研究室の端っこでやった適当なおままごとを卒論修論にして旅立っていってもらいたいと思っている研究室は多い。つまり学部修士の学生は研究の戦力どころか重荷なっているケースが多い。

これも指導教員の立場にたつと仕方がない。最長3年(しかも色々ぶつ切りにされる)しかいない学生に一生懸命研究指導しても、一番佳境の時期にインターンだ就活だで稼働が計算できないのならば最初から放置が一番安定の選択になる。

この場合、たとえ自分の研究ネタであっても、学部修士を頑張って指導するよりかは、稼働が計算できるところと共同研究してしまうのが手っ取り早い。教授や准教授なら別に主著論文が必要なわけではないのでそれで良い。

そのため、超優秀な学生が来たら、とりあえずやらせて目が出そうなら掬い上げるという方式になる。つまりかなりの部分を自力で研究者の道を切り開く必要があり、少子化の日本でかなり贅沢な人材の使い方といえる。

日本の博士課程学生は戦力になるか?

「戦力になる。」と言いたいところだが微妙な面がある。能力云々というか、上記の放置が基本戦略な状況から博士課程学生になっても結局その延長線上になりがちである。やはり優秀な人は生き残って行くし、独力で何とかするのを尊ぶ空気さえある。つまり博士課程のエコシステムがない。

残念ながら世界的にAcademiaにおいては「指導教員についてその分野の価値観を学び、そこで評価される研究を行う。」という超属人的なシステムでしか研究者を育てることに成功していない。これはシステム化大好きなはずの米国でさえ採用している以上、現状の最良の方法と思われる。学会がコミュニティである以上、指導教員の導きは思っている以上に大きい。

そういった指導がされている日本の研究室があるのは知っているが、博士課程でもやっぱり放置して頑張れが指導教員としては合理的な選択になりがちである。以前投稿もしたが「早すぎる独立」つまり千尋の谷に突き落とすという人材を贅沢に消費する戦略になっている。

これは指導教員としてはある程度仕方なく、博士課程の学生は自分で授業料を払っているわけで強制する力はないし(なんなら自分で学振もとっている)、米国の5年の博士課程と違って3年なんだから「手取り足取りは修士で学んでいるべき。あとは独力で頑張れ。」という態度になりがちである。

結局ラーメンハゲが正しく、指導教員も強制して学生と揉めたくないので軽いアドバイスに留めて放置が安牌となる。満期退学になっても「残念、芽が出なかったね。仕方がないよ。研究なんだから。」と、そんな訳ないだろと言いたいところだが、これが許容される雰囲気を感じる。

研究者育成にはまとまった時間と規模が必要

じゃあどうしたら論文を量産してくれる学生が育つかというと、結局指導教員制度は丁稚奉公なので、ある程度強制する力がある丁稚時間と、指導した分を論文量産で返してくれる奉公時間を指導教員に与える必要がある。米国の今の制度は5年を良しとしている。

これを一人づつやるのは効率が悪いので、複数人の博士課程を継続して採用して5−10人のチームとして動くのが効率がよい。日本では博士課程学生は少数でかつ互いに独立しているのをよく見るが、これは将来独立した研究者になるには良い訓練と思うが、PIが獲得したテーマのもとチームで攻めるのに比べると効率が著しく悪い。

これのせいで、よく日本で耳にする「先に論文を出したのは我々だが、外国のグループに周辺の仕事を抑えられた。」といのはそこかしこで起きていると感じる。論文量産にはやはりチームが必要。これは自転車ロードレースで集団相手に単独で戦っているようなものなので絶望的な差になる。

チームで近接した分野をリソースを共有しつつ各々で攻めつつ、主著と共著に互いに入り合って進めていくチーム作りが論文量産には絶対必要。

博士課程学生の維持にどのぐらいお金がかかるか。どこから捻出するか。

ウチの場合、博士課程学生の維持には1クォータで授業料$6kと給料$6kがかかるため、年間$36k(夏学期除く)がかかる。もし夏も研究して貰う場合は授業料は無いので年間$42kが博士課程学生の維持コストとなる。5人雇ったら$210kになり小さいラボでは維持がキツイ。

ただ米国の博士課程学生はTAや採点係の雇用が保証されており、教授は給料$6kをTAしてもらうことにより負担を軽減できる。つまり研究費が潤沢なラボは研究すれば良く、そうでない場合は大学がTAとして給料を出している。(TA業務は重いので研究にかなり支障がでるが。)

こういった制度をいきなり日本でやるのは無理だと思う。ただ競争的資金で米国に似せた方向に舵を切った以上、博士課程の給料が出ないのは片手落ちである。

個人的には修士の授業料(ときにProfessional系修士の授業料)を爆上げかつ乱立させて原資を稼いで欲しい。博士課程学生はこれのTAをやれば稼げるようになって欲しい。

今でさえ東大修士といっても千差万別だし、もう入試ザルにしてクソ辛い課題を2年間こなしたらほぼ誰でも取れるようにしようぜと思う。米国のオンライン修士なんてまさにそう。東大であっても修士レベルで高学歴もブランドもクソもないよ。修士卒で凄い人もいるけどその人別に修士だから凄いわけではないでしょ?

日本は怪しげなプログラミングスクールやらセミナーが乱立して社会人以降の学び直しが全く機能していない。ここに浪費されるお金をしっかり大学に持ってきて大学がお金を稼いで欲しい。Professional系修士なら就職予備校でいいんだよ、DockerとかGitでも教えればいい、生徒が満足して金払うなら。それで助教以上の人がこのコマでより雇用されるなら万々歳。卒論修論ナシなら大して負担もないでしょう。

日本の研究室は人もいないのに労力の配分がなんかおかしい

人はいないわ忙しいわで回っていない日本の研究室事情だけど、そんな状況なのに何か労力の配分がおかしいと感じる。自分が日本の学部や修士にいたときは何とも思わなかったが、たかが学部や修士の学生の卒論(研究)指導に労力を割きすぎではないかとおもう。卒論修論を通して学べる論理的な文章の書き方は学生にとっては良いが、労力に見合っていない。もうポスター発表とかで良くないか?何ならグループワークでも良い。教授陣雁首揃えて、たかが学部修士の研究を真剣に見る必要あるか?

学生としても無駄に労力とられるし、修士進学するなら卒論の労力で国際会議付属Workshopの論文でも指導教員と書き上げた方がよっぽど身になるし履歴書に書けるし一応ラボの業績にもなる。

最近大学の先生が企業のインターン等で研究時間が減っていることに憤慨していて、それはそうと思うが。そういう学生に注ぎ込まれる貴方の時間が勿体ないと思う。そういった学生はどうせ研究ガチらないんだから授業だけで卒業出来るようになるのがWin-Winのはず。どうせそういう学生をとる企業は出身大学名しか見てないんだから厳しくしたって誰得だよ。

最後に

色々書いたけど私が適当に思いつくものは、現場の人々はとっくに考えていて、それでも出来ない事情があるんだろうなと思う。あと私が米国でPhDを取っているせいで米国のシステムにバイアスもされている。

ただ普遍的に「人がいないと論文が書けない。」は事実なので。本当に何とかなってほしい。景気が良い頃は企業の中央研究所がこの博士課程の問題を補完していたと思うが、軒並み潰れた現状、博士課程の社会的位置づけとシステムの見直しが求められているのだと思う。

Kaggledays Championship Finalをぶっちぎりで優勝した。

Foursquare - Location Matchingコンペで2位でした。

Tkmです。

色々問題のあった、Foursquareコンペですが一応2位ということで確定しました。TrainingがTestに紛れ込むという前代未聞のことでしたが、起こってしまったことは仕様がないです。

Kaggle側にデータ解析コンペへの愛のない対応が最近目立つので、今後どうなっていくのか見ていきたいものです。

ずんだもんとめたんで学ぶKaggle 入門 & 参戦記の動画を上げました。

お疲れ様です。tkmです。

前回のブログでご報告したPetfinderコンペはノリと勢いで動画化しつつ参戦するという試みを行っていました。なんと幸運にも2位入賞も出来て、賞金入賞の過程を動画化できた貴重な感じになっているので、良ければご視聴下さい。全部でPart 11までありますが、多分2時間ぐらいで全部見れるはずです。

www.youtube.com