サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大そうじへの備え
yutori-datascience.hatenablog.com
お久しぶりです。tkmです! Kaggle AdC '23の6日目として「米国の大学・企業でのKaggle実績の受け取られ方雑感」についてつらつらと書いて行きたいと思います。 qiita.com 昨年Kaggledays Championship at Barcelonaでの優勝から、Kaggleとは少し離れてしまっていますが枠が空いているということで技術的ではないポエムですが投稿します! 注意:これは私が体験した極めて主観的な感想であり一般化して受け取るのは危険です。 TL;DR 実績にそれほど効果はないが、獲得賞金を交えて話すとたまに効く。 正直、実績にそれほど効果はないしGMだからってそれで超すごい!みたいになることはない。 こっちの大学でも機械学習の授業でKaggleは一応習うが特にガチる人は見たことないし、教授としてもコンペと研究は違うと認識しているのでKaggleの実績単体で超
お久しぶりです。tkmです。 Twitterにも投稿していましたがこの夏にSFのミッション・ベイにある某社で3ヶ月夏のインターンをしておりました。 Internship Day 1 pic.twitter.com/QiXMk6TGDR— Takami Sato (@tkm2261) 2023年6月26日 その際に、宿探しに結構苦労したので後の人のために少し役立ちそうな情報を書いておきます。私はCentral Richmondというゴールデンゲートブリッジの近くに住んでいましが、治安が良い反面オフィスまで遠かったので今なら別の所にしたと思います。 マリファナと小便の臭う街・サンフランシスコ 今更強調する必要もないと思いますがSFは治安が終わっています。特にTenderloinとCity centerの周りは浮浪者だらけでヤバい雰囲気が行くだけでわかります。 その反面、ギャングとかが幅を利かせ
お久しぶりですtkmです。昨年に続き、社会人学生AdC '22の12日目として日米研究室の違いについて話して行きたいと思います。もう流石に留学生活ネタは尽きてしまったので、そこは他の方のを見られるとよいかもしれません。 adventar.org 昨年の記事はこちら yutori-datascience.hatenablog.com *私の詳細な留学模様については過去の記事をどうぞ Ph.D.編入が決まったので入学からあったことを時系列で書いてみる - tkm2261's blog 米国大学院でCS修士について書いてみる - tkm2261's blog コネなし論文なし英語苦手なアラサーのおっさんだけど米国CS大学院入学に頑張ったので全てを晒す ー はじめに - - tkm2261's blog TL;DR: 日本の研究室は人が少なすぎる 煽った記事タイトルをつけましたが、別に日本の教授や
お久しぶりですtkmです。今回は退職D進勢もOKとのことで社会人学生AdC '21の5日目として米国でのMS/PhDについて書いてみようと思います。 adventar.org *私の詳細な留学模様については過去の記事をどうぞ Ph.D.編入が決まったので入学からあったことを時系列で書いてみる - tkm2261's blog 米国大学院でCS修士について書いてみる - tkm2261's blog コネなし論文なし英語苦手なアラサーのおっさんだけど米国CS大学院入学に頑張ったので全てを晒す ー はじめに - - tkm2261's blog はじめに この記事に来た方々は、程度の差はあれD進に興味があるかと思います。ありますよね? 無責任に言うなら、D進を迷っている人はD進したほうが良いと思います。人類のほとんど全ての人はD進なんて考えもしない中、頭によぎるだけで十分素質があります。 博士
kaggleツイートコンペPrivate 5位でした!GMまであとメダル2つ pic.twitter.com/psshCyctgp— Takami Sato (@tkm2261) 2020年6月17日 解法 (英語) www.kaggle.com 解法(日本語) チーム組んだguchio3さんの記事 guchio3.hatenablog.com 解説動画 www.youtube.com
こんにちは、tkmです。 最近ちょうど車の更新の案内が来たので車を個人売買で買った時のことを書いておきます。 免責: これで実際車買ってトラブルにあっても知りません。1年前のことを思い出して書いているので正確でない場合があります。そもそも州によってルールが違う場合があります。 個人売買のトラブルは多い 個人売買の魅力はディーラーで買うよりも安く車を手に入れられることですが、典型的なレモン市場であるので結構トラブルも多くあります。 周りで聞いた話だと オイル漏れしているが、試運転前にはオイル突っ込んどいて動くようにして、買った翌日には動かなくなっていた エアコンとかが壊れてて結局修理に2,000ドルぐらい使った などなどがあるので、長く滞在する場合は新車を買うことも視野に入れても良いかもしれません。20,000ドルぐらいあれば買えるかと。 私は大学のFacebookコミュニティ経由で車を購入
皆様久しぶりです、tkmです。 夏休みも始まって1ヶ月経ち、鬼のような3授業履修+研究から心身ともに癒えて来たので修士入学〜Ph.D.編入が決まるまであったことを可能な限り時系列で振り返ってみます。 以前のブログで支援お願いした手前、私の留学模様はコンテンツとして楽しんで貰らうべくTwitterで事細かに報告するようにはしていますが、やはりブログとして残しておかないと後から見た人とかは振り返りづらいと思うので、これを期にまとめようと思います。 あと夏の留学向け奨学金戦線も始まってきており、米国大学院への留学する人が少しでも現地の想像がしやすくなるように何でも書いて行きます 修士も受験したほうが良いよ! 振り返る前に、多分このブログを読む人は米国で大学院を考えている人が多いと思うので一言 「修士も受験したほうが良いよ!」 特にCSでの留学を考えている人は一応出しておいたほうが良いです。この分
こんにちは、tkmです。 このブログではポエムはあまり書かないことにしてたのですが、最近エンジニア勉強会(特にML系)が募集後すぐに埋まるツイートを目にしたので、 エンジニア勉強会全盛期(TokyoR, TokyoWebMiningなどの時)に学生で参加してから、kaggle meetupとかで運営するようになったので色々思うことを垂れ流して見ます 持続的な勉強会(コミュニティ)に必要なこと 適度な内輪感と公共性の両立 質の高い発表者の確保は最優先 運営から一言声を掛けるのがとても大事 発表することが目的の発表を排除 参加者の質も最低限確保したい 勉強会おじさんは絶対排除。慈悲はない それでも新規参入者の敷居は低く 内輪盛り上がりは予想以上に外部から醜悪に映る コアになる常連メンバーは必要 運営は出しゃばらない どこまで公共性を追求するか いま思っていること 優しい終身の独裁者は必要なのか
お久しぶりですtkmです。 今日は1 quarter終わったのでこちらで修士を目指すとどういうことが起きるかということを報告していきたいと思います 以前ブログやTwitterでご支援を依頼したところかなりの方から、支援を頂いたので極力こちらでの生活や大学の事はブログにしていきたいと思っています。 もし聞きたい話とかありましたらTwitterなどで教えてください。 ※注意 本稿ではUCI Master of Science in Computer Science programの話をします。こういう話の一般論は大概役に立たないので、特定プログラムの詳細について話して行きます。 この記事みて支援いただける方居ましたらPatreon登録待っています! www.patreon.com 米国で修士を取るメリット 1. 卒業後に米国で就労できる 2. 教授とのコネ (for Ph.D.) 3. 友人
こんにちは、tkmです。 今日は、kaggle slackの過去ログ閲覧アプリをGAEで構築したときのハマった点とかの話を書いていこうと思います。 kaggle slack過去ログ閲覧アプリ on GAE Kaggle slack過去ログビューワは、 過去ログ保存もそうですが、slackに加入せずに議論を見れるので、 参加を躊躇ってる方は覗いて見るとよいですよ! 特に#beginners-help は知見が色々転がってますhttps://t.co/Ng3lkCN5m6 pic.twitter.com/Ef4cyMho3v— Takami Sato (@tkm2261) 2018年7月2日 https://kaggler-ja-slack-archive.appspot.com/ 手前味噌だけど結構良いアプリになっていると思う。 チャンネル創立当初のログにまた逢えると思ってなかったので感慨深
こんにちは。tkm2261です。 今日は2018/5/12に開催したKaggle Tokyo Meetup #4の模様をレポートします。 connpass.com このmeetupも4回目となり、今回はGoogle様からサポートを頂いた事もあり、かなり大規模なmeetupになりました。 今回からMaster枠とExpert枠を設けたり、Youtube Liveをしたり、人数を増やしたりと色々新しいことを試しています。 さらに自分で言うのもアレですが超豪華なスピーカーになっています。 本日の見どころは 競プロ界の神tourist wataさん 金メダル2個のnovice pocketさん 苦労人masterのterekaさん scikit-learn生みの親davidCさん LTなのに一ヶ月前から資料作ってたjackさん 2 stage制の鬼osciiartさん talkingdata覇者f
こんにちはtkmです。今日は留学に必要な英語を解説していきたいと思います。 大学院留学を考えている人の最大の懸念は英語と思いますし、受験を思い立った時にTOEIC630点というスコアから始めた自分にとっても最大の懸念点でした。 超一流校はTOEFL iBT 100点、とりあえずは90点 私がざっと調べた感じだとCSのPh.D課程のTOEFLの要求スコアはこんな感じです。 ※免責: 間違ってても責任とりません。 TOEFL iBT100点というのが英語がちゃんと出来るという一つの目安になってます。 最低スコアがないPrincetonとかもこんな記載をしています。 https://www.cs.princeton.edu/grad/faq#23 とりあえずはUC Bercleyの90点を目安にするのが良いと思われます。 TOEFL iBT 100点と90点の間には大きい壁がある。 受験された方
皆様 こんにちはtkmです。 今回から数回に分けて米国のComputer ScienceのPh.D.とM.S.の受験について語っていきたいと思います。 はじめに 英語(TOEFL)対策 GRE対策 SoP [エッセイ] 対策 国内奨学金応募 推薦状依頼 出願先の決め方 出願とそれまでのスケジュール 出願後の過ごし方 お金編 GPA編 Ph.D.は駄目でしたがUC Irvine MSCSから合格を貰えたので後に続く人たちのためになるっぽいもの書いていきます。 【速報】ワイUC Irvine CS修士に合格 PhDは全滅だったし、修士でいくお金を確保できるか怪しいけど とりあえずコネなし論文なしアラサーでも頭おかしい米国CSの倍率をくぐり抜けたられ事を素直に喜ぼう— Takami Sato (@tkm2261) 2018年4月11日 スペック的には下界を攻めた気がするので多くの人に勇気を与えた
お久しぶりです。 最近Youtuberとしての活動が滞っていたので、ノリと勢いでKaggle メルカリコンペの優勝コードを眺める動画を作りました。 大した解説出来ていませんが、良ければご視聴下さい。 www.youtube.com
こんにちは 今日はNIPS2017読み会@クックパッドでLightGBMの論文紹介してきたのでブログにします。 cookpad.connpass.com Twitterで既に告知しましたがブログに残しておかないと埋もれるのでこちらにも置いておきます NIPS2017読み会 LightGBM: A Highly Efficient Gradient Boosting Decision Tree from Takami Sato 今回は急遽前日に発表が空いたのでニート力を活用して発表して来ました。ノリと勢いで行動出来るのはニートの特権 完全なノリと有り余るニート力を活用して明後日1/27にLightGBMの論文紹介することになりました。 参加者の皆様よろしくお願いします!#nips2017reading https://t.co/UG1Xyxfj5o— Takami Sato (@tkm226
お久しぶりです。 今日は技術的な話題では無いですが、社外・社内にメールを出す時のテンプレ的なものを紹介したいと思います。 初めに言いますが、クッッソどうでも良い話題です。面接のスーツに何を着るかぐらいどうでも良い話です。 ただ、学生だと志望会社にメールを出すときに変に文面悩んだり、エンジニアだと社外にメール出す経験があまり無くて変に文面悩んだりとか、ここで悩むのは更に無駄なので、 ニートという身軽な身分のうちに、日本の会社で大体OKっぽいメールの書き方を適当に紹介します。 アホらしいですがメールの行間から仕事慣れてない感がでるとマイナス印象になったりもするので、それっぽいメールの書き方は知っておいて良いかもしれません。 自分もコンサルの新卒の時にいきなりクライアントにメールするのは怖かった記憶があるので、自分が学生の時に知りたかった内容的なのを書いておきます 業務メール書き方チートシート
こんにちは。tkm2261です。 今日は10/28に開催したKaggle Tokyo Meetup #3の模様をレポートします。 connpass.com このmeetupは@threecourseさんや@smlyさんが2年前ぐらいから始めて不定期で開催しており、 私もニートの有り余る労働力を活かして今回運営をして来ました。 開始前 今回はsmlyさんの勤め先であるアドバンステクノロジーラボさんに会場をお借りすることが出来ました。 いよいよKaggle Tokyo Meetup当日です! 入り口入って右手のエレベーターで4Fです お待ちしております! pic.twitter.com/80r6soIJ9H— Takami Sato (@tkm2261) 2017年10月28日 渋谷の超良いところにあって、美術館の上という超良いところのオフィスでした。 今回、Youtubeのチャネル登録者数が
皆様こんにちわ 今回はKaggle入門動画作ったので、その事について書いていきます。 Twitterでも告知したし、ブログは良いかなーと思ってたのですが、 ニートで新しいこと挑戦企画としてYoutuberになってみました Kaggleの提出までを環境構築からライブコーディングして実況解説してみました。私流のKaggleワークフローですがよければ見てみて下さいhttps://t.co/0QUDEa1etK— Takami Sato (@tkm2261) 2017年10月20日 英語の翻訳タイトルつけると、Googleが日本語でインデックスしてくれない事に気づき、ブログにも投稿することにしました。 良ければ見てみて下さい。 Kaggle入門 Porto Seguroコンペ www.youtube.com 規約的に怪しかったので、Kaggleにも問い合わせてOK貰ってます。 https://ww
お久しぶりです。 今日は10/20に参加した、理研AIPでのMicheal Jordan先生の講演のメモを書いていきたいと思います。 参加を許可頂いた理研AIPの方や司会の福水先生も良い会をありがとうございました。 Talk by Prof. Michael I. Jordan (University of California, Berkeley, USA) | 革新知能統合研究センター In this post, I am writing about Prof. Micheal Jordan's speak at Riken AIP in Oct. 20th. If you have some problems about this post, please inform to @tkm2261 on Twitter. いまはニートなので参加したセミナーの報告をする義務は全く無いのです
皆様、お久しぶりです。 以前のエントリでも触れましたが、絶賛ニートを楽しんでおります。 ニートになって早3ヵ月ですが、率直な感想としては、 世界がこんなに輝いていたとは! っといったところです。 将来を犠牲にした束の間の天国かもしれませんが、体力ある20代に自分の時間を取れるのは最高です 5年もエンジニアしていたら勉強したいことが貯まるのは当たり前なので30歳前後で1年ぐらいニート期間は超おすすめです。 ポエムはエントリの最後の方にするとして、ニートのなり方とニートの私流楽しみ方を共有してニートの布教に努めたいと思います 手続き編 健康保険 年金 住民税 失業給付 ハローワーク(失業給付)編 STEP:1 書類の準備 STEP:2 ハロワに行く STEP:3 失業給付説明会に行く STEP:4 初回認定日に行く STEP:5 就活する(ハロワで求人検索) STEP:6 認定日に行く 勉強編
追記 2023/03/17 また変わっていました。 こちらが現在のkaggler-ja slack参加URLです。(2023/03/17確認)万一期限が切れていたらDMなど一報頂けると助かります。https://t.co/tylk3CY6nk https://t.co/6cFUBfDBui— Takami Sato (@tkm2261) 2023年3月17日 追記 2022/10/23 また変わっていました。 こちらが現在のkaggler-ja slack参加URLです。(2022/08/16確認)万一期限が切れていたらDMなど一報頂けると助かります。https://t.co/soKMpRp7We https://t.co/4pAmML8id7— Takami Sato (@tkm2261) 2022年8月15日 追記 2021/03/11 Slack側の仕様変更があり招待URLが期限切れ
皆様tkm2261です。この頃連投が続いてますが、 最近まで参加していたInstacart Market Basket Analysis | Kaggleで色々やったので残しておこうと思います。 このcallback関数は便利ですが、Kaggleなどでヘビーに使う人以外ここまでしないと思うので活躍するかは微妙なところです。。。 LightGBMのtrain関数を読み解く callback関数の仕様 受け取る引数はひとつ (lightgbm.callback.CallbackEnv) データのアクセスはAPI経由 あとは好きに実装 自前early stoppingのやり方 一応書いたけど。。。 LightGBMのtrain関数を読み解く xgboostもそうですが、lightgbmにもtrain()という関数がありLightGBMユーザはこれを使って学習を実行します。 scikit-lear
皆様tkm2261です。今日は道具としてのCythonと題して、 使うことに特化してCythonの解説をしたいと思います。 きっかけはKaggle Cythonを使うとき FaronさんのF1最適化 DP (Dynamic Programming)を含んだ実装はCythonの出番 使い方 その1 『Cython実装』 ファイルは.pyx cimport 型宣言 オプション指定 普通のPythonも書ける 使い方 その2『コンパイル』 setup.pyの書き方 コンパイルの実行 使い方 その3『呼び出し』 速度検証 付録: 実装 utils.pyx きっかけはKaggle 最近まで参加していたInstacart Market Basket Analysis | Kaggleで どうしても高速化したい処理があり実装しました。 Numbaも良いのですが、速くなるときとならないときがあり、JITよ
今日はPython (Pandas)で高速にCSVを読むことに挑戦したいと思います。 Kaggleに参加するたびに、イライラしていたので各実装の白黒はっきりさせようと思います。 R使いが羨ましいなぁと思う第一位がCSV読込が簡単に並列出来て速いことなので、 なんとかGILのあるPythonでも高速に読み込みたいと思います。 ただ、この検証ではコーディング量が多いものは検証しません。 CSV読込は頻出するので、フットワークの軽さが重要です。(オレオレライブラリ嫌い) Pickleは早いけど。。。 結論はDask使おう! 検証環境 データ 速度検証 pandas.read_csv() pandas.read_csv() (dtype指定) pandas.read_csv() (gzip圧縮) numpy.genfromtxt() pandas.read_csv() (chunksize指定 +
お久しぶりです。絶賛ニートを楽しんでるtkm2261です。 今日はTwitterで意見が諸々散見されたので、私のKaggleでのgit活用法を共有しようと思います。 Gitの独学はハードルが高いですよね。。。 gitの運用は開発プロセスと密接なのであまり外に出てこなかったり、 実際に自分でやらないと覚えない系なので独学は結構難しいと思ってます。 (同じ理由で、テストコード系も広まらなかったり) 私も学生時代はSVNに馴染めなくて、業務でプロダクト開発して初めてバージョン管理が身についたタイプです。 最初はSourceTreeで慣れ親しんで、gitコマンドという流れを辿りました。いきなりGitコマンドのハードルの高さは理解してるつもりです。 www.sourcetreeapp.com とはいえ、慣れるとこんなに便利なものはないので、出来る限り平易に語りたいと思います。 Kaggle利用特化(
LightGBMとは Microsoftが公開しているGradient Boosting Decision Tree(GBDT)の実装です。 github.com GBDTの実装で一番有名なのはxgboostですが、LightGBMは2016年末に登場してPython対応から一気に普及し始め、 最近のKaggleコンペではxgboostよりも、Winning Solutionで多く見る気がしています。 私もQuoraコンペではお世話になりました ニートなので金がない 在職中は会社のマシンで回してたりしたので、気軽に32コアぐらい使ってましたが、 ニートで自費で借りると破産しかねないのでGPUで高速にならないかなーと思って検証しました。 環境構築 AWSのp2.xlargeでAnaconda3系使って検証しました。 基本はここに従います。 LightGBM/GPU-Tutorial.md a
お久しぶりです。最近、色々ありましてブログを再開しようと思います。 基本的に、スライド作って話す事が多いので、まずその辺りのこと書こうと思います。時系列狂うかもですがご容赦を 今月6月に終了した、Quora Question Pairs | Kaggleに参加してソロ17位でした。 あと1個上の順位だったら、ゴールドメダルだったので悔しくて仕方ないですがMasterになる前にもっと精進せいというお告げと信じて頑張ります 手法とかはこちらにまとまっています。 Quoraコンペ参加記録 from Takami Sato コンペ後に適当な感じで社内勉強会に外部の方も招待したら、かなりの人数が集まり議論の活発な良い勉強会となりました。 smly氏はFileHandlerとStreamHandlerでファイルにも吐いているとのこと 最近xgboostやLightGBMは標準出力めっちゃ出してくるか
今回はGPUの数値実験についての記事です。 計算環境 OS: Windows 7 64bit CPU: Intel Core i7-4771 CPU @ 3.50GHz GPU: NVIDIA GeForce GTX 650 MEM: 32GB 我が家の計算マシンです。 これをWindowsで構成しているのは、もったいない気がしていますが、 LinuxにGPU載せても用途が限られすぎるので妥協です。 環境構築 ここまで、特に環境構築について触れて来ませんでしたがGPUを使うと苦労したので少し書きます。 結論としては、『Anacondaを入れましょう!』が最善手のようです。 Download Anaconda Python Distribution Win機64bitで環境を揃えるのはかなりめんどくさいです。というか頑張ったんですが エラーが直らず断念しました GPU使わないなら、Gohlk
今回もNumbaのドキュメントを読んで行きます。 Numba — numba 0.15.1 documentation と思ったんですが、読み進めて行くと以外に紹介する内容が少ないことに気づきました。 シンプルなのは良いことなので、今回はUFuncを紹介して、 次回にGPUについて紹介して入門編は一旦終わりたいと思います。 その後に、Numbaを勉強する動機となったものを中心に応用編を話す予定です。 UFunc UFuncs — numba 0.15.1 documentation UFunc(ユニバーサル関数)とは、要するにnumpy.ndarrayに対して要素ごとに演算してくれる関数です。 例えばnumpy.logに配列を食わせると、こんな感じです。 >>> import numpy >>> hoge = numpy.arange(1, 5) >>> hoge array([1, 2,
次のページ
このページを最初にブックマークしてみませんか?
『tkm2261's blog』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く