サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大そうじへの備え
diary.overlasting.net
言語処理エンジニアのお仕事情報と関連イベントの参加者を募集します Tweet [日記] このブログ、リニューアルしたいけどできてなくて放置してたのですが、活用するときが来ました。 この記事のまとめ 自然言語処理(NLP)系のエンジニア・研究者のキャリアを考えるイベントを開催します。 その一環で、自然言語処理エンジニアのお仕事の情報を本気で集めます。 自然言語処理エンジニアのお仕事がある都内の企業様は僕に情報を送って頂きたいです。(@overlast にTwitterのDMを下さい) 詳しくは以下をお読みください。 自然言語処理(NLP)系のエンジニア・研究者のキャリアを考えるイベントを開催します イベントを開催しますので、都内にお住まいの7/10の夜が空いてるNLPerはお越しください。 きっかけは試しに以下の様なTweetを雑にしてみたことでした。 『自然言語処理エンジニアのキャリアや採
Word2Vec の Web API を作れる word-vector-web-api を公開しました Tweet [日記][NLP] Word2Vec や GloVe などで構築済みな単語ベクトルのモデルを使った Web API を作ることができる word-vector-web-api を公開しました。🎉🍣🍻🍰🍖 word-vector-web-api というのを書いてて、word2vecで構築済みの 日本語 Wikipedia モデル + Docker で試せる様になったので、暇な方は試してみて下さい。https://t.co/NMQTc5py2k— Toshinori Sato (@overlast) 2015, 7月 2 これがあると docker コマンドと1.5 GByte 程度のメモリが使える環境なら、以下の 5 つのコマンドを実行することで(厳密にはもう少し手順
mecab-ipadic-NEologd v0.0.2 をリリースした Tweet [日記] 今日、6/23の朝 [2015-06-23] に、mecab-ipadic-NEologd の v0.0.2 をリリースしました🎉。 https://github.com/neologd/mecab-ipadic-neologd/releases/tag/v0.0.2 前回の v0.0.1 からの大きな差分は以下の5点です。 - 3ヶ月分の新語 - Unicode 6.0以前の絵文字に読みと品詞情報を付与 - IPA辞書に未再録で区切り間違う or 読みを付与できない副詞 - unk.defを変更して記号を記号,一般に - IPA辞書の一部のエントリの読み仮名誤りを修正 3ヶ月分の新語 v0.0.1以降に新しく再録したエントリは、diff以下で記録しています。 https://github.co
UniDic に固有表現やUnicode 絵文字などを足す mecab-unidic-NEologd を公開しました Tweet [NLP] 今年3月中旬 [2015-03-13] に mecab-ipadic-NEologd をリリースして以来、mecab-ipadic-NEologd はとても順調に普及しています。 さて、今回は UniDic に新語や固有表現、Unicode 絵文字などを足すことができる mecab-unidic-NEologd を公開しました。 mecab-ipadic-NEologd を生成する手法を使っています。 https://github.com/neologd/mecab-unidic-neologd/blob/master/README.ja.md シードデータの性質上、構築されるシステム辞書には国語研短単位の条件を満たさないエントリも入りますので、あら
MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました Tweet [NLP] 日本語の文書を機械的に処理しようと思った時に、ほとんどの人が MeCabとIPADIC(IPA辞書)の両方、または、どちらかを使うことになります。 IPADICはとてもよく出来ていますが、更新されないまま年月が過ぎているので、例えば2015年3月上旬に急に流行ったような言葉は収録していません。そのため、今日生まれたような新しい文書(例、Apple Watch発売)を解析する時に困ります。困らない人もいますけど、僕は困ります。 その課題に対処するために、日本全国津々浦々、自然言語処理に関わる全ての人は独自にMeCabの新語辞書を作って対応しているわけです。その際に元データとして使われることが多いのは Wikipedia 日本語版やはてなキーワードなどです。 困ったことに、新語辞書を生成
新年会 + #DSIRNLP 5 を開催しました & 動画UPしました Tweet [日記] 新年会とデータ構造と情報検索と言語処理勉強会 #DSIRNLP の第5回目を開催しました。 ご発表、ご参加頂いたみなさま、どうもありがとうございました。 会場を提供していただきました、スマートニュース株式会社のみなさま、どうもありがとうございました。 # スマートニュースさんは今後も各種勉強会に会場を提供してくださるそうです。 DSIRNLP 5 について 今回は参加するための条件を設けてみました。 参考文献 : http://partake.in/events/572bb762-87ed-490a-b993-8b864137e7e1 条件はとてもシンプルで、発表する方か、ググったらどんなことが得意なのかが分かる方だけが参加できる、というものです。 実際にやってみた感触として、参加者からはとても好
どんなコードを書いたのか忘れた頃に役立つコメントの書き方 Tweet [Programming][日記] 少し前にIRCやTwitterで @tagomoris さんらが、コードに対して執拗にコメントを書くことを推奨していたのを見かけた。 コード書くときは変数やメソッドの名前をよく考えろ! いい名前が思い付かなくてコードから意味がとれなくなりそうなら、その都度執拗にコメントを書け!!!!!!!!!!!!!!— tagomoris (@tagomoris) 2013, 11月 8 自分も気をつけなければと思い影響を受けたので、ブログに書いておく。 でも、多分、ほんとに当たり前のことしか書いてないんだと思う。 自分はコメントについて小一時間まとまった時間を使って考えたことは正直なかった。 もちろん何度も考えていますけど、「コメントとは、、ぬぬぬぬ」って何時間も考えたことはなかった。 無かったの
不満をネット上で公開するときのTips 10+α Tweet [日記] 「ネガティブなことはネットに書かない方が良い」という意見を個人的に観測する機会が多いですが、ブログに書くことでしか不満を解消できないほどに追い詰められた精神状態になることは、ごく普通にあります。 たとえば、ゴルフサイトを一日中眺めている上司から突然「ちょっといいですか? 1+1は?」と聞かれて普通に「2ですよね」と答えたら「いや、それは2では無い可能性もあるのではないかな?」などと言われたら、「え?何を言ってるんだユーは別に数学者じゃないし物理学者でもないだろ頭大丈夫ですか?」と思いピヨッてしまうのは無理も無いのです。と僕は思っています。 ということで、不満をネット上でぶちまけるときに気をつけたいことを書いてみます。 1. 柔らかい文体で書く 不満を書くときは、ですます調、で、柔らかい表現で書きたい。 口に一回出してみ
SIGIR 2013 勉強会に参加してきた Tweet [日記] @uchumik さんに誘っていただいたので、 SIGIR 2013 勉強会に参加してきた。 会場は渋谷クロスタワー28Fのデンソーアイティラボラトリさん。 # 日曜なので入口に新聞が散乱してて吹きました。 - SIGIR2013勉強会 http://www.kde.cs.tsukuba.ac.jp/dbreading/?SIGIR2013 SIGIR の Fullpaper の概要をセッションごとに聞くという会。 - Welcome to SIGIR Conference 2013 http://www.sigir2013.ie/full_papers.html 初めて参加するのでどんな感じかと思ったが、大学の輪講と比べ緩くて和やかな雰囲気だった。 自分で読むべき論文を見逃していた時に、こういう勉強会に出ると「あ、読もう」
第4回 データ構造と情報検索と言語処理勉強会 #DSIRNLP を開催します Tweet [日記] とても久しぶりに DSIRNLP を開催することになりました。 前回は2012年11月28日だったので、1年弱開催してなかったみたいです。 Speech and Language Processing [Amazonで詳細を見る] DSIRNLPの申込は以下のリンクのさらに先からできます。 http://yans.anlp.jp/modules/menu/main.php?page_id=108&op=change_page#dsirnlp 突然、開催することになったきっかけは、ALAGIN & NLP若手の会 合同シンポジウムです。 ALAGIN & NLP若手の会 合同シンポジウムって こういう仰々しい名前になると個人的にぱっと見の意味がよく分からなくなりますが、要するに『NLP若手の会
PhantomJS を Selenium::Remote::Driver から使う Tweet [Perl] 少し前から PhantomJS を Selenium::Remote::Driver から使っている。 PhantomJS + Wight も試したけど、今のところ Selenium::Remote::Driver の方が好き。 - PhantomJS # コマンドラインから操作できるWebKit # 1.8 からGhost Driver(WebDriver Wire Protocolを実装したhttpd) が組み込まれた - Selenium::Remote::Driver - search cpan org # WebDriver Wire Protocolのクライアント 意外と便利なので今後も使う。 PhantomJS はソースコードからインストールすればいい。 すごく時間が
進路相談「内定をもらった企業の内情が気になります」 Tweet [日記] 先日、学生の方から進路相談のメールを頂きました。 先日某社の内定をいただきました。 しかし自分が一目置くエンジニアはその企業を退職していることが多く、すでにその会社に優秀なエンジニアがいないのではという疑問がわきました。 また、自分はとある技術分野に関わるエンジニアになりたいと考えています。 ですが今のところ開発手法に関する知識や経験が足りません。 是非、ご意見いただけますでしょうか。 # 頂いたメールを加工し匿名性を高めました。 以下では個人的な見解を述べますね。 正直言って、わからないです いろいろ深く考えましたが正解はないですね。 そもそも内定を頂いた時から大分後に入るわけですし、一緒に働きたいと思っている方が来年の4月までに転職してしまう場合もあるわけです。 自分が何のためにその組織に属するのか、そして、その
Google Chrome 拡張「Web Cache」で Internet Archive の閲覧が捗る Tweet [日記] 今見ているページのキャッシュを見られるGoogle Chrome 拡張「Web Cache」が便利。 Web Cache - Chrome ウェブストア ふと、 Internet Archive で以前の様子を確認したいときにゴチャゴチャやる時間を減らせるので、無駄が減る。 拡張をインストールすると、ツールバーにアイコンが出る。 任意のページを見てる時に押すと、こんな感じで任意のキャッシュを選べる。 選択肢は以下の8種類。 - Internet Archive - Google Cache - Yahoo Cache - MSN cache(Bing Cache) - CoralCDN - Gigablast - WebCite - 上記全部 とりあえずInter
第一回 Jubatus ハンズオンに参加してきた Tweet [日記] 神保町のIIJで開催された「第一回 Jubatus ハンズオン」に参加して来ました。 - Jubatus ハンズオン テキスト -- http://download.jubat.us/event/handson_01/text/ 用語が分からない場合は辞書的に使える参考書を横においてやってみるのが良さそう。 言語処理のための機械学習入門 (自然言語処理シリーズ) posted with Drift Writer at 2013.02.19高村 大也, 奥村 学 コロナ社 (2010/07) 売り上げランキング: 25,729 Amazon.co.jp で詳細を見る イントロ ねらい : Jubatusを使って機械学習を学んでみる。 - イントロ - 使ってみる - 設定いじってみる 機械学習 データに基いて機械が判断す
overlasting.net 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy
次のページ
このページを最初にブックマークしてみませんか?
『overlasting.net』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く