IT勉強会の自動チェックサービスを作りました

 本日、Study Mailというサービスをリリースしました。気になるキーワードを登録しておくと、対応している6つのサイトにそのキーワードがメインテーマ(らしい)勉強会が告知されたのを検知してGoogleFacebookのアカウントに紐づいたメールアドレス告知されるサービスです。
 最近、イベント開催支援サイトも開催数そのものも増えてきて、すでに追いかけにくくなっている現状の私なりの解決策です。

 開発中には水道橋にあるコワーキングスペース「ネコワーキング」のぬこをはじめ、さまざまな方のアドバイスをいただきました。この場を借りてお礼を申し上げます
 
 なお、どこかのサービスに名前が似てしまいましたが本当に偶然です。
 

仕組み

 基本的な流れとしては以下のようになっています

  1. 対応しているサービスが公開しているRSSを取得
  2. タイトルと説明文をひとつの文章にまとめてから、Yahooキーフレーズ解析で抽出
  3. 抽出したフレーズとタイトルを正規表現で処理してさらに候補を取り出す

 正規表現では「カタカナのみ(クラウドとか)」「英語と一部の記号のみ(言語名など)」「漢字のみ(関数型言語など)」「三つのハイブリッド(継続的インテグレーションとかFacebookアプリとか)」を取り出すようにしています。キーフレーズ抽出だけではいまひとつだったのですが、このステップを加えることでITの技術用語を高い確率で取り出せるようになりました。

バックエンド

 個人的な勉強をかねてサーバーはdotCloud+MySQLフレームワークDjango。画面はTwitterbootstrapをベースにしています。dotCloudは実質ひとつしかない無料枠とはいえcronもメールも無料で使えるのが魅力的なのですが、データベースがそのままだとlatainだったり、cronで動かすときとwebサーバー経由で動かす時とCLI経由で動かす時で微妙に環境変数が異なったりと意外とはまりどころが多く苦労しました。
 Djangoも、疎結合でいじりやすいのはいいのですが書く部分が多いのが大変でした。実は未だにセッション周りとか不安が無いわけではありません。

TODOとか

 すでにいくつか要望をいただいているので、ぼちぼちと手をつけていこうとおもっています。緊急性の高い課題として、私が所有しているandroid携帯では文字コードの関係でメールが読めなかったりするのでここは早めに改修したいです