がぶちゃんの日記

札幌からフルリモートCTO

2008年度下期「未踏IT人材発掘・育成事業」 畑PM・勝屋PM合同成果発表会でPuppyを発表してきた。

もともとPuppyはIPAの未踏プロジェクトで採択されて開発していました。開発期間は約半年間です。今日はその開発の終了と半年間の成果を発表するという会です。
同じ期間に未踏で開発していた同期の方々も素晴らしいソフトウェア・サービスを開発されたので、それらの紹介と感想をしてから、最後に僕たちのPuppyを紹介します。

当日のプログラムはこちらから

人生検索エンジン「ライフリサイクル」

  • 普段からマイクで自分の音声を録音しておく。
  • 音声認識を使ってテキストに変換してDBに貯めておく。
  • あとからテキストで検索できる。

つまり、過去の会話を文字で検索できるシステム。

音声認識の精度の問題で、誤変換が多いのが課題だったのですが、

  • 文章に含まれる単語からセマンティックス的に(意味論を使って)誤変換を抑制(修正)する。
  • 検索時に音素を対象にして、さらにレーベンシュタイン距離を使って、あいまい検索を可能にする。

などのソリューションが素晴らしかった。

あと、録音する機材が、大きかったり重かったり格好悪かったりという問題については、

  • マイクの小型化
  • 自動的にWi-Fiを使ってデータをアップロードするメモリカード(参考)

など周辺技術の向上により改善されるだろうと、調査されていた。

個人的には、携帯電話やスマートフォンが音声を拾って自動的にアップロードし続ける。なんてのもありかなと思った。

  • 3GならWi-Fiより常にネット接続されてる。てか、今のWi-Fiの普及に比べたら3Gの方が現実的だよね!
  • 携帯電話を首からぶら下げてる人って昔から結構いるよね!

んで「あれ?あん時○○と話してたアレって何だっけー?」「検索したいなー」って時に、過去の会話を文字で検索できる。
って感じです。

技術的な壁を乗り越えて普通に使えるようになれば、まじで便利だと思います。未来ですね。

情報検索のための学習成長型対話システムの開発

  • WiTHという名前のシステム。
  • WiTHに文字で話しかける。「日本酒が飲みたいなー」
  • WiTHがいい感じのURLを返してくれる。

という対話システム。

今はニュース、ブログページ、動画、楽天商品ページなどを返してくれるっぽい。

いい感じってのがポイントで、「日本酒が飲みたいなー」と、つぶやくだけで、おいしい日本酒が買えるページへのリンクを教えてくれる。さらに、その日本酒がおいしかったら最高のシステムだよね!

あと、WiTHは趣味思考を学習してくれるらしい。パーソナライズは重要。

これって広告にも応用できると思った。いい感じの広告を出せばし、CTRも向上するんじゃないかな。CTRの具体的な数値がとれれば十分勝負できるかと。まさか、WiTHってレコメンドエンジンだったのか!

「創造性」を共有するソーシャルウェブデザインツール

  • オンラインでWebデザインができるツール。(オンラインWebオーサリングツール)
    • レイアウト、テーマを選んで、色、フォント系、背景画像などなどをカスタマイズできる。
  • デザインを共有できる。
  • 各種ブログシステムのテンプレートとしてエクスポートして利用できる。

素人の人でも「短時間で」「プロ級の」オリジナリティなデザインが作れることを目標に開発されていて、公開が楽しみです。このブログもオリジナルにしたいよー!

コンセプトが近いのが

らしい。

コード進行をベースとしたセミオートマチックな作曲ライブラリの開発

既にWebサイトとアプリが公開されています。説明するよりも分かりやすいので是非リンク先を。最終成果報告会までに公開されてるなんて、さすがです!
bozack piano for baby musicians
右上の「Launch Prototype」というのをクリックして、「許可」してあげるとアプリが使えます。
いままでずっとキーボードをがちゃがちゃやってました。月光gabuchanバージョンができました。楽し過ぎて今夜は眠れませんw

あと、bonarさんはコード理論や音そのものの勉強からはじめて、大学の研究生なんじゃないかと思うぐらい深く知識を探求されて吸い込んでいたのが印象的でした。素晴らしい!

bonarさんのエントリーを発見:2008年下期 最終成果報告会 に行ってきました - bonar note

画像認識に特化した物理シミュレーションエンジンとUIの開発

  • 画像認識と物理シミュレーションを組み合わせた新しいUI
  • カメラの映像上にマーカなしでオブジェクトを表示
  • 手などでオブジェクトを触れる、動かす、つまむ、のばす、投げる、など多彩。

彼の作品集(マイリスト)です。未踏のページにもリンクはってあるしOKですよね?これでイメージはつかんで貰えると思います。完成版の公開が楽しみですね!
画像認識でお遊び ‐ ニコニコ動画:GINZA

ちなみに彼は偶然にも名古屋でやってる勉強会CSNagoyaの仲間です。CSNagoyaには未踏経験者の先輩も来てくれていたので、CSNagoyaには3組未踏がいることになります。CSNagoyaすげー。

音声認識Webアクセスツール「Puppy」の開発

僕らが開発したシステムがこれです。

  • 声でGoogleMapを検索できるアプリ。
  • iPhoneアプリとWindowsMobileアプリを開発中。近日公開!
  • 声でホットペッパーを検索して、GoogleMapで表示するアプリも開発中。
Puppy for iPhone デモ動画

Puppy x ホットペッパー for iPhone デモ動画 操作編

Puppy x ホットペッパー for iPhone デモ動画 利用例

一言で欲しい情報を「ぱっ」と知る事ができる、そんなアプリを目指してます。

Puppy自体は単純に「声でWebにアクセスするツール」として考えているので、組み合わせは自由自在です。現時点ではGoogleMap/Hotpepperと組み合わせていますが、今後

などなど連携していきたいなと思っています。壮大なマッシュアップと言われる事がありますが、そのとおりです!

あと、クライアントとサーバで処理を分離しているので

などなどの端末でもアプリを開発することが可能です。そして今後開発していく予定です。

語りたい事は山ほどあるのですが、それは次回に。

最後に

それでは最後に未踏同期の皆さん約半年間お疲れさまでした!ありがとうございました!そして、これからがもっと大事なフェーズに入っていくのだと思います。アプリやサービスを公開したり、事業化を考えている方もいらっしゃると思います。今後とも頑張りましょう!