サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
今年の「#文学」
ameblo.jp/ultrahongo
今年の夏から、PFIではサマーインターンを募集することになりました。くわしくはここを参照してください。 PFIでは、ソフトウェアの開発とともに、ソフトウェアの研究開発も日々行っており、新しい製品や既存製品のパワーアップにつながる要素技術を常に研究しています。けっこう、ここまでプロダクト開発チームと研究開発チームが密接にかかわって開発を進めている会社は珍しいのではないかと思います。 このブログの読者にも、コンピュータサイエンスの学生の人は多いのではないかと思います。PFIでは、コンピュータサイエンスの各分野に詳しい人がたくさんいます。分散システムの研究をいかして製品開発をしているメンバーもいれば、自然言語処理・機械学習を生かして、新しいプロダクトの要素技術を開発している人もいます。また、大規模なデータの処理においては、いかに少ないスペースでデータを処理するか、いかに短い時間でデータを処理する
こんにちわ!!ひさしぶりの日記更新になってしましました。 今日は、先日リリースさせていただいたSSD版Sedueの紹介と、新しいSedueの技術的詳細のセミナーのお知らせです。 ここで詳しい記載がありますが、今回のバージョンアップで、メインメモリ上に最適化されていた検索コアだけでなく、SSDに最適化された検索コアも利用可能になりました。SSDはHDDと比較してランダムリード性能が非常に高く、全文検索というタスクに対しては非常に適しています。 このエンジンのリリースにより、大規模検索エンジンの構築は多大なコストがかかるもの、という概念をくつがえしたいと考えています。スループットが必要とされている検索システムでは、文書データ量が大きくなってしまうと、複数のマシンにインデックスを分割したり、同じデータを複数のマシンにもたせたりしないと、所望の性能を満たすことができません。メインメモリ型の検索エン
日記を相当長い間書いていませんでしたすいません・・・ 今日は、ちょっと時期をのがしてしまいましたが、はてなブックマークリニューアルについて書いてみようと思います。まずは、リニューアルおめでとうございます!>はてなの皆様 今回のはてなブックマークリニューアルでは、弊社は、はてなブックマークのエントリ全文検索に携わりました。弊社の全文検索エンジンである、「Sedue」を用いて、複数台で全文検索機能を実現しています。リアルタイム性と大規模な検索が必要なタスクであったので、Sedueは今回のタスクにぴったりなエンジンでした。 エンジン自体は、もともと分散環境でいかに簡単に動作させるか、が売りのエンジンなので、すぐに稼働させることができました。ランキングの部分は、かなり力をいれていて、id:naoyaさんと弊社のCTO太田、エンジニアの久保田が協力して作成していきました。ランキングは、もうすでに汎用
最近ちょっと忙しさがメリーゴーランドでまたもや全然更新できてません・・・ごめんなさいごめんなさい。どこでもドアがあれば、ちょっとはらくになるので、早くできないかなーww うちの会社のデザインを全面的に作ってくれている方が起業しました!株式会社Fillotです。おめでとうございます! 1年ぐらい前に、当社が株式会社化するときに、ホームページのリニューアルなど、全部お願いさせてもらいました。UbiMatchのデザインもしていただいたり、いろいろと助けていただきました。僕らがエンジニアの会社なら、まさに、デザイナー・エンジニアの会社です。 なかなかコンピュータサイエンスだけを見ていると、見せ方とか見た人にとってのイメージまでは想いが至らないのですが、コンピュータサイエンスをいざ実用化しようとすると、バックエンドの技術だけでは決して人に受け入れられることはありません。実際に技術を使うのは人間ですか
本日、NTTレゾナント様と共同で作成したHadoop解析資料 を公開しました。 弊社でも、Sedueで利用されているインデックス保存用の分散ストレージなどを開発してきましたが、この分散ストレージは、Sedueの利用に比較的特化されているので、今回今後オープンソースの活用も視野にいれて、Hadoopの解析には積極的に取り組んでいます。 執筆者である太田は、CodeZineでHadoopの連載記事を掲載していますが、今回の資料は、よりHadoopの内部構造につっこんだ資料になっています。分散ストレージにおいては、使われる対象が、Webサービスのバックエンドなど、比較的高いアベイラビリティが必要な分野になるので、性能だけではなく、アベイラビリティを向上させるための機能も重要になってきます。今回の解析では、そのような機能も重点的にソースコードレベルで解析しています。 資料は、セミナー等で利用してい
今日はなかなか刺激的な一日でした。午前中は、森下研のLeoさんとデータベースについてディスカッションし、夜は、Venture Beatプロジェクトの会合に参加させていただき、アスピレーションの人見さんと分散についてディスカッションしました。なかなか最近はこういう機会がないので、非常に頭が活性化しました。 PFIでは、かなり基盤技術といわれる類の技術開発を重点的に行っています。Web2.0という単語が登場して久しくなりますが、今更なぜユーザーサイドのサービスを作っていくわけではなく、基盤技術に力をいれているのか、というのには、理由があります。 データベースにおいても、コンピュータそのものにおいても、アーキテクチャの変化が求められているのは確実だと思います。たとえば、現在普及しているRDBMSにしても、マイクロプロセッサにしても、80年代、90年代に求められていた典型的なコンピューティングタス
最近は、会社で技術書を買うことが多くなっています。今日はそんななかから、今メンバーが読んでいる本を紹介しますよ。 集合知プログラミングをtkng先生がよんでいらっしゃいます。この本は、いろいろな内容が広く扱われており、コードもふんだんに紹介されているので、初心者でもわかりやすく読むことができます。よりレベルアップを目指すならば、パターン認識と機械学習を読むとよいです。というのはtkng先生の弁です。 岡野原先生は、乱択アルゴリズムのホンをよんでいます。この本は、日本語でははじめて、包括的にランダマイズドアルゴリズムを扱っています。大学生ぐらいだったら読める本ですので、ランダマイズドアルゴリズムに興味がある人はもちろん、アルゴリズムをやっている人ならよむのが良いと思います。1冊で基礎から最新の話までカバーすることができます。 タイトルがかくれてしまいましたが、したにちらっとみえるのは、Jav
うちの会社では、社内コンテストをしています。PFIなので、プログラミングコンテストですね。 案件とかで、面白い案件があったりすると、精度を競い合ったり、目標に向けてがんばったりと、 何かとコンテスト形式にしてみます。僕もプログラミングコンテストで育ってきたので、 こういう形式だと、非常に燃えます。 今の時期も、とあるコンテストを行っていて、非常に難しいタスクだったのですが、 なんとか目標を達成することができたので、先日表彰式を行いました。 コンテストなので、賞品がでます!いっつも、賞品を何にするかは迷うのですが、 こないだは、iPod Touchでした。今、iPod Touchは、田中さんと吉田さんが、前のコンテストで勝利したので、 持っています。田中さんはかなりiPod使いこなしています。 今回は、田中さんと吉田さんが表彰です。今回の賞品は、ThinkPad X300でした。 やっぱり、
最近は、今進んでいるプロジェクトがもうすぐひと段落するので、僕はデバッグをがりがりすることが多いです。バグがあるときになって帰れないので、終電を逃すことが多く、最近は日記を更新できていませんでした(>ω<) 前々から、僕はけっこうプロジェクト終盤でもICPCでもデバッガーとなることが多いのですが、そのときにためた、バグをとるポイントなどまとめてみることにします。 といっても、GDBを使うととれるようなバグは、GDBを使えばとれますのであんまり難易度が高いものではありません。悩んでもなかなかみつからない、なかなかとれない類のバグをとるのが僕は好きですが、そのときに何を考えてとっているのかを紹介します。といっても、僕はここらへんのことは自己流なので、当然もっといい方法があると思っています。なので、コメントなど熱烈歓迎です!! 難しい類のバグをとる際に一番重要なのは、バグにかかわるあらゆる状況を
続きを書いてみます。 今日は、ペアプログラミングを行えるようなチームを作るにはどうしたらよいのか、ということです。 もともと、僕がペアプログラミングを始めるきっかけになったのは、ICPCです。ICPCには、大学1年のころから、大学院の1年まで、5年間出場しました。最初の年は、大学一年のとき。ICPCは、3人でチームを組んで参加します。1年生のころは、特にペアプログラミングの存在すら知らなくて、3人でばらばらに解法を考えて、ばらばらに解いていました。当時は、そんなに国内予選の問題は難しくなくて、予選通過もそんな難しいハードルではなかったです。だから、三人でばらばらに解いても、最初の年は予選は通過することができました。ただ、当時は実力不足で、アジア大会を通過することはできませんでした。3人で3題を解くのがやっとで、非常に悔しい思いをしたのを覚えています。 次の年は、1人メンバーは入れ替わったの
職業柄、会社についていろいろ意見を頂くことがあります。ネット上で書いてある意見なども見たりします。中には感情的な意見もありますが、その感情に至るまでには何らかの理由があります。ですから、肯定的な意見も、批判的な意見も、製品開発やサービス開発においては非常に参考になります。でも、ひとつだけ、僕が絶対に許せないことがあります。僕は、自分の会社のメンバーが侮辱されることは、それがどんな理由であれ、許せません。 たまには感情的になったっていいじゃない。大人げなくたっていいじゃない。 IT企業が、理論を軽視していいものか。理論が好きな人間を暇人と侮辱していいものか。そもそも、ITの世界で、理論好きか理論が嫌いかという議論が意味があるのか。ITにおける理論は、僕はコンピュータサイエンスだと考えています。コンピュータサイエンスが好きとか嫌いとかの問題の前に、ITに携わる人がそもそもコンピュータサイエンス
naoyaさんのエントリ でも紹介していただいているように、PFIでは、開発手法としてペアプログラミングを非常に重要視しています。 ICPCに参加していたころは、ペアプログラミングの重要性などはいろいろなところでお話させていただいたのですが、会社をやっていく中でも考えがいろいろリファインされていったので、今一度ペアプログラミングについて議論してみることにします。 取り上げるテーマとしては、2つあります。1つは、「ペアプログラミングによってどのようなメリットがあるのか」。もう一つは、「ペアプログラミングを成功させるためにはどうしたらよいのか」ということです。特に、後者については、ペアプロしたくてもどうやったらよいのか(たとえばどうやってペアプロの相手を探す?)というところで、難しい問題があります。今までの経験を元に、参考になればと思ってエントリを書きます。 まず、ペアプロのメリットですが、僕
はてなブックマーク関連エントリの技術に関しまして、はてなのnaoya さんと弊社のoxy さん・kzk さんの記事がとても詳しいです。僕は、合宿中は他のチームだったので開発には直接携わってはいないのですが、毎日のミーティングで、どのようなデータを使うと精度がどうなったよという成果報告を聞いていたので、2日目と3日目の精度のかわりようは衝撃的でした。タグを使うとよいというのは、非常に興味深いです。まだ精度面でも調整の余地はありますが、ブックマークした人のデータを使うなどよりも圧倒的に精度がよかったので、方向性は正しいのかな。 今回バックエンドで使っているエンジンは、連想検索エンジン のコアエンジンです。連想検索エンジンでは、文章と、それに含まれている単語を元に連想検索を実現しています。これが、ユーザーとブックマークしているエントリ、という対応になってもよいですし、エントリとその中に含まれてい
本日、株式会社はてなさんとの提携を発表しました。 http://preferred.jp/press/20080715.html 提携のきっかけは、先月末に、はてなさんの京都オフィスにお邪魔させていただいて、共同開発合宿を行ったことです。この合宿では、今回発表したはてなブックマークの拡張機能以外にもいろいろディスカッション・開発を行いましたが、はてなブックマークの関連表示機能は、合宿の段階から実用レベルまで持っていくことができたので、今回リリースする運びとなりました。 今回の合宿では、自分が理想としていたアライアンスの形態を実現できたと思っています。はてなさんは、数多くのWebサービスを実現しており、サービスの企画・開発・運営に関してプロフェッショナルです。PFIは、Webサービスの開発自体はできますが、プロフェッショナルというわけではありません。社名にもあるとおり、コンピュータの基盤技術
このページを最初にブックマークしてみませんか?
『本郷ではたらく社長のブログ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く