ひらがなの使用頻度 ― 2007年05月28日 11時18分47秒
新聞記事から抽出すると
エキサイトのコネタで「「あいうえおかきくけこ……」一番使われているひらがなはどれ? | エキサイトニュース」なんてのを見かけた。
ある土曜日の新聞から10の記事を選び、全てひらがなでワープロ入力。という条件でひらがなの文字としての使用頻度を調べたらしい。 で、トップ10が「い、ん、か、し、う、た、と、つ、て、の」らしい。
ご自分の日記から抽出すると
コネタのは手で入力しての計測なのでサンプリング数が適切かわからんけど「なるほど~」と感心するも、似たようなことをしているひとがいるのではと思い検索したところ、「漢直ノート ひらがな1-gram表」というところを見つけた。
こちらは漢直という入力方法の練習日記などを綴っておられるブログのようだが、ご自分の日記など一年分からのサンプリングで集計されていた。その結果から、句読点を覗いた上位10は「い、ん、う、か、し、な、と、た、っ、の」となっていた。
比較したら
こんな感じ。
コネタ | い | ん | か | し | う | た | と | つ | て | の |
漢直ノート | い | ん | う | か | し | な | と | た | つ | の |
ただ、「っ」(促音)と「つ」を合わせると「漢直」側では3位まであがってくるし、コネタ側は「濁点、半濁点は無視」というのがカウントしていないのか清音と同じと見なしてカウントしているのかがあいまいだったりするのが残念だが、まあ元文章の性質の違いやらサンプリング数の違いはあるのでよしとしよう(なにがだ)。
おまけ
漢直ノートさんは他にも
なんてエントリもあげておられるので、興味のある方は参考にしてみてはいかが。ディープパープルで「日米」ってなんだよ。と釣られてみる ― 2007年05月28日 17時26分27秒
エアギター演技用のエレキギター!? : Gizmodo Japan(ギズモード・ジャパン)
ディープ・パープルから長渕剛まで、日米の名曲が収録されてます。これだけコンパクトなら持ち運びに便利なので、ぜひキカイダーに使って欲しいですね。ヒント:ディープ・パープル - Wikipedia
署名付記事でこれかよ...
Apolloが盛り上がってきているが ― 2007年05月28日 22時25分18秒
XULRunnerのときも思ったが「これってHTAじゃね?」という感じがする。たぶん、Ajaxではなく「DHTML」といっていたころ(いまも言うのか)にJ(ava)Scriptにハマっていた人はおんなじようなことを感じてるんじゃなかろうか。
もちろん後発だけあって、セキュリティ周りとか低レベルのアクセスを行う機能とかはまともな設計をしている(と思いたい)だろうけど、実行可能な機能としてApolloでできることは大体HTAでもできるような気がする。もちろんWin限定ってのがアレだもんで、マルチプラットフォームなXULやApolloと比べるのはお門違いなんだけどさ。(あー、なによりSilverlightがあったか)
でもWindowsならわざわざランタイムインストールしなくても動作するってのは大きいと思う。ファイルIOだってDBアクセスだって大体のコンポーネントはOSで持ってるしね。あとは関連ファイルを1つのアーカイブにまとめて実行できる機能でもあればいいなぁ。.zipをmshtaに渡すとアーカイブ中の「main.hta」をキックして、とかね。(Win32リソースとしてexeに埋め込めばmshta.exe res://~ってできるんだけど、Win32アプリをビルドできる環境が必要になるしなぁ)
あと、MSがHTA(というかIE)向けの高度なUIコンポーネント(HTCベースでかまわない)でもOSに入れといてくれれば結構しっかりしたアプリケーションができるんだけど、もはやテコ入れはないだろうなぁ。すこし残念な気もするが。
そんな取りとめもないことを思ったり思わなかったり。
あー、ApolloでDBアクセスって話でてるけど、ひょっとしてASで直接ソケット接続するクライアントを作るってのかな?ODBCサポートでもすればいいのに。
最近のコメント